中兴通讯“星云研发大模型”亮相,助力开发者提升研发效率和质量

2023年10月13日 由 neo 发表 566 0

中兴通讯在中国移动全球合作伙伴大会上展示了自主研发的“星云研发大模型”,该模型可以帮助开发人员完成需求分析、产品设计、编程、测试、版本部署等全流程任务。

QQ截图20231013104945

“星云研发大模型”具有安全可控的特点,支持白名单机制、代码特征值识别、敏感词识别和后台审计等功能,有效防止敏感信息泄露和安全风险。中兴通讯表示,自2023年4月启用该模型以来,日活人数已达1.2万人,代码采纳率达40%~45%,编码提效30%,整体研发提效10%。

据报道,中兴通讯将大量高质量的领域数据、Know-How知识积累、数十万篇通信领域技术文档和1000亿token的无线/核心网/云代码语料等注入大模型,进行增量预训练,并使用并行训练框架。中兴通讯还自研了部署方案,使用动态batch策略、PagedAttention技术和无损模型量化技术,大幅提升了吞吐量和显存使用效率。中兴通讯称,该方案在单GPU(A800)上达到1500tokens/s的吞吐量,仅需4张GPU卡(A800)就可以满足超千人的使用需求。与业界常规的部署方案相比,单GPU吞吐量分别提升了10+倍和20+倍;同时,在不降低模型精度的情况下,使用int4量化技术将模型大小和显存使用量都减少了一半。

“星云研发大模型”是中兴通讯面向未来网络智能化的重要创新成果。它将有效助力开发者提升研发效率和质量,降低研发成本和风险。中兴通讯将持续投入更多创新资源,与全球客户和合作伙伴一起,推动通信网络向高度智能化的方向发展。

文章来源:https://www.ithome.com/0/724/506.htm
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消