作为第四次工业革命的核心驱动,AI的发展正处在技术加速突破、应用全面落地的重要拐点,中移互联网依托昇腾算力底座,以“产品创新”和“算力优化”为双轮驱动,打造“AI+”时代的“新齿轮”和“新杠杆”,全面加速ToC业务数字化转型,革新用户服务体验。
中移互联网与华为深化AI战略协同,基于应用+网络+算力的融合优势,深度结合昇腾算力底座构建高性能智算能力,驱动大模型与用户级智能体相结合规模化落地,打造了移动云盘、5G新通话、5G消息等数智化转型新业务,业务+AI极大提升用户服务体验。
自2025年初上线以来,基于千卡规模的昇腾算力资源池,AI服务已覆盖近4000万用户。中移互联网联合华为,在通话质检,通话智能体,新通话内容总结等业务方面率先创新使用大规模专家并行(大EP)集群技术,相比常规服务器堆叠方案,实现单卡吞吐达到4倍,Decode时延降低50%。
产品创新:个人知识库破解云盘信息沉睡
传统网盘服务用户常遭遇存储资料“沉睡”的困扰:文档、笔记、图片等信息散乱堆积,缺乏有效关联与理解。手动整理耗时费力财惠赚,查找信息如同大海捞针。
针对这些问题,移动云盘团队结合核心能力,依托海量数据(603138)、丰富场景优势,深度融合DeepSeek、Qwen等大模型与昇腾算力,推出“个人知识库”业务,支持用户导入各类文档、笔记、图片等资料。用户能精准检索个人信息,结合大模型快速生成各种文案,可实现符合个人情况的AI回答,给出各种生活习惯建议。数据仅服务于私人助手,隐私有保障。5月正式上线以来,积累知识库文件已达千万级
。
产品创新:零门槛AI速记重构通话价值
传统语音通话场景常面临信息记录低效、环境干扰、检索困难等挑战财惠赚,在遇到客户沟通需求、领导布置任务等场合,很容易出现信息遗漏问题。
中移互联网基于5G新通话强大的内容处理能力,基于昇腾算力搭载语音识别、语义理解、大模型等人工智能技术,推出AI速记应用等功能,无需下载APP即可快捷使用。
“AI速记”功能可将通话内容实时转写成文字,智能生成内容摘要和要点待办,以短信形式通知给用户,帮助用户快速回顾和高效整理通话信息。业务自上线以来,累计订购用户达240万,活跃用户近百万。
“同声传译”功能,在普通语音电话中实现中英文实时互译。用户无需额外设备,通话中按键即可启动秒级双向传译服务,如同配备“隐形翻译官”。该功能已在2025年天津达沃斯论坛等重要国际会议中,为数百位外国来宾提供了高效通讯支持。
算力优化:夯实技术底座
中移互联网服务数千万级别的客户,在基础AI算力也面临了突出的挑战:
首先是吞吐,客户规模快速增长,单卡吞吐已较难满足业务需求。其次是时延,大规模并发的访问下,动辄十秒或以上的内容生成时间让对话变得卡顿,降低了用户的体验。再次是上下文的限制,当前AI的记忆主要依赖上下文窗口,一旦文档或者对话稍长,AI就容易出现遗漏信息的现象。
针对以上三个痛点,中移互联网与移动云合作部署了多个昇腾大EP+PD分离解决方案。
大EP方案是针对当前主流MoE模型,把模型权重分布到更多的卡上,通过降低单卡内存权重占用,释放更多内存,最终实现更大的单卡吞吐能力;相比常规服务器堆叠,大EP方案实现了4倍的单卡吞吐,将Decode时延从100ms降至50ms,在相同卡数下获得更大的收益,实现“一份投入,多份输出”。同时,大EP方案支持128K超长序列,可满足超长文本处理需求。
PD分离部署,即将推理的两个阶段Prefill和Decode部署到不同的服务器上,分别作为P实例和D实例,并通过高速互联网络传输KV缓存等中间数据,在不同的服务器上同时进行预填充和解码。相当于开会时让“准备”和“发言”同步进行,极大地降低了时延,提高了资源利用率。
通过产品创新与算力优化财惠赚,中移互联网为海量用户应用体验带来突破性升级,拓展AI服务边界,实现智能服务全场景渗透,为传统通信服务赋予了智能交互、场景理解等新能力与新价值。面向未来,中移互联网将持续携手华为,基于昇腾算力底座推动AI+产品的规模落地,加快向智能信息服务转型。围绕个人业务+AI持续提升推理性能,降低部署成本,提供更智能、更高效、更好用的信息服务,为数智化转型新征程注入强劲动力。
天金策略提示:文章来自网络,不代表本站观点。