大模型产业的发展离不开“三力”:AI大模型的能力正在日新月异地迭代,算力始终是大模型的一条生命线,产品力则成为市场竞争的新焦点。大模型产业如何围绕这“三力”作答,如何开创新局面?日前,上海证券报记者采访了腾讯、阿里、稀宇科技MiniMax等国内头部大模型公司相关人士。
大模型能力如何演进?
业内认为,大模型发展有三条路:一是使用更多数据和算力,让模型具有更大参数;二是多模态,即大模型可以理解和生成文字、图像、音频、视频等多模态内容;三是增添复杂推理和逻辑自我纠正功能,提升准确性。
“这三条路径并不冲突,可以同时选择。大模型厂商仍朝着这三个方向进行投入。大模型每季度都有较大的版本更新。”阿里云智能科技研究中心主任安琳说。
参数量大是大模型最突出、最早为人所关注的特点。近两年来,规模扩张是大模型企业迭代的主要路径。主流大模型的参数从百亿级逐渐迭代至数千亿,甚至万亿规模。然而,扩大参数量的瓶颈已开始显现。国内外权威专家和组织已经有大量报告表示,Scaling Law(缩放定律开始显示出边际效益递减的现象。这意味着单纯增加计算资源、提高参数规模或数据量不再能如以往那样显著提升模型性能。
在多模态和全模态方面,文生图、文生3D和文生视频等各种模态的模型层出不穷。2024年,腾讯在文生图领域推出首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。
时至今日,OpenAI迟迟未推出参数量巨大的GPT-5,而是开辟了o1、o3模型系列,聚焦“深度思考”。这些模型可以“思考”(推理更长的时间来获得更可靠的响应,在数据科学、编程等领域有更佳表现。
从大模型能力来看,AGI(通用人工智能代表了业内对于高度智能、通用的追求。“AI不仅能理解世界,而且能创造出全新的文字、图像甚至是视频等内容。这对于以知识为生产力的新型生产关系来说,无疑提供了一种变革性的动力。”腾讯混元大模型的负责人说。
如何破解算力紧缺难题?
算力相当于大模型的生命线。在全球算力供不应求的背景下,如何让算力够用?专家认为,这并不意味着无限的GPU。大模型的架构、训练平台、算力网络……各环节的创新与迭代,均可以有效提升算力利用效率,降低算力成本。
MoE(混合专家架构体系已成为主流大模型采用的技术架构,其优势在于在模型研发成本、训练与推理效率、整体性能之间实现最佳平衡。MiniMax、腾讯等均在国内率先采用MoE架构。
MiniMax副总裁刘华介绍,MoE为大模型提供了一条降低算力消耗的路径。在这一架构下,大模型的上万亿参数被分成了若干“专家模型”。在处理任务的时候,大模型只调用相关“专家模型”,减少了不必要的计算。
采用线性注意力机制也是提高计算效率的一种方式。2025年1月中旬,MiniMax发布并开源了MiniMax-01全新系列模型,能够高效处理全球最长400万token的上下文,综合性能比肩海外顶尖模型。
腾讯混元大模型负责人强调,大模型是一个集合了应用、算法、平台、算力的系统工程,全链路自研的能力是竞争的关键。腾讯目前拥有万卡规模的算力集群,并且自研了星脉算力网络,具备业界最高的3.2T通信带宽,通信性能提升30%,成本下降70%。
随着AI应用在全社会的普及,模型应用过程中所需的算力可能将超过模型训练所需,云计算是高效利用社会算力资源的最佳途径。
“云计算与大模型的关系可以说是一枚硬币的两面。”安琳表示,AI计算有两个典型特征:一是AI大规模计算的特性,需要几万张GPU协同工作,与云计算的本质相契合;二是AI算力价格高,通过云计算共享算力可以有效提高算力利用率,降低算力成本。
产品力如何出圈?
字节跳动的豆包、腾讯元宝、阿里夸克、MiniMax的Talkie、月之暗面的Kimi……或包罗万象,或小而精美,面向普通用户的App是大模型公司绕不开的选项。
中信建投证券根据AI产品榜数据统计,2024年12月全球前20的AI产品App端月活合计近8亿,同比增长7.35%;国内前20的AI产品App端月活合计达到1.66亿,同比增长17.65%。
夸克业务负责人表示,大模型从“写诗作画”走向“解决问题”,在这个过程中,AI能力不仅仅存在于某一个场景和功能里,而是要打造“一站式AI服务”和“系统级全场景AI”能力。“我们希望装上夸克就能让用户的电脑立马升级成AI电脑。用户能用最自然的交互方式享受到高效的信息服务,告别过去在各软件应用间反复切换的体验。”
此外,互联网大厂本身拥有丰富的数字生活场景。AI大模型在这些场景中落地,有效升级了这些场景的体验。据腾讯混元大模型负责人介绍,腾讯已在超过700个业务场景中接入了混元大模型,服务了数以亿计的用户。
例如,微信读书基于腾讯混元大模型推出了“AI问书”“AI大纲”等新功能。用户在看电子书时,遇到不懂的名词和概念,如果复制到搜索引擎中去寻找答案,注意力会被分散。AI问书让用户可以直接“划词提问”,由内嵌在微信读书的混元大模型提供解答。
与通用性AI工具不同的是,“AI问书”回答的内容是基于多本电子书的数据源,用户还可以跳转到其他相关电子书的对应段落。AI回答的内容将多本电子书关联在一起后,用户可以按主题阅读,体系化地进行研究,在学术领域非常有用。
王擎宇