腾讯发布自研最强推理模型混元T1正式版

pepsi 新闻 10

腾讯发布自研最强推理模型混元T1正式版-第1张图片-芙蓉之城

3月22日,腾讯正式发布了自主研发的深度思考模型——混元T1正式版。作为腾讯自研的最强推理模型,混元T1在性能和功能上都表现出色。

据介绍,混元T1不仅具备快速响应的能力,能够秒回用户问题,还特别擅长处理超长文本。通过大规模强化学习以及针对数学、逻辑推理、科学和编程等领域的专项优化,该模型的推理能力得到了进一步提升。

在常见的推理模型基础能力评估基准测试中,例如大语言模型评估增强数据集MMLU-PRO中,混元T1取得了87.2分的好成绩,排名仅次于另一知名模型o1。同时,在CEval、AIME、Zebra Logic等涵盖中英文知识和竞赛级数学、逻辑推理的公开基准测试中,混元T1的表现也达到了业界领先水平。

此外,混元T1在多项任务中展现了极高的适应性,包括对齐任务、指令跟随任务和工具利用任务等。混元T1正式版继承了混元Turbo S的创新架构,采用了Hybrid-Mamba-Transformer融合模式。这种架构首次在工业界实现了将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度和KV-Cache的内存占用,从而大幅减少了训练和推理的成本。

凭借出色的长文捕捉能力,混元T1能够有效解决长文本推理过程中常见的上下文丢失和长距离信息依赖问题。混合Mamba架构针对长序列处理进行了专门优化,通过高效的计算方式,在保证长文本信息捕捉能力的同时显著降低资源消耗。在参数激活量相近的情况下,该架构使解码速度提升了两倍。

目前,腾讯已开放混元T1的体验,并上线了相关API服务。其收费标准为:输入每百万tokens 1元,输出每百万tokens 4元。

标签: 新闻资讯

抱歉,评论功能暂时关闭!