阿里云开源Qwen3系列模型

pepsi 新闻 2025-04-30 4

阿里云开源Qwen3系列模型-第1张图片-芙蓉之城

阿里云于近日正式开源了Qwen3系列模型，其参数量仅为DeepSeek-R1的三分之一，显著降低了使用成本。同日晚间，国家级算力服务平台——超算互联网宣布迅速上线了Qwen3系列的全部模型。

此次上线的Qwen3系列包含六个Dense模型版本，分别为Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B，同时推出两款MoE模型：Qwen3-235B-A22B（总参数超过2350亿，激活参数达220多亿）和Qwen3-30B-A3B（总参数为300亿，激活参数为30亿）。

该系列模型基于Apache 2.0协议开源，开发者与企业用户均可通过超算互联网平台下载模型文件，实现快速开发与部署。

平台还表示，正在筹备上线Qwen3系列的模型镜像及应用体验服务，届时用户无需配置环境即可零代码体验Qwen3的对话系统，享受云端开箱即用的便捷操作。

在性能方面，Qwen3-235B-A22B在编码、数学及通用能力等基准测试中展现出强劲实力，可媲美当前多款主流大模型。而小型MoE模型Qwen3-30B-A3B也展现出明显优势，在激活参数数量上超过QwQ-32B十倍之多；即便是Qwen3-4B这一轻量级模型，其性能也可与Qwen2.5-72B-Instruct相匹敌。

标签：新闻资讯

本文地址： http://huotuhuo.com/post/89567.html

版权声明：除非特别标注，否则均为本站原创文章，转载时请以链接形式注明文章出处。

上一篇Firefox 138.0 更新：隐私管理与多平台优化

下一篇京沪高铁一季度营收净利双增

抱歉，评论功能暂时关闭!