DeepSeek(深度求索成为继ChatGPT之后的又一现象级AI产品。据国内AI产品榜统计数据,DeepSeek应用在上线仅20天后,其日活跃用户数(DAU迅速突破2000万大关,达2215万。
DeepSeek不仅让中国生成式人工智能技术进入全球视野,同时也直接激活了整个人工智能产业链,无论是云服务厂商、芯片公司,还是下游应用层,均纷纷进行部署和适配。业内预期接下来一年有望成为AI应用爆发的黄金期。咨询机构Omdia预计,未来五年中国生成式AI的市场规模将增长5.5倍,到2029年将达到98亿美元。
云厂商纷纷部署
国内主要云厂商天翼云、移动云、联通云、华为云、京东云、阿里云、百度智能云等纷纷接入DeepSeek大模型,国际云厂商微软云和亚马逊云科技也早在春节前就上线了DeepSeek。
中国电信表示,旗下天翼云自主研发的“息壤”智算平台率先完成国产算力与DeepSeek-R1/V3系列大模型的深度适配优化,成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。
中国移动旗下移动云选择深度集成DeepSeek模型,并搭载自研的COCA算力原生平台,实现“开箱即用”的便捷性。同时,移动云为DeepSeek-R1模型定制算力方案,为互联网企业和高校科研提供高性价比的算力与开发环境。
中国联通则宣布联通云已基于“星罗”平台实现国产及主流算力适配多规格DeepSeek-R1模型,兼顾私有化和公有化场景,实现多产品场景调用。
DeepSeek是开源模型,开源范式下技术创新进步和应用推广的速度大大加快。云厂商纷纷上线DeepSeek,可以基于各自平台的底层能力,提供与DeepSeek-R1及DeepSeek-V3相适配的服务,简化开发流程,更好地满足用户需求。
2月3日,百度智能云千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,除了推出超低价格方案,还提供限时免费服务。
同日,阿里云也官宣PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。阿里云表示,该平台上的用户可以零代码实现从训练到部署再到推理的全过程,简化模型开发流程,为开发者和企业用户带来更快、更高效、更便捷的AI开发和应用体验。
2月4日,京东云宣布,已正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。
随着越来越多云厂商接入,模型调用价格下降,围绕大模型应用的生态有望进一步普及和成熟,AI应用全面落地可期。
芯片层加速创新
作为云厂商上游的芯片公司也行动了起来。GPU是AI大模型训练推理所需的核心器件,目前国内多家GPU公司正在或已完成对DeepSeek的适配。
燧原科技表示,已完成对DeepSeek全量模型的高效适配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸馏模型。整个适配进程中,燧原AI加速卡的计算能力得到充分利用,能够快速处理海量数据,同时其稳定性为模型的持续优化和大规模部署提供了坚实的基础。
燧原科技介绍,目前,DeepSeek的全量模型已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署,将为客户及合作伙伴提供高性能计算资源,提升模型推理效率,同时降低使用门槛,大幅节省硬件成本。
壁仞科技表示,基于自主研发的壁砺TM系列产品出色的兼容性能,公司仅用数小时即完成对DeepSeek R1全系列蒸馏模型的支持,涵盖了从1.5B到70B各等级参数版本,包括LLaMA蒸馏模型和千问蒸馏模型,为开发者提供高性能、低成本的大模型部署与开发解决方案。
摩尔线程表示,公司拟基于自研全功能GPU,通过开源与自研双引擎方案,快速实现了对DeepSeek蒸馏模型的推理服务部署,为用户和社区提供高质量服务。为推进国产AI生态发展,摩尔线程即将开放自主设计的夸娥(KUAEGPU智算集群,全面支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。
业内普遍认为,凭借其开放性、高效性和易用性,DeepSeek开源模型正在成为推动AI技术普惠化的重要力量,接下来的一年有望成为AI应用爆发的黄金期,对大模型训练和推理成本持续下降的预期也会越来越高,作为支撑的算力设施如何进一步提高能效、升级服务,产业界拭目以待。
未来五年AI市场规模将大增
DeepSeek的热度也席卷AI应用层。2月7日,钉钉宣布,钉钉AI助理已全面接入DeepSeek系列模型,用户可自主选择DeepSeek系列的R1(671B满血版及qwen32B蒸馏版、V3(671B满血版共3种模型。同时,钉钉还发布了全新模板,帮助用户一键创建、发布基于DeepSeek模型的AI助理,无需额外配置。
联想当日也宣布个人智能体“小天”已接入DeepSeek。以联想YOGA Air 15 Aura AI元启版为例,用户可以一键唤醒个人智能体联想小天,在AI Space中点击DeepSeek即可使用,体验其在自然语言处理(NLP、代码生成与编程、数学推理及多模态处理等领域的尖端能力。联想还表示,正在与DeepSeek探讨更多深入合作可能性。
Omdia人工智能与物联网领域首席分析师苏廉节认为,DeepSeek所引发的杰文斯悖论将让大模型更加普及,导致需求增加。
杰文斯悖论是上个世纪中期提出的一个经济学概念,其核心思想是,当一种资源的使用效率得到提升时,其成本通常会下降,这反而会刺激更多需求的产生,最终导致该资源的总使用量增加。在AI领域,随着AI成本的下降,可能刺激更多企业、机构部署大模型,加速AI向全行业、日常化普及。
Omdia预计,经过两年快速发展,2024年中国的生成式AI软件收入已达到18亿美元。鉴于该技术仍处于起步阶段,预计未来五年的市场规模将增长5.5倍,到2029年达到98亿美元。更重要的是,这一收入还不包括其他关键生成式人工智能技术,如人工智能训练和推理芯片和服务器、人工智能数据中心建设和场地购置成本,以及生成式人工智能开发平台收入。