“您用DeepSeek吗?”“DeepSeek这样的中国大模型能摆脱算力‘卡脖子’难题吗?”“如何进一步规范大模型应用?”在今年的全国两会上,DeepSeek火爆出圈。
今年的政府工作报告提出,持续推动“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广泛应用,大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备。可以说,人工智能大模型已经成为驱动经济和社会创新的强大引擎。
然而,这一行业的快速发展并非坦途。算力成本不断攀升、模型的可解释性与可信度不足、数据泄露、数据污染与投毒等都对人工智能产业发展提出前所未有的挑战。这些议题也引起了代表委员们的广泛热议。
推动技术与工业场景高度适配
工业和信息化部赛迪研究院的数据显示,2023年,中国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元;制造业、零售业、电信行业和医疗健康等四大行业的生成式人工智能技术采用率均取得较快增长。
然而,尽管人工智能大模型在各行各业中展现强大动力,其在深度应用中却面临诸多挑战。
“传统制造业对人工智能的可靠性、安全性、准确性有较高要求,人工智能大模型在可解释性与安全性方面还有待提高。”中国中车股份有限公司(以下简称“中国中车”首席科学家冯江华委员说。
作为中国轨道交通装备的领军企业,近年来,中国中车持续推动数智转型,使得研发制造迈上了新台阶。
“为了更好地提高作业效率,提升运维质量,我们在轨道交通智能运维场景下应用了一款基于视觉的列车巡检机器人。”冯江华说。不过,现有视觉算法对复杂工况的适应性不足,这造成机器人的检测准确率仅维持在95%—99%。冯江华表示,因为涉及列车运行安全,目前在关键部件检测环节仍然保留人工介入机制。
“制造业细分领域较广,具有复杂的工艺流程和生产流程,以及较强的专业性。这要求大模型必须首先完成垂直类别的训练,实现与应用场景的紧密融合。”中国科学院自动化研究所研究员赵晓光委员认为,进一步推动人工智能大模型在制造业领域中的应用,首要任务是实现技术与工业场景的高度适配。
在冯江华看来,构建自主的技术生态是促进人工智能与装备制造深度融合的关键。他认为,一方面,要持续推进国产基础大模型、自主算力集群及具身智能机器人等核心技术发展;另一方面,要依托龙头企业建设垂直行业大模型及智能工厂、数字孪生等全场景应用,推动基础大模型与行业需求双向赋能,形成技术迭代与场景拓展的闭环生态。
搭建行业数据共享平台
目前,我国国产大模型数量已超200个,覆盖广泛行业领域,应用场景持续拓展。国家互联网信息办公室的最新数据显示,截至去年3月,我国已有117个生成式人工智能服务完成备案。
数据是大模型的重要“食材”。制造业的各个环节会产生多种类型的数据,包括研发数据、设备运行数据、生产制造数据、售后维护数据、质量检测数据等。“但由于数据分布在不同的系统和设备中,导致行业大模型推广困难,难以部署。”冯江华说。民革广东省委会副主委、佛山市政协副主席唐冬生委员也表示,制造业的数据来源多样、数据标准化程度低,导致大量优质工业数据无法有效流通和利用,正在制约制造业垂直类大模型的发展。
“AI赋能数智化,还需要解决数据数量和质量问题。”赵晓光说,要在制造业场景中积累高质量数据,并不断优化大模型技术,让人工智能赋能产业转型升级。
冯江华还建议,要构建数据安全管理体系,从技术、制度、人员等多方面保障数据安全,消除企业数据隐私顾虑。
“搭建行业数据共享平台也很重要。”冯江华说,要鼓励企业打通内部数据链路,提升运营效率,引导上下游企业安全共享数据,为行业大模型提供数据支持。
事实上,围绕人工智能大模型的应用瓶颈,国家已经陆续采取行动。例如,3月1日,国家公共数据资源登记平台正式上线运行。开放登记首日,已有医保、气象、自然资源等多类国家级公共数据上线。北京、天津、内蒙古、辽宁、上海、广东等地依托国家平台也开展了登记工作。这一系列举措意味着我国数据要素市场化配置改革迈出了重要一步。
张紫祎