今天分享的主题是把握 AI 大模型引发的时代机遇,主要包括以下内容:第一,什么是 AI 大模型的本质?演进路线是什么?第二,为什么当今被称为“智能时代”?第三,如何把握这一百年难遇的机会?
AI 大模型发展的政策背景与行业趋势
4月25日,中共中央政治局就加强人工智能发展和监管进行集体学习,提出充分发挥新型举国体制优势、坚持自立自强、突出应用导向、健康有序发展等关键词。
2025年的两会报告中,大模型首次被写入,同时涉及优化全国算力资源布局、发展新一代智能终端、低空经济、生物制造、具身智能、平台经济以及重视青年科技人才等内容,均围绕数字经济发展,凸显应用导向。
美国方舟基金创始人凯瑟利·伍德发布的“2025 大胆设想”,与我国两会报告在 AI Agent、无人驾驶出租车、低空经济等方面存在高度共识。美国这一报告预测全球 GDP 增长将因新兴产业发展显著提升,人工智能将在其中占据主导地位。
AI 大模型的发展历程与技术演进
从 AI 的起源来看,1950 年图灵提出图灵测试,1956 年人工智能学科诞生。早期受技术限制,基于规则的专家系统因难以实现标准化规则而受限;随后从棋类游戏方向突破,基于概率统计的机器学习取得一定成果,但在围棋领域遭遇瓶颈。
1. 深度学习与 AlphaGo:2013 年,基于神经网络的深度学习诞生,其将 GPU 计算特征与神经网络结合,造就了 AlphaGo 战胜世界冠军李世石的壮举。然而,AlphaGo 仅为专属模型,只能下围棋,应用局限性导致其逐渐淡出人们视野。
2. Transformer 架构与通用模型:2017 年,谷歌发布 Transformer 底层架构,通过预训练大量无标注数据,使模型具备通用性,能够适配多种任务。这一架构成为 ChatGPT 等众多 AI 模型的基础,开启了生成式 AI 阶段,使 AI 具备推理和判断能力,推动 AI 发展进入新阶段。
AI 大模型的定义与核心
1. 知识获取新范式:AI 大模型是人类获取知识的新范式,其地位与文字、互联网相当。过去,人类通过书籍、互联网获取知识,如今知识体系被训练到大模型中,人们通过与模型交互获取答案,如 ChatGPT 能回答各种问题、进行创意写作、编程等,改变了知识获取和应用的方式。
2. ChatGPT 的引领作用:ChatGPT 作为 AI 大模型的首个现象级产品,将 GPT 模型与 chat 交互环境结合,“G” 代表生成式,“P” 代表预训练,基于 Transformer 算法,展现出强大的功能。它的出现标志着 AI 大模型能力的充分发挥,促使 AI 搜索逐渐抢占传统搜索市场份额,如谷歌搜索流量增长遇阻,而微软将 ChatGPT 与搜索引擎结合后实现增长。
AI 大模型的特性与广泛应用
在软件领域,AI 大模型将重构软件系统,使软件具备 AI 能力,如 WPS、钉钉、飞书等软件纷纷融入 AI 功能;硬件方面,驱动自动驾驶汽车、智能工厂机械臂等发展;数据层面,激活数据价值,使其成为重要生产要素。
在实际应用中,AI 大模型已渗透到奥运转播(如实现快速图像实时处理和 3D 渲染)、电商(助力商品推荐、营销、客服等)、医疗(多癌早筛、加速药物研发)、生产制造(智能决策、优化生产流程)等众多领域,提升各行业效率与创新能力。
AI 大模型的技术本质与演进逻辑
AI 大模型是人类社会第 25 种通用技术。回顾前面 24 种通用技术,包括铁路、内燃机、电力、计算机、互联网等,会发现每一种通用技术都推动了时代的变革。计算机推动了计算革命,互联网推动了互联网革命,电力引发了电气革命,内燃机促进了工业革命。这些通用技术具有四个重要特征:其一,在多个领域广泛使用,区别于仅解决单一问题的专用技术;其二,能够与其他技术互补,并非独立存在;其三,具备降本增效功能,降低门槛、减少成本并提高生产效率,带来颠覆性的生产力提升;其四,会对组织方式产生变革性影响 。
各类通用目的技术达到临界应用水平(即一半以上的人都在使用该技术)所需时间各不相同。电用了 37 年,起初电的持续使用成本很高,例如铺设电线点亮灯泡,一天可能需要一到两美金,而同样能在夜间照明的蜡烛成本更低,因此电实现临界应用水平需满足两个关键点:**技术好用且足够便宜,实现普惠。**当用电成本远低于蜡烛时,电不仅用于点灯,还被应用于电冰箱、面包机等,从而实现普及。个人电脑达到临界应用水平用了 23 年,智能手机用了 21 年,互联网用了 17 年,而 GPT 仅用了十个月。这充分说明 GPT 好用且价格亲民,大幅提升了生产力。
**AI 大模型的通用性遵循规模定律,即模型的参数越大,预训练数据集越多,模型的性能越好。**参数可理解为模型学到的知识,这些知识通过数据表征,以向量的方式呈现每个知识点。例如人的身高、体重、性别、头发颜色等特征,通过数字计算实现关联权重。以 “浙江省科普联合会” 为例,“科” 与 “普” 的组合,以及 “科普” 与 “联合会” 的组合,都存在关联度和权重,这就是参数的体现。从数学角度看,参数就类似函数中用于更好匹配输入与输出信息的系数,参数越多,准确度越高。
此外,AI 大模型本身是深度神经网络的模型架构,从生物理论来讲,大脑皮层的神经元数量与通用水平成正比。人类拥有 900 亿个神经元,属于通用型大脑;狗有 22 亿个神经元,是专用性大脑,狗出生一年后,肌肉发达、嗅觉灵敏,到三、四、五岁基本能力无明显增加,因其神经元决定了它只能做专属任务;而人类一岁时还只能爬,但后续能学会说话、走路、学习各种知识,正是 900 亿神经元赋予了人类通用性,使人多才多艺、有记忆力、具备推理能力,由此也能更好地理解 AI 大模型的参数与规模定律。
AI 大模型有两个核心魔力。****
**第一个是涌现性。**随着模型参数数量达到一定规模,模型在各项能力上会出现迅猛提升,从线性增长转变为指数级增长。例如孩子学习数学,做 100 道题可能仍无明显进步,但做到 1100~1200 道题时,突然开窍,所有题目都会做,这便是量变到质变的过程。在 AI 大模型中,无论是文字理解、修饰手法运用、数学逻辑推导还是国际音标撰写等方面,都会出现这种涌现现象,再次印证了规模定律,即模型参数规模越大,训练数据集规模越大,模型性能越好。
第二个魔力是泛化性,即模型的学习能力,它能够对从未见过的数据进行良好处理,且表现专业。
模型的发展演进经历了不同阶段。最初是 “一事一模” 阶段,通过简单的专属模型实现机器翻译、语音转录、人脸识别、指纹识别等单一任务,每个模型只能完成特定一件事,若要解决其他问题,需重新寻找模型并训练数据。
后来进入 “多事一模” 阶段,尝试将人脸识别、猪脸识别、狗脸识别等任务整合到一个模型中,该模型具备跨领域知识,能够完成多个不同任务。在这个过程中,专属模型精度高,参数增加后会获得泛化能力,但精度有所下降。为解决这一问题,需不断加大参数和数据集规模,使模型兼具泛化性和高精度。
最终目标是实现 “万事一模”,即一个模型能解决人类认知中的所有任务,此时模型具备推理能力、多模态融合能力以及规划和执行能力,真正实现通用人工智能。事实上,AI 大模型正逐步接近人类专家水平,2017 年达到基础阅读理解能力,2021 年具备视觉推理能力,2023 年拥有多元认知能力,到 2025 年,已能够解决复杂推理问题,比如完成奥数题目。
中美 AI 大模型竞争格局与中国产业生态
1. 中美竞争态势:在大模型赛道,中美呈现不同竞争格局。语言大模型方面,中国从追赶逐步发展;推理模型中,中国与美国并驾齐驱,如中国的 R1 推理模型与 OpenAI 的相关模型不分上下;多模态模型领域,中国因注重业务场景应用,处于领跑地位。
2. 中国产业生态优势:中国 AI 大模型产业图谱涵盖应用端和基础设施端。基础设施端包括硬件、数据治理、模型和工具层,培育出众多龙头和独角兽企业;应用端广泛涉及办公、营销、创意等领域。以杭州为例,其 AI 企业成功得益于开源开放生态,包括政策支持、资本投入、人才培养、良好营商环境,以及产学园融合和丰富的数字化场景应用,为 AI 发展提供了肥沃土壤。
以杭州为例,其成功发展 AI 产业得益于开源开放的生态,包括政策支持、资本投入、人才培养和良好的营商环境,以及产学研融合和丰富的数字化场景应用。科技创新不能躺平,企业需不断创新,如特斯拉的端到端大模型取代传统规则系统,以及具生智能模型提升产品附加值,体现了技术创新和赋能的重要性。个人也应拥抱 AI,用好 AI 工具包,提升自身 AI 素养,积极融入智能时代。
把握 AI 时代机遇的关键举措
1. 科技创新的重要性:科技创新没有绝对的护城河,企业需持续创新。如特斯拉采用端到端大模型改进自动驾驶技术,摒弃传统规则系统;企业通过将 AI 大模型与产品结合实现技术赋能,如扫地机结合 AI 大模型后,售价大幅提升且节省人工成本,展现出科技创新带来的巨大竞争力。
2. 个人与时代的共成长:身处智能时代,个人应积极拥抱 AI,使用 AI 工具包提升自身 AI 素养。随着模型迭代和工具优化,个人需不断学习适应。
最后引用我们马老师的一段话作结:“电刚刚发明的时候,唯一的电器就是电灯,人类根本想象不出电有啥用,然而由于电的发明,世界出现了许多新的东西。那么今天的 AI 与早年的电其实是相差不多的,而且今天 AI 带来的改变,会远超过电的时代,远超过大家的想象。”
本文作者:汪源,阿里研究院秘书长
本文根据浙江省科普联合会周四夜学内容整理
来源: 科小二