时光倒回几年前,当我们谈论“人工智能(AI)”时,心里浮现的或是科幻片里神秘难触的智能系统,或是科研论文里晦涩难懂的模型算法;而当我们谈论“机器人”时,想到的则是工厂里那些钢铁巨臂。在很长一段时间里,这两者像是生活在平行宇宙——一个是“缸中之脑”,拥有智慧却没有手脚;一个是“无脑巨人”,拥有力量却没有灵魂。

但现在,这堵墙正在被推倒。计算神经科学的独特视角为“智能与载体”“算法与机械”的深度融合提供了关键思路。


(图片由AI生成)

打破“虚拟大脑”的认知误区

“AI是软的、虚拟的,机器人是硬的、物理的”二元对立观点,长期主导着大众的思维。对此,邓志东表示:“智能不是虚拟的,智能也有物理载体。”

这一命题的合理性,可以从人类智能的生物学本源中得到印证。邓志东指出,人类的智能并非悬浮在空中的“幽灵”,而是严格对应着极其复杂的生物物理实体——大脑。从解剖学角度来看,负责视觉理解、状态预测、逻辑推理、决策规划等高级认知功能的区域是大脑皮层;而负责维持身体平衡、协调运动轨迹、控制肌肉收缩的区域则是小脑。大脑皮层与小脑,无一不是由数以亿计的神经元突触胶质细胞构成的实实在在的物质实体。

“智能的产生,本质上是物理实体在处理信息。”邓志东强调,同样的逻辑完全适用于机器人领域。如果将机器人比作人类的躯体,那么AI就是它的神经系统。机器人本体是AI发挥作用的物理边界,而AI算法则是机器人的神经中枢。没有物理载体,智能就无法与真实世界进行能量与信息的交换;而没有智能,物理载体不过是一堆冰冷的废铁。

这种“脑-体协同”的机制,在计算神经科学的研究中占据核心地位。邓志东进一步解释道,人类在面对现实世界中复杂、动态且信息不完整的场景时,往往不是依靠穷尽所有可能性的逻辑计算,而是依靠“经验”和“记忆”来快速完成决策与动作的生成。比如,一个守门员扑救点球时,他没有时间去计算空气动力学公式,而是大脑皮层与小脑瞬间调用长期训练积累的肌肉记忆,做出的下意识的反应。

对于机器人而言,要实现“100%的任务成功率”,单纯依靠云端的大模型逻辑推理是不够的。它必须像生物一样,建立起属于自己的“技能性持久记忆”。这意味着,未来的AI研究不能脱离硬件空谈算法,必须将深度学习模型植入机器人的人工智能芯片中,让机器人在与物理世界的反复碰撞、交互中,“生长”出智能。这种基于物理载体的智能进化,才是具身智能的发展方向。

深度学习如何赋能工业场景

AI技术,尤其是深度神经网络深度强化学习,正在重构机器人“感知”“决策”“执行”三大核心环节。

邓志东以工业协作机器人为例,描绘了一个典型的应用场景:在高速流转的物流生产线上,机器人需要为不同规格的包装箱贴标签。

在传统自动化时代,这项任务对预设条件的依赖极强。工程师需要编写固定代码,明确箱子必须精准出现在指定X、Y坐标,且光线需保持恒定。可一旦传送带速度波动,或是箱子位置偏移几毫米,传统机器视觉就容易因特征点匹配失败而报错。

“现在的深度神经网络,特别是结合了大模型技术后,给机器人装上了一双慧眼。”邓志东指出。深度学习算法不再依赖人工设计的特征点,而是通过海量数据训练,学会了像人眼一样“理解”图像。

在贴标场景中,AI驱动的视觉系统可以实时捕捉传送带上快速移动的物体。它不仅能“看清”箱子的轮廓,还能“看懂”箱子的姿态——是正放、侧放还是歪斜。通过语义分割技术,机器人能精准识别出箱子表面的文字、图案区域,并推理出标签应该粘贴的最佳空白位置。即便遇到了训练中从未见过的异形包装,或者现场光照条件突然变暗,具备强大泛化能力视觉大模型依然能锁定目标。这种从“像素匹配”到“语义理解”的跨越,是AI赋予机器人最核心的感知变革。

感知只是第一步,更关键的是决策。邓志东特别强调了“深度强化学习”在这一环节的价值。

在复杂的工厂环境中,不确定性无处不在:突然出现的人员、意外掉落的货物、设备自身的震动,等等。传统的决策算法是基于规则的,面对规则之外的突发状况,机器人往往只能选择急停,这会严重影响生产效率。

而深度强化学习允许机器人在虚拟仿真环境中进行数百万次的“试错”训练。通过设定奖励函数(例如:成功贴标得1分,碰撞扣10分,时间最短得5分),机器人会自动探索出最优的控制策略。邓志东举例说,在动态避障环节,经过强化学习训练的机器人,当检测到有人的手臂伸入工作区域时,它不再是简单地停机,而是能瞬间规划并生成一条平滑的绕行轨迹,既避开了障碍物,又不中断贴标动作。这种“自主决策”能力,使得机器人从只会执行命令的机器,进化成为具备一定“生存智慧”的智能体。

政策护航与协作机器人的崛起

执行层面,“工业协作机器人”凭借独特优势成为关注焦点。与传统被关在铁笼子里、体型庞大、动作刚猛的工业机器人不同,协作机器人更聚焦“安全性、柔顺性和交互性”。邓志东介绍,通常这类机器人的额定负载在25kg以内,设计轻巧,末端处配备了高灵敏度的触觉与力传感器

“传统机器人更侧重于机电性能,强调刚度、精度和速度;而协作机器人更聚焦于安全性与智能化水平。”邓志东分析道。它们不需要物理围栏,可以安全地与人类工人肩并肩地工作。一旦在运行中触碰到人体,它们会瞬间感知到力矩的异常变化,并在毫秒级时间内自动停止或回撤,确保人员安全。这种“人机共融”的特性,彻底改变了工业生产的组织形态。

这一技术趋势与我国当前的产业政策高度契合。近年来,国家层面密集出台了多项政策,旨在推动机器人产业的高质量发展。

工信部等十七部门联合印发的《“机器人+”应用行动实施方案》明确提出,要聚焦制造业、农业、医疗等重点领域,推广机器人的深度应用,打造一批“机器人+”应用标杆企业。在此背景下,我国机器人产业正从“规模扩张”转向“质量跃升”。有行业学者认为,“十五五”将是我国迈向机器人强国的关键阶段,产业将进一步朝着智能化、绿色化、融合化方向发展,围绕细分场景需求加速产品创新迭代。

邓志东指出,在标准化的包装、码垛、精密装配等流程中,国产协作机器人已成为“机器换人”的主力军。它们部署更灵活,而且在AI视觉和力控算法的加持下,作业精度和稳定性已达到国际先进水平。

特别是在当前劳动力人口结构变化、制造业招工难的背景下,协作机器人的价值日益凸显。它不是要完全替代人类,而是接管那些重复、枯燥、繁重的劳动,让人类回归到更具创造性的管理与质检岗位上。

算力内嵌与集群化

尽管产业前景广阔,但算力不足仍是制约其进一步智能化的核心瓶颈。

“机器人需要大幅度增加本身的AI算力,才能实现复杂环境下的实时响应。”邓志东强调。目前,很多复杂的视觉大模型还需要依赖云端服务器进行处理,但这会带来不可避免的网络延迟。对于要求毫秒级响应的运动控制而言,这种延迟往往是致命的。因此,未来的趋势必然是高算力推断芯片的植入,把“超级大脑”装进机器人的身体里,实现真正的“端侧智能”。

展望未来5到10年,邓志东预判,工业场景将朝着集群化方向深度发展。在汽车制造等高端产线,机器人将不再是单打独斗,而是通过端云协同实现“集群化作业”,通过实时共享感知数据,协同完成复杂的装配任务。

家庭场景则将聚焦小型化与自主化升级。未来的家用机器人将具备更强的自主移动与操作能力。它们将不再局限于扫地,而是“一机多用”,能够完成叠衣服、收拾玩具等需要复杂机械手操作的家务,成为不可或缺的智能伙伴。

针对想进入该领域的青少年和年轻从业者,邓志东建议:“人工智能特别重要。就拿我们人类来说,少了大脑还能做什么?”他同时提醒,机器人是软硬结合的产物,光有算法不够。要打破学科壁垒,“学习机械结构设计”,掌握物理世界的运动规律

算力内嵌、场景深耕、人机共融,AI与机器人的融合之路正越走越宽。依托计算神经科学的底层支撑,我们也期待着未来的智能机器人能够更懂世界、更贴需求,勾勒出科技服务于人的鲜活图景。

来源:北京科技报

采访专家:邓志东(清华大学计算机科学与技术系教授、人工智能研究院视觉智能研究中心主任)

撰文:记者 段大卫

来源: 北京科技报