2025年,当智能网联汽车开始驶入城市的“毛细血管”,“驾驶权”交接的问题正摆在人类面前。如果说新能源解决了汽车的“动力”来源,实现了能源结构的绿色转型;那么人工智能(AI)则试图解决汽车的“灵魂”归属,旨在重塑人类与交通工具的交互关系。

(图片由AI生成)
在全球科技竞争的棋局中,自动驾驶已成兵家必争之地。从美国谷歌的Waymo、特斯拉,到中国的百度Apollo、小马智行……全球科技巨头都在这条赛道上竞相角逐。而在国家战略层面,国家发展改革委、工信部等11部门联合印发的《智能汽车创新发展战略》明确提出,要构建协同开放的智能汽车技术创新体系。工信部等五部委联合开展智能网联汽车“车路云一体化”应用试点,更是标志着中国自动驾驶正从单车智能向网联协同的深水区迈进。
在这一背景下,我们该如何理解自动驾驶的底层逻辑?AI究竟是辅助驾驶员的工具,还是未来的驾驶主体?面对“黑箱”决策带来的信任危机,我们又该如何破局?
“可以说,没有AI,就没有自动驾驶。”邓志东说。在他看来,自动驾驶汽车并非简单的交通工具升级,而是一个具备感知、决策与执行闭环能力的“类脑智能体”。这一观点的提出,将自动驾驶的讨论从单纯的机械工程领域,拉到了计算神经科学与人工智能融合的角度。
毫秒间的博弈
对于大多数公众而言,自动驾驶依然是一种前沿技术。汽车是如何做到像人类一样“看”路、“想”问题并“做”动作的?
“当车道前方车辆出现事故时,就需要变道。此时,自动驾驶的‘感知-决策-执行’闭环是如何完成的呢?”邓志东抛出了问题。
一切始于感知。他表示,车辆周身遍布的激光雷达、高清摄像头和毫米波雷达,构成了“复眼”,但硬件只是基础,真正的挑战在于如何处理海量的环境数据。
在事故发生的瞬间,传感器必须在毫秒级时间内捕捉到异常——前方车辆熄火了,或者出现了路障。但这仅仅是物理层面的“看见”。AI的核心作用在于“看懂”,即对场景与障碍物进行语义理解。它需要从嘈杂的环境中——比如雨天路面的反光、复杂的车流、路边行人的动态——过滤出多属性与关系预测信息,构建出一个实时动态的、隐含的数字世界。在这个隐含世界里,前方事故车不再是一堆像素点,而是被标记为“静态障碍物”;相邻车道的车流不再是模糊的影像,而是通过类别、形状、位置、速度、加速度、航向等多属性的分析,被预测为“动态目标”。
“汽车如何自己做决策?”这也是体现AI智慧的核心环节。
当感知系统确认前方无法通行后,系统大脑开始飞速运转,进入复杂的博弈阶段。邓志东分析道,此时AI需要瞬间预测出左侧车道后方来车的行驶意图,例如是降速或匀速行驶,还是在加速,左前方是否有足够的安全间隙切入,等等。
这是一个极其复杂的路径规划过程。与人类驾驶员依靠直觉相似,AI模型需要基于大模型预测周围车辆的行为意图。它会根据预设的“激进变道”与“保守等待”等行驶风格,进行具体的决策与规划。这一过程模拟了人类大脑处理不完整信息时的机制——在信息瞬息万变的变道过程中,不仅要看路,还要“懂”车,甚至要“揣摩”其他驾驶员的心理。
决策与规划一旦下达,就进入了执行与闭环环节。指令被瞬间转化为对底盘的电信号。油门输出多少扭矩,方向盘转动多少角度,刹车施加多少压力,都需要在毫秒间精准执行。
邓志东强调,车辆不仅要先开转向灯,还要根据后车的反应进行实时调整——如果检测到后车突然加速,系统必须立即终止变道并回正。这一连串动作的流畅度与稳定性,正是衡量自动驾驶AI水平高低的试金石。它不再是死板的程序执行,而是模拟人类“老司机”的驾驶直觉,力求在安全、效率与舒适之间达到完美的平衡。
从“规则约束”到“泛化智能”
在自动驾驶发展的上半场,行业主要依赖“规则驱动”的技术路线。工程师们试图把所有的交通规则和驾驶经验写成代码:红灯停、绿灯行、实线不越。然而,现实世界的路况是极其复杂且充满不确定性的。突如其来的暴雨、没有信号灯的乡间路口、形状独特的工程车辆,甚至是在路边散步的牛羊……这些被称为“边缘事件”(Corner Case,小概率高风险的安全关键场景)的难题,长期制约着自动驾驶的安全上限。
邓志东指出,AI技术,特别是大模型的引入,正在从根本上解决这一痛点。他特别提到了一个关键优势——“多场景适配”。
“比如智能辅助驾驶对高速公路、城区道路的适配。”邓志东说。
相比于传统算法,大模型的最大优势在于强大的“泛化能力”。通过海量驾驶视频和动作数据的预训练,大模型学习到的不再是死板的规则,而是通用的驾驶逻辑和物理常识。邓志东认为,这种泛化能力让汽车在面对未见过的路况时,不再束手无策,而是能像人类一样“举一反三”。
例如,在恶劣天气(如暴雨、大雪)下,激光雷达和摄像头的传感器数据可能会出现噪点或遮挡,导致传统算法失效。但基于大模型的AI能够通过上下文信息“脑补”出道路的几何结构,识别出模糊轮廓下的车辆和行人,从而保证感知的时空一致性。
邓志东进一步指出,大模型在决策合理性上的提升同样显著。例如在“无信号灯路口让行”这种典型的博弈场景中,规则式算法往往因为无法判断优先权而陷入死锁。而基于大模型的决策系统,可以预测其他车辆的轨迹特征和行人的意图,模仿人类驾驶员的社交博弈策略,做出合理的让行或通行决策。
这种技术路径的演进,与国家在《关于加强智能网联汽车生产企业及产品准入管理的意见》中鼓励技术创新、提升系统环境适应性的导向不谋而合。AI让汽车拥有了学习和进化的能力,使其能够真正适应国内复杂多变的城市道路环境,且可以从封闭园区走向开放道路。
黑箱、隐私与商业化的挑战
随着新能源汽车的普及,越来越多用户开始尝试使用领航辅助驾驶功能。邓志东坦言,这背后既有技术成熟的因素,也离不开“车企科技感宣传”和“实际通勤便利性”带来的用户习惯改变。但由此带来的安全隐患,只有直面并予以解决,才能让自动驾驶真正走进千家万户。
“事实上,明确决策逻辑这样的事故溯源很难实现,因为基于大模型的方法可能是黑箱式的。”邓志东指出了当前技术的局限性。
深度神经网络的决策分布在数以千亿计的神经元参数路径中,而非可读的代码逻辑。当车辆在紧急情况下做出一个刹车或避让动作时,我们很难像检查传统代码一样,精准定位是哪一行逻辑起了作用。这种“不可解释性”,给事故定责、保险理赔以及用户的心理安全感构建带来了巨大挑战。邓志东认为,这是未来AI研究的前沿方向之一,即可解释AI的发展,或者是建立一套系统的多重闭环的安全评估标准。
自动驾驶汽车被形象地称为“移动的数据采集器”,它们无时无刻不在录制周围的环境。在这些记录中,不可避免地会包含“走斑马线横穿马路的行人,或走道路两侧的行人”。邓志东指出:“这个时候,行人的人脸就要打上马赛克,进行数据隐私保护。”
这不仅是企业的社会责任,更是对《中华人民共和国数据安全法》及《汽车数据安全管理若干规定(试行)》的严格践行。在享受技术便利的同时,必须捍卫每一个普通人的隐私权利。
在谈及备受关注的RoboTaxi(自动驾驶出租车)时,邓志东说:“RoboTaxi是限定了行驶区域与功能的L4级别的无人驾驶。”
他认为,这种在特定区域(如北京亦庄、上海嘉定等自动驾驶示范区)先行先试的模式,是目前最务实、最可行的商业化落地路径。通过限定场景,可以在技术尚未达到全知全能的情况下,通过运营积累数据,逐步接近完全无人驾驶的目标。
政产学研用的合力
自动驾驶是一项复杂的系统工程,单靠一家企业或一个实验室无法完成。面对这一挑战,邓志东强调了“协同”的重要性。
“政府已有‘自动驾驶政策先行试点区’,企业与高校共建的‘联合研发平台’也早就存在。”邓志东介绍。
他进一步指出,这种政产学研用的深度融合,正是推动中国自动驾驶技术领跑全球的核心动力。政府提供政策沙盒与基础设施(如“车路云一体化”的路侧设备),高校提供前沿理论研究、关键技术突破与人才输送,企业负责技术落地与商业化运营。三方合力,才能跨越从技术验证到规模应用的“死亡之谷”。
展望未来5到10年,邓志东对行业前景充满信心。他认为,随着AI算力的突飞猛进、法律法规的不断完善,以及基础设施的智慧升级,我们将迎来“更自主的出行与服务能力”。
届时,汽车将不再仅仅是从A点到B点的交通工具,而是懂你、护你、解放你、服务于你的智能移动空间。它能理解你的意图,预判潜在的安全风险,真正在复杂的城市环境中实现“科技护航”。
来源:北京科技报
采访专家:邓志东(清华大学计算机科学与技术系教授、人工智能研究院视觉智能研究中心主任)
撰文:记者 段大卫
来源: 北京科技报
科普中国公众号
科普中国微博

帮助
北京科技报 