在德国HighD高速公路数据集的数万条变道记录中,一套由中国团队研发的AI系统正悄然逼近人类驾驶员的决策精度。清华大学联合聊城大学团队在《工程》期刊发布重磅研究:通过逆强化学习技术解析262组人类避障轨迹,构建全球首个动态权重轨迹优化模型,使自动驾驶车辆在紧急避障时的轨迹与人类驾驶员相似度达92%,横向加速度波动降低45%。这项技术将L4级自动驾驶的拟人化水平推向新高度。
机械轨迹之痛:传统算法为何让乘客“晕车”?
传统自动驾驶的避障轨迹依赖工程师预设优化函数,面临两大瓶颈:
- 场景僵化:固定权重模型无法适应动态路况,如前方车辆突然减速时,系统可能因过度追求效率而急打方向;
- 舒适性缺失:优化函数忽略人类驾驶习惯,导致轨迹平滑度不足。实验显示,传统算法生成的急刹轨迹横向加速度峰值为2.8m/s²,远超人类驾驶的1.5m/s²,这是乘客眩晕的主因。
研究团队另辟蹊径,从真实驾驶数据中寻找答案。通过分析HighD数据集中75小时的高速公路录像,他们发现人类驾驶员在Δv(自车与前车速度差)>20km/h时,避障轨迹曲率会自适应增加23%,以平衡安全与舒适。
逆强化学习:让AI“偷师”老司机的108种变道技巧
核心技术突破在于最大熵逆强化学习框架的构建:
- 数据萃取:从262组专家避障轨迹中提取3大特征——横向位置偏差(ηr1)、横向速度(ηr2)、横向加速度(ηr3);
- 权重反演:通过梯度迭代算法,逆向推导每条轨迹背后的优化函数权重θr。例如在Δv=40km/h的紧急场景中,系统自动将安全权重θr1提升至18.6,较平缓场景增加3.2倍;
- 动态映射:建立速度差(Δv)与自车速度(v)的双变量多项式模型,实时调整权重组合。当v>100km/h时,舒适性权重θr3占比提高至35%,避免高速急转。
实测数据说话:拟人化水平突破行业天花板
在42组真实场景测试中,新系统展现出惊人优势:
- 轨迹贴合度:与人类驾驶的横向位置偏差仅0.13米,较传统算法缩小58%;
- 紧急响应:面对Δv=41.76km/h的突发状况,系统在0.8秒内生成避障路径,误触急刹概率下降70%;
- 能耗优化:通过五阶样条插值算法,方向盘电机控制电流降低22%,功耗仅相当于手机游戏运行。
更突破的是,系统在硬件在环(HIL)测试中实现0.185米的轨迹跟踪精度。当自车以120km/h行驶时,乘客实测眩晕指数下降65%,接近人类驾驶员水平。
从实验室到量产:重新定义自动驾驶“人性化”标准
该技术已进入车企合作阶段:
- 城际物流:在30吨重卡测试中,系统使长弯道轨迹曲率波动减少37%,轮胎磨损率下降18%;
- Robotaxi:深圳试点车队误触急刹次数从日均4.3次降至0.7次,夜间复杂场景通过率提升至98%;
- 芯片适配:算法经压缩后可在10TOPS算力平台运行,成本较激光雷达方案降低90%。
团队预计,2025年前该技术将集成至L3级以上车型,届时高速公路事故率有望降低42%,每年减少碳排放860万吨。
结语:当AI学会“以人为师”
当自动驾驶不再机械复刻物理公式,而是深度融入人类驾驶的柔性智慧,这场由逆强化学习引发的技术革命,正悄然打破人机共驾的信任壁垒。从精准的权重函数到优雅的避障弧线,中国团队用数据驱动的“拟人哲学”,为自动驾驶的终极形态写下新注脚。
来源: Engineering