图文详情

导语
当ChatGPT引发全球AI军备竞赛时，浙江大学团队在《工程》期刊发表里程碑式研究，提出全球首个可落地的AGI（通用人工智能）治理框架。这项名为“领域锚定”的技术路径，通过构建人类专业知识的“数字护栏”，成功将AI的价值观误差率从37%降至2.1%，为破解“AI失控”困局提供中国方案。

2023年全球AI安全峰会披露的数据触目惊心：顶级大模型在医疗诊断中存在种族偏见偏差率高达42%，法律咨询中的性别歧视发生率达29%。传统治理手段如内容审查、算法审计等，被证明如同用渔网拦截洪水——GPT-4通过图灵测试的同时，其价值观已与人类产生系统性偏移。

浙江大学团队通过脑机接口实验发现根本症结：人类专家决策依赖“领域认知金字塔”（专业知识60%、伦理直觉25%、文化背景15%），而AI仅模仿表层行为。这种认知结构的断层，导致AI在复杂场景中频繁“闯红灯”。

研究提出的“领域锚定”框架包含三大创新组件：

在司法领域示范应用中，搭载该系统的AI辅助法官审理著作权案件时，不仅准确引用《伯尔尼公约》条款，还能辨析京剧脸谱创作中的“表达唯一性”问题，这类文化敏感性判决过去需要3位专家合议。

研究同步发布的AGI-Ladder评价标准引发国际关注：

实测显示，GPT-4在医疗领域仅达L2.3级，而接入“领域锚定”框架的专用系统可达L2.9级。更突破性的是，该系统在肝胆外科诊疗中展现出L3级能力——当遇到未收录的罕见病案例时，能主动建议组建多学科会诊并标注伦理审查要点。

团队独创的“领域免疫”技术尤为亮眼：通过对抗训练注入3000小时专业场景的“认知抗体”，使AI在面对超纲问题时启动保护机制。在测试中：

某国际药企应用该技术后，AI药物研发系统的专利侵权风险下降91%，临床方案符合率从68%提升至97%。

这项研究正在重塑国际AI治理格局：

更深远的影响在于技术哲学层面——研究首次证明，AI价值观塑造不能依赖通用伦理说教，必须根植于具体领域的知识体系和文化传统。正如论文通讯作者吕跃广所言：“我们要培养的不是通才AI，而是深谙中医之道、理解普通法精神的专业智能体。”

当全球为AI失控风险焦灼时，这项来自中国的研究给出了充满东方智慧的答案：真正的智能不应是脱离领域根基的空中楼阁，而应成为人类文明的“数字传承者”。从敦煌壁画修复到中医药创新，搭载“领域锚定”框架的AI正在多个领域证明，当技术深度融入人类知识谱系，人机共生的智能文明新形态终将成为可能。

来源: Engineering

全球首个AGI治理框架问世中国学者破解“AI价值对齐”世界难题