图为报告工作组主席、英国皇家学会院士彼得·唐纳利教授在新闻发布会上介绍报告的主要内容。
(郑焕斌/《科技日报》)
在人工智能快速发展的关键节点,关于该技术会如何重塑英国经济和人们生活的争论高涨。英国皇家学会4月25日发布了一份题为《机器学习:计算机通过案例学习的能力和潜力》的报告,为机器学习技术未来发展谋篇布局。
报告呼吁,英国应加大对机器学习的研发投入,掀起攻克该技术难点的新浪潮,同时要求各界加大向公众宣传机器学习技术的力度,营造公平合理的发展氛围,从而保持英国在机器学习技术的前沿地位,提高国际竞争力。
开展机器学习技术普及宣传
报告源于英国皇家学会发起的一个针对机器学习技术的研究项目,该项目从2015年11月开始,吸引政府、学术界以及公众广泛参与,对未来5年到10年机器学习技术的发展潜力以及发展方式进行了调查。这是英国政府首次对机器学习技术进行如此广泛的深入评估。调查发现,虽然大部分英国人听说过或使用过相关应用程序,但听过“机器学习”这一术语的比例不到9%。
最近几年,机器学习技术取得惊人进展,并已在诸多领域“施展其才华”。目前人们几乎每天都离不开机器学习系统,如社交媒体中的图片识别系统、虚拟助手中的声音识别系统和网络购物中的个性化推荐系统等。但对受访人群的调查中,人们对机器学习技术也提出很多质疑,包括没有个性化发挥、是否会取代人类体验、是否会造成失业、是否会导致自动驾驶的交通事故,以及是否会通过有指向性的产品和服务,引导或限制人们的自由选择。
报告基于调查结果认为,为促进机器学习技术的发展,未来工作的重点之一是加大公众对机器学习发展前景的信心,并要求研究人员开展科普工作,促进机器学习研究人员和从业者与公众之间的交流。
率先攻克关乎社会利益新挑战
报告特别列出的“掀起机器学习技术新浪潮”一章指出,机器学习应被列为科学、研究和创新的优先领域进行投资。除现有投资机制外,未来应加大投入,率先攻克机器学习技术关乎社会利益的一系列新挑战。
技术本身的挑战包括:创建能规模化处理大数据的新算法;设计不需大量标记性数据的新算法;设计提高数据、能源等使用效率的高效机器学习方法;改进运用模拟的研究模型;改进硬件以支持更强大的机器学习系统等。
报告还以较大篇幅关注和论述了如何应对与公众相关的技术挑战:首先,增加机器学习方法的可理解性和透明度。其中最有前景的方法是创建机器学习系统与人机对话系统的界面,未来帮助人类与机器对话,通过提问来理解机器推理过程。开发深受用户欢迎的语音界面,提高机器的解释能力,避免产生歧义和误解。
其次,解决数据隐私与技术应用的矛盾。机器学习以数据为基础,而隐私是其中的重要议题。目前该领域的研究还处于初级阶段,拥有极大提升空间。一方面应对隐私进行差异化分类,模糊化处理数据资料;另一方面,研发同态加密技术,使机器学习算法能在“看不见”原始数据的基础上对加密数据进行处理。
第三,开发对真实世界数据的分析程序,以对现实世界“杂乱无章”的数据进行净化、理解、转变和集成的系列化处理。未来研发重点包括:开发数据处理和共享标准,提高数据评估质量;开发系统行为评估和错误识别的标准。
最后,设计人机学习系统,即人机交互程序。未来,许多机器学习系统要在与人类互动中学习,其来源数据并不是静态不变的,而是在互动中产生,这将给未来研究带来一系列新的课题。如最大化实现人类智能与机器学习的结合、设计能根据人类情感做出高效决定的支持工具等。
严格监管机器学习技术发展
报告还呼吁,创建对机器学习技术严格监管的环境,确保该技术的利益最大化。通过对哪些人影响最大、利益如何分布及存在哪些增长点进行分析,设计有效的干预政策,帮助公众和企业适应并利用机器学习技术,改变生活和生产方式。
这些干预政策包括:其一,对各阶层人群进行培训。组织对学校、大学和工人等不同人群的数字技能学习和培训,确保不会造成性别、种族和社会经济背景方面的差别对待;强化机器学习专业的硕士教育,为工商企业和研究机构培养一批机器学习方面的专业人才;增加博士和博士后人才培养,提前布局下一代机器学习领域的研究带头人。
其二,创造机器学习运用新机会。将机器学习技术集成到英国工业战略计划中,帮助企业实现利益最大化;支持新一轮机器学习研究浪潮,特别要优先研发引起社会和伦理关注的技术热点。
其三,创建支持机器学习技术发展的数据环境。持续追踪英国开放数据记录,确保数据的安全共享;评估个人病例或商业敏感数据能否公开,确保在协议框架内适当分享数据。
另外,营造宽松的政策环境,支持公众对机器学习表达不同看法,并制定全新数据管理框架,既要保证数据管理与机器学习运用步调一致,又要特殊问题特殊对待,用不同方式灵活处理。(记者 聂翠蓉)