知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,利用可视化的图谱,形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构,达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。作为当前人工智能的重要方向之一,结合大数据处理、统计计算、学习算法、深度学习算法等技术,受益于越来越多结构化、半结构化和非结构化的计算能力,知识图谱的可计算性有了很大提高,在知识检索、知识推理、知识辅助理解等方面,为石油化工领域工作人员提供了便利。

知识图谱发展史

知识图谱启蒙期可以追溯到20世纪50年代和60年代,在人工智能领域,知识工程作为一个分支已经存在了很长时间。总的来说,人工智能有三个比较大的分支,即神经网络、机器学习和知识工程。

自20世纪60年代始,知识工程领域不断向前发展,产生了很多新的逻辑语言和新的实用方法。例如“语义网络”(又名框架网络)与现在的知识图谱非常相似。

1997年,Edward以知识为智能系统的核心,提出了知识工程的概念。Tim提出了语义网,使用本体的概念系统来描述客观世界,通过统一的描述方法对网页内容进行语义标记,使网页互联成为内容互联,甚至语义互联。在此基础上,形成了以RDF(ResourceDescription Framework)为模型的知识表示体系,并逐渐演变成一整套成熟的知识表示、序列化、查询、存储规范,成为现代知识图谱的基础。Web 2.0出现后,维基百科以多人协作的形式产生海量知识数据,成为大型知识库的主要来源之一。在此基础上,DBpedia 和 Freebase 是当代大规模知识图谱的原型。

从最终结果来看,现在的知识图谱似乎与20世纪60年代存在的语义网络非常相似,但这种相似之处只是表面的。因为在发展的过程中,开发者构建了一个庞大的产业体系,以及如何从各种文档和各种数据集中编辑生成知识图谱的完整产业链。因此一项技术不能只看它的定义,更重要的是看工业系统在与其相关的所有实践过程中的总和。如今的知识图谱技术在深度和广度上已经远远超越了20世纪的语义网络技术。

2012年,谷歌构建了一个大规模的知识库Knowledge Graph,并将其应用于搜索结果的提升。从此拉开了当代知识图谱大规模应用的序幕。

国内知识图谱应用现状

知识图谱的应用正处于突飞猛进的时期,从最初的语义知识图谱不断发展到行业细分的知识图谱。目前,知识图谱在国内的应用种类繁多,应用于电商平台、企业信息化、科技信息化、风险投资、农林科技、医疗健康、工业应用和视听娱乐等不同领域。

2012年以来,在数据理论和算法模型的驱动下,知识图谱技术发展迅速,该领域的专利申请量显著增加,知识图谱领域越来越受到各创新主体的关注。2020年,知识图谱专利申请量达到峰值7256件。

目前,国内商业界对知识图谱的研究非常活跃,尤其是一些大型互联网公司对知识图谱的需求十分强烈。例如,百度的知识图谱自 2014 年推出以来,3年内业务规模增长了约160倍;搜狗借助基于知识图谱的人工智能技术,实现了移动端的搜索流量快速增长;腾讯利用自身的数据优势,构建了自己的社交知识图谱,并服务于众多产品;基于知识图谱的个性化推荐系统对阿里的营收增长起到了至关重要的作用。

炼油化工领域知识图谱的应用

目前,炼油化工领域知识图谱在知识化方面,缺少面向应用系统的知识归集和知识评价,炼油化工领域本体构建所涉及的实体、关系、属性是十分庞大的,需要行业领域专家花费大量的时间进行梳理。此外,对于数据管理、数据利用,国内炼厂中应用系统数量多,导致积累了大量数据,管理难度大,而且不同系统间数据流通性差,数据价值难以体现。炼油化工领域中的数据,除了数量庞大之外,还包含行业特点,如工艺流程、原料、产品、装置、仪器、生产管理等专业数据,格式种类繁多,存在的系统也互不相通。

近年来,通过炼油化工领域专家对领域知识进行梳理,归纳总结行业实体、关系以及属性,基于知识图谱构建技术,可逐步形成石油化工行业知识图谱本体。在该领域本体的基础上,对炼厂所用各系统数据进行采集与融合,通过语义分析及关系映射使每个孤岛知识之间形成关联关系。在日后数据不断新增时,动态同步炼厂数据。在确保领域图谱可靠可用后,在图谱基础上逐渐拓展应用服务,使炼厂原始数据、生产数据、实验数据等被充分利用。在应用方面可基于图谱中所积累归纳的专家经验,帮助炼厂实现安全平稳运行。当生产过程中发生突发事件时,演变过程通常具有不确定性,发生过程存在多种可能。面对突发事件,对场景的预测一般是基于经验以及知识推理,对于“正确”的建议,知识是相对稳定的认知状态,知识能够保证自身的工具价值,将机器学习与知识相结合时,通过深度学习,对知识的解释有很大的帮助,基于领域知识图谱,使机器拥有类人的学习、分析、判断能力。对于突发事件,设计更有针对性的指挥、救援、抢险等方案。而基于图谱技术以及机器对专家经验、突发事件的深度学习,通过对炼厂中不同装置、设备、物料的特征属性、关联关系进行分析,实现在系统中输入事件基本情况,通过算法模型分析,向操作人员推荐最佳应急方案,辅助技术员在不同情况下快速、有效地处理事故,尽可能减少突发事件带来的损失。

另一方面,智能问答技术近年来也在快速发展,此技术应用于基于知识图谱问答(KGQA),可通过构建好的结构化数据在知识图谱中搜索答案。基于知识图谱的智能问答可分为三类,其中基于信息检索的知识图谱智能问答,可将用户的自然语言问题基于bert_classificatio算法模型做意图识别,判断句式,做实体识别,匹配模型,做关系抽取,达到解析问句的目的,提出三元组拼成图数据库语句,在构建炼油化工领域知识图谱中进行答案查询,并给出符合度最高的答案。但是为保证答案的正确性、符合性、有效性,需要在建立石油炼化领域知识图谱时确保该图谱数据的质量,避免数据冗余、数据稀疏、数据不准确等问题对智能问答所带来的不利影响。基于炼油炼化领域知识图谱的智能问答不仅可以帮助用户对日常炼油化工领域基本问题进行解答,还可在生产运行过程中对异常工况、应急处理等问题提供解决方案。基于知识图谱技术,将生产运行中积累的装置、设备等经验知识构建关系图谱,对故障诊断和失效原因进行分析,降低生产运行中异常工况所带来的损失,并通过机器学习将问题形成专家经验,存储至知识库。

结语

针对炼油化工行业领域,截至目前,国内尚未建成相对成熟的知识图谱应用范例,但同时炼油化工企业对知识图谱技术的需求和知识图谱技术能够给企业带来的积极改变不容忽视,知识图谱不但可以为炼油化工企业提质增效,还可以为生产运行保驾护航。此外通过梳理行业知识本体,帮助企业进行数据、信息存储,积累知识。目前知识图谱技术已得到业界的广泛认可,因此,知识图谱在炼油化工领域的发展正蓄势待发。

作者:昆仑数智科技有限责任公司 孙筱 侯士超 刘锋

来源: 石油知识