Topic on Technology and Application of Knowledge Graph
编辑:苏加友E-mail: ************
知识图谱技术与应用专题
Topic on Technology and Application of Knowledge Graph
长。一名维修技师,大概需要2~3年才能成为熟练工;一般需要8年以上才能成长为维修高级技师。技师培养周期长、成长慢。因此,迫切需要新的知识沉淀渠道,让技术专家的知识更有效传承,助力维修技师快速成长。
3 知识图谱技术
3.1 基本概念
知识图谱2012年由Google提出,目的是让搜索引擎能够洞察用户查询背后的语义,返回更为精确的信息。知识图谱本质是一种知识的表示形式,它模仿人类的认知体系,以图的形式表示知识表式客观世界中的概念和实体及其之间的关系,是支撑语义搜索、智能问答、决策支持等智能服务的基础技 术[1]。它让机器能更有效地对知识进行学习和处理,实现从感知智能到认知智能的飞跃。
3.2 技术分类
一般将知识图谱技术分为三个部分:知识图谱构建技术、知识图谱推理技术、知识图谱应用技术。知
识图谱构建技术包括本体论和数据处理技术两类,本体论是知识图谱的骨架,是模仿人的认知体系对知识的建模;数据处理技术将现实世界中格式多样、结构混乱的数据处理成结构良好的数据,并将其对应到知识图谱本体中赋予数据的内涵。知识图谱推理技术则从已知的知识中运算推理得到人需要的新的知识,是实现智能化语义搜索、决策支持与溯因的关键。知识图谱应用技术包括语义搜索、智能问答、智能推荐等直接的应用,为其他人工智能模型提供先验知识支持、为大数据应用提供结构化数据支持等间接的应用。
4 知识图谱技术在汽车维修场景的应用
汽车维修场景已积累丰富的维修数据,比如“维修记录”、“维修案例”、“维修手册”、“维修指导视频”等。但数据相互割裂,未能形成有效知识。将维修数据构建成知识图谱,开发上层应用,能有效赋能汽车维修业务,解决场景痛点,充分发挥知识的价值。知识图谱构建及应用流程如图1所示。
4.1 知识图谱构建
首先需要构建汽车维修知识图谱,构建步骤依次为:本体设计、知识抽取、知识映射、知识融合与消歧。
4.1.1 本体设计
本体设计是一个知识建模的过程,常用设计流程如图2所示。该过程需要汽车维修领域专家和知识图谱专家协同,通过抽象、总结该领域的知识实现本体设计,一般可使用RDFS、OWL等语言进行建模。参考本体构建七步法[2],复用公开的汽车本体,并辅以关键短语、业务知识等信息抽取算法,通过半自动化形式实现汽车维修场景的知识建模,快速完成汽车维修知识图谱本体设计。该本体包含:故障现象、故障码、零部件、系统等概念及之间语义关系。
4.1.2 知识抽取
通过搜集相关数据,基于相关算法技术完成知识三元组抽取。对于结构化数据,经过简单转换,即可生成三元组;对于非结构化数据,首先需要将其文档格式进行转换,得到txt、docx等易于处理的文本格式;其次可以使用基于词典、模板的无监督图 1
知识图谱构建及应用流程图
图2
知识图谱本体设计流程图
知识图谱技术与应用专题
Topic on Technology and Application of Knowledge Graph
学习方法,抽取知识;也可以使用有监督学习、弱监督学习等方法,人工对部分原始数据进行标注,
再利用标注数据训练知识抽取模型,进而用该模型从原始数据中抽取知识。传统的流水线式抽取方法,将知识抽取任务拆分为命名实体识别(NER)任务和关系抽取任务。比如,一种常用的抽取方法采用LSTM-CRF+PCNN 的模型结构,先通过NER 识别出实体,再抽取实体之间的关系,两个任务的结果不会互相影响。另一种联合式抽取方法,则将实体抽取和关系抽取相结合,组成一个联合模型,比如双向树形结构的LSTM-RNNs [3]。一般认为,联合式抽取方法可以避免流水线方法存在的错误和积累的问题。4.1.3 知识映射
由信息抽取阶段得到的三元组,需经过知识映射将抽取结果映射到本体上,才能生成知识图谱。如果数据量较大,该过程可以借助Hadoop 等大数据技术加速。
4.1.4 知识融合与消歧
最后,还需要对来自不同数据源的知识在统一规范下进行异构数据整合、消歧,才能完成新知识图谱的创建。如图3所示,故障现象:“车辆无法启动”和“车辆打不着火”,实际表示的是相同故障现象。经过知识融合对知识图谱中的知识进行融合消歧,能提高知识图谱的质量,进而提升上层应用的效果。常用的有基于快速相似度计算、基于规则、基于分治等方法[1]。
4.2 应用开发
基于汽车维修知识图谱,可打造“智能维修助手”。该系统包含的典型应用有:维修问答助手、维
修知识搜索/推荐、故障根因推理、知识后台及统 计等。
4.2.1 维修问答助手
维修助手是以维修知识图谱为知识库底座,结合自然语言处理技术构建多轮问答引擎,实现基于知识库的问答系统。用户可询问故障原因及解决方案、零部件拆装指导、故障码详情等信息。此外,同一故障现象可能与多个案例、零部件等相关,候选答案较多。基于知识图谱推理能力,可动态追问用户,通过多轮问答引导,获得更精准的答案。比如用户询问“车辆无法启动”,经知识图谱推理,追问“是否存在故障码XXX ?”,“故障频率是经常还是偶尔?”等信息。根据用户的回答,再筛选生成最终答案。
4.2.2 维修知识搜索/推荐
传统搜索引擎是基于字符匹配,可快速返回与用户输入存在关键字/词匹配的网页、文档等信息。基于知识图谱的搜索,可进一步理解用户输入的语义信息,并推荐与搜索结果相关联的知识。比如,用户搜索“油门踏板的车身位置”,能理解用户搜索意图实际为油门踏板的位置,进而优先返回油门踏板的位置图,而不仅仅返回包含“油门”、“踏板”、“车身”等关键词的文档信息。此外,知识图谱可推荐“油门踏板”相关的故障码和维修案例。该种推荐方法支持冷启动场景,无需积累大量用户点击和浏览数据,即可准确推荐内容,并具备一定可解释性。4.2.3 故障根因推理
可梳理出汽车各功能模块、部件、零件、电路等概念之间的调控关系。并总结、抽象维修技术专家定位故障原因的逻辑,用Datalog 等逻辑语言,描述为具体可执行的逻辑规则。再结合推理引擎,在知识图谱上,推理出某种故障现象可能的故障部位及故障根因。为罕见的疑难故障维修提供参考,并
解释推理过程。4.2.4 知识后台
知识后台可对维修技师查询的故障现象、故障码、零部件等信息进行统计,辅助维修技术专家发
图3
知识融合示意图
知识图谱技术与应用专题
Topic on Technology and Application of Knowledge Graph
掘热点故障,判断一线维修技师欠缺的知识域,以针对性设计培训和知识共享机制。同时,考虑到新车型不断上市,维修案例不断积累,知识在持续产生。知识后台支持维修技术专家自助向知识图谱中添加知识,供维修技师查询。维修技术专家可持续沉淀自身知识,在维修技师间有效共享。
4.3 应用效果
实践表明,“智能维修助手”对维修技师在日常维修和外出救援的场景中有很大帮助。信息获取更加便捷,且在遇到疑难故障时,能及时获得参考维修方法。维修技术也在该应用的加持下逐步提高。维修效率和一次性修复率显著提升,客户等待时间缩短。对厂家的技术专家而言,“智能维修助手”让他们从繁琐的故障咨询中解放出来,专注于疑难问题攻关。
5 未来展望
知识图谱作为一种知识的表示形式,能有效地让计算机和AI 算法对知识进行表示、学习和处理。将知识图谱及其上下游技术应用于汽车维修场景,能有效解决部分场景痛点。展望未来,还可在以下方向进行探索。
5.1 结合故障树分析法
故障树分析(FTA)[4]是由上往下的演绎式失效分析法,利用布林逻辑组合低阶事件,分析系统中不希望出现的状态。该方法在航空航天、工业、制药、
软件工程等领域都有应用。可进一步在知识图谱中构建汽车维修故障树图,可对汽车故障进行定性和定量分析,更准确预判故障根因。
5.2 应用多模态知识图谱技术
汽车维修数据包含大量的图片和视频,比如零部件图片、拆装教学视频等。可进一步应用多模态知识图谱技术,从以上数据中抽取知识,构建语义关联,以提升搜索、问答的效果,并为用户提供多种媒体形式的信息。参考文献
[1] 王昊奋, 漆桂林, 陈华钧. 知识图谱:方法、实践与
应用[M].北京:电子工业出版社, 2019.
[2] NOY, N.F., MCGUINNESS, et al. Ontology
development 101: A guide to creating your first ontology[R/OL].[2021-03-22]./
sites/default/files/ontology_development_101_aguide_to_creating_your_first_ontology. pdf. [3] MAKOTO MIWA, MOHIT BANSAL. End-to-End
Relation Extraction using LSTMs on Sequences and Tree Structures[R/OL].[2021-03-22]. /pdf/1601.00770.pdf.
[4] RUIJTERS E, STOELINGA M. Fault tree analysis:
A survey of the state-of-the-art in modeling, analysis and tools[J]. Computer Science Review, 2015(15): 29-62.
(收稿日期:2021-03-24)
汽车维修知识(上接第10页)利益的突出问题等,在数据安全与个人信息保护、关键信息基础设施安全、网络安全审查、密码应用与测评等重点工作方向加紧研制一系列细化可操作的网络安全国家标准,为提升网络安全保护工作能力、维护公民在网络空间的合法权益提供标准支撑。(4)紧盯信息技术发展趋势,提前布局大数据、人工智能、区块链、5G 等新技术新应用等领域标准研究,为促进信息技术与网络安全产业发展提供规范和指引。
参考文献
[1] 岳高峰, 杜俊鹏, 朱虹,等. GB/T 13016-2018标
准体系构建原则和要求[S].北京:中国标准出版社, 2018.
[2] 白殿一, 逄征虎, 王益谊,等. GB/T 1.1-2020标准
化工作导则 第1部分:标准化文件的结构和起草规则[S].北京:中国标准出版社, 2020.
(收稿日期:2021-03-24)
发布评论