且应用技术 本体聊天机器人的设计与应用 王磊魏勇 邸建勋(31008部队) 杨小琳 摘要:针对互联网检索技术在专业领域知识查询存在的相关信息过多、需人工筛选的问题,基于聊天机器 人发展现状,引入本体技术作为聊天机器人的规则库存储载体;基于本体规则库的树形层次结构,设计规则匹配 算法;通过系统规划和模块划分,构建一款既能聊天又能解答气象专业知识的聊天机器人。对聊天机器人在专业 领域的应用和发展有一定的促进作用,为领域知识共享和获取提供一个便捷快速的平台。 关键词:聊天机器人;本体;规则树;规则匹配算法 0引言 随着科学技术和信息技术的迅猛发展以及互联 网的广泛应用,人们对于知识的需求量越来越大。现 阶段,在追求知识信息量的同时,更加注重获取知识 构为原型,具有极强的层次结构和知识关联性关系, 符合聊天机器人的规则树要求I5】,同时还能应用本体 的关联性特点进行语义扩展查询,因此本文选用本体 作为聊天机器人的规则存储模型。 的便捷快速和质量。 互联网技术的突飞猛进已经能够满足人们对知 识“量”的需求,但却无法保证知识的“质”。人们 1聊天机器人概述 聊天机器人主要通过自然语言,以聊天的方式与 人交互,根据人的语言习惯,结合用户问题,给出人 性化的回答。最早的聊天机器人是1956年由Jaseph Weizenbaum创造的“Eliza',【 。它根据用户输入的 关键词进行搜索,基本上能够实现人机间的简单对话。 但由于Eliza仅仅根据第一个关键词搜索答案,没有 进行优先级比较、规则最优匹配等步骤,使得一些优 通过各种检索引擎(百度、Google、Sogo等),从互 联网获得大量的信息,但从中筛选有用的信息却是比 较繁琐困难的过程【l】。现阶段,因为大部分搜索引擎 基于串匹配模式,检索的无用相关信息较多,不能满 足用户比较复杂的检索要求,检索结果不尽如人意 。 聊天机器人是一个模仿人的语言习惯,通过模式 匹配的方式寻求最佳答案的自动问答系统【3】。一问一 答,不存在信息筛选的困惑。所有问题的答案均是根 据已建立的规则库进行规则匹配和推理得到,具有准 先级较低的规则几乎永远不会被匹配到。 随后聊天机器人进入快速发展阶段。“Claude” 加入了模式匹配,提升了回答语句语法以及语义的准 确性;“Cyber Ivar”提升响应速度的同时,极大地增 强了知识库;“Mice”定义了丰富的标签,具有各种 拟人的智能【7】。 聊天机器人相关技术的发展日趋完善。语法分析、 句法分析、问题分类、命名实体识别、句型识别、语 义分析、语料库技术、相似度计算、模式匹配等技术 在聊天机器人中的应用和发展完善进一步促进了聊 天机器人的智能化。 确性高、知识获取便捷的特点。通过记录对话历史信 息、主动转移话题、主动提问等方式,实现人与人对 话的模拟。目前比较成熟的聊天机器人有TalkBot、 Elbot、eLise、Mice、Laylahbot、小黄鸡等等【4J。由于 气象知识专业性较强,在气象领域中应用聊天机器人 进行气象知识的问答对规则库的设计要求比一般系 统更高。构建的规则库要求结构更加完整,条理更加 清晰,答案更加准确。 本体作为一种新型的数据存储模型,在信息存储、 共享等领域有着越来越广泛的应用。它以树形存储结 聊天机器人经过60多年的发展,已经形成了一 套相对完整的理论和实践体系,但也存在一定的缺陷。 2016年第37卷第4期自动化与信息工程l3 目前,几乎所有的聊天机器人主要采用模式匹配的方 法来寻找最佳答案,基于程序和谈话技巧设计,对于 常识性问题往往采用侧面回答的方式。例如,当用户 问:“您知道云分为哪几类吗?”,聊天机器人的回 答是“这个太简单了,咱换个话题吧。”,这样的回 答无法满足用户的真实需求。 为了解答用户各种专业问题,聊天机器人在其他 领域的应用也越来越广泛,特别在英语教学、电子商 务等领域得到越来越多的青睐。这些专家机器人除具 有基本的聊天对话功能外,还能进行专业领域问题的 解答,充分发挥了聊天机器人便捷和快速反应的优势。 2本体的构建 本体的概念最初来源于哲学领域,现阶段在语义 检索、知识智能查询等方面已得到广泛应用[引。它以 树形存储结构为原型,主要包括3个要素:核心元素 集、元素间的关系和元素的属性(数据属性、对象属 性),通常也称作类、实例和关系。 目前本体的构建主要以人工构建为主,本体自动 构建、半自动构建有一定的发展,但目前相对成熟稳 定的方法比较少 。在实际运用中存在构建过于死板、 层次结构不准等问题。本文结合自动构建中语料抽取 原理,采用人工构建方法,具体流程如下: 1)下级子类划分 为使本体构建层次关系清晰、知识涵盖全备,首 先把知识划分为多个下级子类,再分别对每个子类进 行知识填充; 2 给定知识术语 给定与各个下级子类相关的气象学科中的各种 概念、定律、现象和公式等,涵盖领域中的各个知识 点[10]; 3)确定层次关系 将给定的各种概念划分成层次关系,层次结构的 划分可依据不同的专业方向划分不同的层次关系,也 可根据具体应用划分所需要的层次结构。 4)定义实例 定义实例主要指将领域知识作为本体中概念的 14 实例进行语义标注,并根据本体的定义来描述领域知 识属性的过程; 51定义实例属性 属性包括数据属性和对象属性。数据属性是指本 体中概念与数据类型之间的关系;对象属性是指本体 中概念之间的相互关系【1¨。本文根据需要定义如下属 性,数据属性有:描述(des)、中文标题(enTitle)、 英文标题(enTilte)等:对象属性有:兄弟类 (hasBrother)、子类(hasChildren)、父类(isChildOf)。 3基于本体的规则匹配 规则匹配是智能机器人的核心算法,算法设计的 好坏直接影响智能机器人的聊天效果。好的匹配算法 也需要结构完善、规则涵盖全面的规则库作为底层支 撑 。 结合本体的树形结构,为提高匹配的准确度和匹 配速度,本文将规则库构建为规则树,并以本体作为 存储模型,将本体中的实例和实例属性对应为规则中 的条件和结果,己知实例则输出实例属性[¨]。规则本 体的简化模型如图1所示。 图1规则本体简化模型 根据图1可知,以规则开始的规则有:规则a一 规则b、规则a一规则c、规则a.规则d、规则a一规则 b.规则e、规则a.规则b一规则f、规则a.规则b一规则 f-规则i等。 规则匹配采取深度优先匹配算法,如果匹配的规 则以规则a开始,则进一步匹配规则a的下一级规则, 直到所有规则全部匹配完毕,输出最后一级规则对应 的答案,结束匹配;如果未找到规则a,则剔除规则 王磊魏勇邸建勋杨小琳:本体聊天机器人的设计与应用 a,重复上述匹配流程。 过规则匹配算法进行规则的最优匹配,找到规则库中 现举例如下:用户输入“请给出云的定义和分类”, 对应的最佳规则。对于规则库中暂时没有的规则,则 进行中文分词的结果为“请/给出/云/的/j 义 阳/分类”, 转入一般算法,进行主动提问或者主动转移话题处理, 提取问题核心关键词为“云”、“定义”和“分类”。 系统在规则树中以“云”为根节点进行规则匹配,如 果未找到,则剔除“云”,开始以“定义”进行深度 优先的遍历搜索;如果找到“云”,则搜索“云”的 子规则中是否存在“定义”节点,如果不存在,则剔 输入问题 给出预先设置的通用答案,并记录用户问题,等待领 域专家登录解决 。系统结构图如图3所示。 用户登录系统 除“定义”节点,否则继续深度搜索循环,直到找到 “云.定义.分类”这条路径,得到答案进行输出。匹 配算法流程图如图2所示。 设置第一个关键词为根节点 查找该根节点 记录该节点 l I 剔除该节点 查找该节点的子节点 记录该节点 J J 剔除该节点 否 ~ 匹配结束 图2匹配算法流程图 4聊天机器人的设计 聊天机器人的工作原理:当用户输入问题后,机 器人对问题进行中文分词,抽取问题核心关键词,通 输入语句预处理 分词系统 厂 记录问题 输出答案 图3系统结构图 为便于系统设计管理,根据聊天机器人功能需求 和相关技术,将聊天机器人分为人机交互、分词、规 则匹配、知识库管理和用户管理5个功能模块。系统 管理员通过用户管理模块为用户分配用户名和用户 权限;领域专家利用知识管理模块定期对记录的未回 答问题进行解答,并更新到知识本体中;用户通过人 机交互模块,与聊天机器人进行对话,输入所要查询 的知识或信息:系统将用户请求通过分词模块进行分 词,提取问题核心关键词,并利用规则匹配模块,得 到问题最佳答案,返回给用户,如果问题暂无答案, 则将问题入库,等待专家解答。 5系统实现 系统实现主要用到的基础软件设计平台有Java 开发平台Eclipse、本体设计平台Prot6g6和数据库平 台达梦数据库。根据本体构建流程,结合维基百科知 识结构[61,构建了气象知识规则匹配库,部分截图如 图4所示。 2016年第37卷第4期自动化与信息工程15 Ⅻm 夸 i 互三 兰j受 至 銎 图4本体规则库 利用国产达梦数据库,建立数据表USER,用于 存储用户权限及访问流量信息,同时初始化问题反馈 表QuestionList,记录存储系统暂未解答的用户请求 信息:基于开源信息检索引擎Lucene工具包实现用 户请求的中文分词㈣处理,按照规则匹配算法,完成 t 气袅专家聊天机器人 气量专牵一一小王・竭噱为臻警疑黼 一口■■ ;i j j}ft系统搓示:奉俸摩加熊成功!气晕啬蠢小王撂_嚆为您管疑麓燕!… :你好 王.像好,我是气量青幂・}睫高兴愈蜡艇螭纂} _:你甓告诉我珥糸的气健类型是什幺吗?巍 王两条置亚热带季风气,曼・碍杂两囊充沛・年簿水1200 ̄米・四摹分明・年平’ 暹 照154。c。年掇jI簟气童最高3g 7。C・最低・13'‘c・年平均睥水要1106" ̄米・垂垂鼠袖日 1 i瓣I{荨i 埘节,叉嚣 }-l鼎,蔓拳炎热,与武汉、t庆并粹“三大火炉”・ iI 转八舀蠲内吝 了本体聊天机器人原型系统的设计和实现。 原型系统主界面如图5所示。 图5所示,用户登录后,与聊天机器人进行对话, 咨询“南京的气候类型是什么?”,系统进行规则匹 配找到最佳答案并返回给用户,快速地解决了用户的 知识需求。当匹配不到问题答案时,系统调用一般算 茎堡一— ;曼墅_峭壁 一曼 L . 一l_ J图5系统主界面 法,给出通用性答案,如图6所示。同时为便于规则 气象专家 机暑§人 一口—■ 库的完善,对于未做解答的问题,系统存入数据库, 等待专家登录进行解答,如图7所示。 专家解答完毕后,系统进行相关问题和答案的规 气量专家一一小王,戳为您警疑簟纂 }h景耋毫提示:本俸库nⅡI匿成功!气量专家小壬鸪讳为您管臻螭錾!¨‘ 我:体好,栽是 三。 王你好・襄是气最专家,锟高兴为您管疆嘏蒸! 敬:什么是大气低努撮荡? 、王对不起,载还不知避啥・你告诉我呗} 则入库,进一步优化完善规则库。 图6系统调用一般算法 16 王磊魏勇邸建勋杨小琳:本体聊天机器人的设计与应用 固簪冈睡 r r……一一…一……一一…一——一 一。■曩 状态l [2】管建和,甘剑峰.基于Lucene全文检索引擎的应用研究与实 现[J】.计算机工程与设计,2007,28(2):489-491. 【3】Zakos J,Capper L.CLIVE—An Aritifcially Intelligent Chat :序号 用户 一:张三1 黥翔题 气低颈嚣荡 一… l-已 1 Robot for Conversational Language Practice[C].Hellenic 阔题痒号 管寨 j 关罐羽 Conference on Artificial Intelligence:Theories,MODELS and Applications.Springer-Verlag,2008:437-442. [4]冯德虎.基于ALICE的研究生招生咨询智能聊天机器人研 究与实现[D】.成都:西南交通大学,2013:1—57. [5]王曼,吴振忠.基于领域本体的语义搜索——带权最短路径 方法【J].计算机与现代化,2013(9):1—7. 查番、问题 提交圊管 [6】于磊,顾大权,侯太平,等.基于维基百科的气象本体的自动构 建[J]计算机与现代化,2014(6):129—131,136. 7 f司趣解答界向 [7】Wallace,Richard S.(2009).The anatomy of ALICE Parsi ̄lg the Turing Test Cop.181—21 01:Springer. 6结语 聊天机器人经过60多年的发展己日趋成熟,但 [8】杜小勇,李曼,王大治.语义Web与本体研究综述[J].计算机应 用,2004,24(10):14—16,20. 聊天机器人的应用才刚开始,人们对聊天机器人的定 义也在不断发展变化。特别是将聊天机器人应用到心 理咨询、教育教学、电子商务订单处理等领域,对机 器人的要求越来越高[16]。 [9】金鑫.面向Web信息资源的领域本体模型自动构建机制的 研究[J】.计算机科学,2012,39(6):213—216. 【10】Hwang M,Kong H,Kim P.The Design of the Ontology Retrieval System on het Web[C].Advanced Communication Technology,2006.Icact 2006.the,International Conference. 本文结合聊天机器人的主动式问答机制,利用本 体的层次结构构建规则库,设计并实现了基于本体的 气象知识聊天机器人。该机器人不仅会聊天,更是一 个知识渊博的气象专家。在保证知识获取“量”的同时, 20o6:1815.18l8. 【11】Vallet D,Femfindez M,CasteUs P.An Ontology-Based nfIormation Retrieval Model[M].The Semantic Web: Research and Applications.Springer Berlin Heidelberg, 2005:103 110. 进一步提高了知识获取的快捷性和准确性,为气象知 识共享提供了一个更加便捷的平台。 聊天机器人须具有结构完善的规则库,这对规则 本体的构建提出更高的要求。要使本体聊天机器人能 够推广应用到更广泛的领域,必须进一步完善、规范 规则领域本体构建方法,特别是研究设计规则本体的 【12】王伟辉,耿国华,周明全.规则软件系统模式匹配算法研究 综述【JJ.,J、型微型计算机系统,2012,33(5):913-920. [1 3J杜均,蔡之华,陈云亮,等.规则树一栅格图像分层次关联规 则提取方法【JJ.计算机工程,2005,31(1 1):85・87. 【14】武婉萍.网络机器人的交互功能设计与实现【D】.成都:电子 科技大学,2012:1—76. 【15】HuangChangning,ZhaoHai.Chineseword segmentation:A 自动构建方法,将极大地促进领域聊天机器人的推广 应用。 dec ̄e review[J].Journal ofChinese Information Processing, 参考文献 【1]李冠林,顾大权,侯太平,等.气象信息主动服务系统的实现[J】 计算机应用,2013,33(S1):109一l1 1. 2007,2 1(3):8—20. [16】李玉敏.电子商务订单实时处理的软件机器人实现【JJ。吉首 大学学报(自然科学版),2009,30(3):48—5 1. 2016年第37卷第4期自动化与信息工程17 The Design and Application of Chat Robot Based on the Ontology Wang Lei Wei Yong Di Jianxun Yang Xiaolin (31008 Troop) Abstract:According to the characteristics of intemet searching technology in the professional field which has too much correlation useless information and need people to filter useful information manually,the paper summarizes the development and S ̄tus quo of chat robot.On this basis,we introduce the ontology technology as the storage carrier of chat robot rule repository. Based on the tree structure of ontology,the paper designs the rule matching algorihm.Through tthe system planning and module dividing,we build a chat robot which Can not only chat wih people tbut also solve meteorological professional problems.The paper, as it were,promotes the development and application of chat robot in the professional field,and provides a more convenient domain knowledge acquiing rnd shariang platform. Key Words:Chat Robot;Ontology;Rule Tree;Rule Matching Algorithm 作者简介: 王磊,男,1990年生,硕士研究生,工程师,主要研究方向:语义检索。E.mai1:449644183@qq.com 魏勇,男,1987年生,博士研究生,工程师,主要研究方向:人工智能。 (上接第12页) Numerical Simulation and Analysis of Air Flow Field Characteristics inside Countercurrent Cooling Tower Tan Xiaowei Liu Wenhao Liu Guixiong (1.SINRO(Fogang)Air—conditioning&Cooling Equipment Co.,Ltd. 2.School ofMechanical and Automotive Engineering,South China University of Technology) Abstract:Cooling tower is a most important part of coolng system.An exchange process modeli for counter flow cooling tower was established up by using 5 kinds ofmodels,such as k-e turbulence,jet flow,discrete phase,porous medium,and component transport.Numerical simulation were designed for spray area,filling area,and heat transfer area respectively.Result show that he tpredictive value of deviation within 4.2%.and found hat tthe wind coolng tiower in the filling area close to the inner wall area than the middle area,the closer to the packing layer ofthe air nliet nd ahe Carmen vorttex phenomenon more obvious,on he air tinlet near the inner wall ofthe tower and the tower bosom water collecting tray there is a low velocity flow rea.a Key Words:Counter Flow Cooling Tower;Air Flow Field;Numerical Simulation 作者简介: 谭小卫,女, 971年生 本科,高级工程师,主要研究方向:智能测量与节能控制技术。 刘文浩,男, 990年生 硕士研究生,主要研究方向:CFD数值模拟技术与应用。刘桂雄,男, 968年生 教授,主要研究方向:先进传感器技术与应用。 l8