基于Python智能机器人多渠道知识库推送仿真 - 快商通

免费试用

基于Python智能机器人多渠道知识库推送仿真

作者:快商通发布时间:2020年10月09日
摘要:
机器人知识推送是智能化发展的必然产物,当前相关研究成果存在召回率和推送结果用户满意度较低的问题,提出基于 Python 的智能机器人多渠道知识库推送方法。利用离线和在线的方式对访问和浏览信息进行识别,离线信息识别中,对采集到的信息结构进行分析,检测出信息的特征,动态添加字符串,将得到的特征与关键词知识库中的数据特征进行配准,判断出是否识别关键词; 在线信息识别中,基于Python语言,分别结合百度云识别和云聊天以及百度云语音三个体系,实现信息的在线识别。利用信息语义相似度给出知识库推送的详细过程,对义项之间的相似程度进行计算,获取关键字或关键词的相似程度,将相似度比设定阈值大的信息保存起来,将此类信息推送给使用者。实验结果表明,上述方法查全率和用户满意度均较高,是一种可行性很强的知识库推送方法。

前言
知识经济时代发展速度非常快,其创造价值的形式由有形资本知识转向了无形资本知识。智能机器人是高科技发展的产物,其在正常工作中,相对应的知识推送十分重要,知识推送的整个过程,即为一个无形资本知识配准的过程。当用户提出某些访问或者申请时,机器人要给出相应反应。以维持对话的连续性为目的,机器人要具备反应精确性较强的特点,这为知识库推送提出了难题。为更好地适 应当代发展和智能化进步的需求,研究出一种适用性较强的 智能机器人多渠道知识库推送方法显得尤为重要。
 
赵新灿等人以增强操作体系的真实感,使操作者能够更好地与工作环境融合融合为目的,将领域知识应用至是动态的目标识别和知识配准推送中。研究过程中,利用离线解析与切分虚拟样机模型设计并构建含有多视角云特征与装配约束条件的资料知识库。然后采用动态形式采集场景点云数据同时得到CVFH、FPFH特征,通过领域知识库中各个视角的点云特征数据和点云CVFH特征进行比较,完成目标检测,同时根据FPFH特征通过匹配完成目标状态判断。最后,通过装配约束知识库完成远程机器人运行状态信息的知识库推送。鲍劼等人指出人工智能技术发展迅猛,已经在很多领域被广泛应用,以应用至智能图书馆的情况为例进行研究。利用智能机器人在图书馆中进行一系列智能化服务,能够高效提升图书馆整体服务质量和效率,并为智能图书馆未来建设提供更加可靠的参考案例。通过语音技术和麦克风阵列以及知识库等技术,将中国矿业大学的图书馆当作对象,设计并实现高校图书馆机器人,同时探讨机器人知识推送的新模式。该机器人能够实现语音互动和咨询等服务,利用知识配准推送的形式满足读者互动式的体验,并将其作为高校图书馆未来智能化发展的重要方向。智能机器人多渠道知识库推送是科技发展的重要研究方向,上述相关研究成果存在召回率和推送结果用户满意度较低的问题。为此,提出基于 Python 的智能机器人多渠道知识库推送方法。
信息识别总体结构
信息识别总体结构
基于 Python 的智能机器人多渠道知识库推送
信息识别
要得到理想的推送结果,提升用户满意度,需要设计一 个信息识别平台,方便给出对应推送数据。信息识别主要分为两部分,一为离线信息识别,二是在线信息识别。具体识 别过程如下所示。
 
1、离线信息识别
该部分使用到的是信息识别模块结合控制板的方案,信息识别模块对用户信息进行识别,利用串口通讯接口能够使用串口信息配置软件。过程中,先利用配置软件把所需识别 的关键字或者关键词基本信息实行配置,在正常运行中该模 块有了配准的信息则会向串行的接口反馈相应字节,利用控制板得到相应字节给出响应。
离线信息识别流程图
离线信息识别流程图
离线信息识别原理为: 对采集到的信息结构进行分析,然后检测出信息的特征,将得到的特征与关键词中 的数据特征进行配准,以获取推送结果。
2、在线信息识别
因智能机器人多数为在线工作,在该部分中,基于Python语言,分别结合百度云识别和云聊天以及百度云语音三个体系,实现信息的在线识别,以提升知识库推送的召回率。 假设用户给出的信息为文本信息,则不予考虑,直接在知识库中搜索相匹配的数据推送给使用者。但当使用者和智能机器人是语音交互时,机器人首先要做到的是利用麦克  风对语音信息进行采集,该部分组件给出的语言版本为Python,这是一个跨越各个平台的I/O库,能够在Python将语音播放出来。把利用麦克风收到的语音信息转换成一个wave文件,利用无线网络将文件发送至百度语音识别平台中。该平台利用智能算法,将语音文件转换成文本信息形式,再到知识库中进行配准,经无线网络重新传输至智能机器人端。当前百度已经对外开放了有关云语音识别的系统,主要特性为:为设计开发人员提供出了依据百度大脑的声学模型以及语音模型;使用http的形式进行请求,能够适合应用在任何平台中的语音检测中; 使机器人更加高效地理解用户表现出的意图,提高用户满意程度。
义项相似程度计算
经前面分析可知,在人机交互过程中,会存在离线和在线推送两种方式。但无论是哪种方式均离不开在机器人知识库中检索并配准得到用户提出的关键字或者关键词。接下来以知识库信息配准推送为主进行研究。在互联网的不断普及与应用中,语义数据形式也变得多种多样,这些语义数据也影响着人机交互时机器人的反映。人机交互时语义之间存在的关系,在很大程度上决定了机器人知识库推送。在信息论中描述两个字或者两个词之间存在相似程度的形式可表示为公式:
义项相似程度计算公式
式( 1) 中,logp( common( A,B) ) 代表描述 A、B 间存在的共性需要的数据量,logp( description( A,B) ) 代表完整地描述A、B 需要的数据量。基于式( 1) 计算,利用信息语义相似度实现知识库推送。A、B 需要的数据量。基于公式计算,利用信息语义相似度实现知识库推送。为了提升推送结果的精确度,提高用户满意度,推送过程中,对义项之间的相似程度进行计算,获取关键字或关键词的相似程度,然后将相似度比设定阈值大的信息保存起 来,将此类信息推送给使用者。在知识网络结构中,词语构成部分为义项,与之相应的是一条记录,各义项根据多个义原构成,义原的层次结构是一个树形框架,如下图所示:
义原层次结构
义原层次结构
对义原结构进行一个整体遍历能够获得两个义原之间存在的距离,结构中的节点间距离就是两个义原间存在的长度。由此词语相似程度可转换成义原相似程度的计算,利用义原相似程度组合能够获取义项相似程度,基于义项相似程度计算,获取词语之间的相似度,详细过程为:
1、获取义原之间相似程度
综合考虑智能机器人知识库具备的特性,其和一般的语义词典存在很大差异。义原是最为根本且不可分割的单位, 此时一般会通过很多义原表征每个定义[8]。比较常用的义原间存在的关系为上下位、反义、同义等形式,考虑到机器人多渠道知识库的特性,计算义原间相似程度采用上下位关系形式,通过层次结构树中的各义原间相互关系获取词语相似程度,如式( 2) 所示
计算公式
式中,α 代表一个能够改变的参数,描述了相似程度是 50%时路径长度。基于义原树深度一般会将 α 值定义为 1.6。 dist( s1,s2) 描述的是两个义原在结构中存在的距离。通过实际研究可知,义原间距离不是表示义原间相互关系,义原 间相对位置对于两者间关系会产生比较大的影响。

2、对两个义项之间的相似程度进行计算
现实生活中的文本除了含有实词,还会含有虚词,实词与虚词在实际中是无法相互替代的,在此将实词与虚词间相似程度记作 0,只计算相应句法义原或者是关系义原间存在的相似程度。由此,针对实词而言虚词定义的相似程度计算相对简单,该部分主要将实词当作重点进行研究,不会 对虚词进行过多研究。
知识库配准推送
针对实词定义的语义表达,机器人知识库对实词的描述 主要为以下几方面:
1) 第一独立义原表达式: 该部分义原是最为关键的部分,且和其余几部分处于相互独立的状态,把两个义项的第一独立义原相似程度记作 sim1( s1,s2) 。
2) 其独立义原表达式: 其余独立义原指的是除了第一独立义原之外的全部义原。把两个义项的该部分相似程度记作 sim2( s1,s2) ,此部分值为独立义原相似程度最大组合序列进行加权之后求得的均值。
3) 关系义原表达式: 该部分指的是利用关系义原描述的语义表达式,将两个义项该部分相似程度记作 sim3( s1,s2) ,该部分的值为关系相同义原构成的最大值。
4) 符号义原表达式: 语义表达式中通过符号描述的义原即为符号义原,两个义项该部分的相似程度可记作 sim4( s1, s2) 。
综上,两个义项整体的相似程度表达式为
计算公式

式中,βi 代表一个变化的参量,通常基于经验确定。由于一个定义最主要特征根据第一独立义原表达式反映,因此其取值通常要比 0.5 大。在实际应用中,当 simi 极小时,但 sim3 或者 sim4 较大时,计算公式可优化为:
计算公式
综上,能够较为精准地描述出义项的相似程度,当考虑到机器人自身的一些约束,第一独立义原在定义描述过程中 有着十分关键的作用,且该部分和其部分处于相互独立的状 态。当第一义原部分相似程度较低,其三部分相似程度针对 整体相似程度对知识配准推送起到的作用也不是很大,但式 ( 4) 针对其三部分的约束,在一定程度上违背了机器人正常运行时的一些规定。由此,对式( 4) 进行优化,则有
计算公式5
综合上述计算与分析,能够很精准地描述出义项相似程度。
3、获取词语相似程度
设定存在两个词语W1 、W2 ,W1 组成部分为m 个义项,W2组成部分为 n 个义项,各词语义项分别为 C1i( i = 1,…,m) 、 C2j( i = 1,…,n) 。其中,W1 和 W2 表达式分别为:
W1={C11,C12,…,C1m} 
W2={C21,C22,…,C2n}
两个词语相似程度是义项 C1i 、C2j 所有组合里相似程度最大的值,如式( 8) 所示,也就是词语相似程度是全部义项的相似程度最大值:
公式
4、知识推送
根据改进公式能够准确计算两个实词间相似程度,利用 用户访问和浏览与机器人知识库数据进行配准,将能够满足 某相似度阈值的知识推送给决策端。

实验结果与分析
为验证基于 Python 的智能机器人多渠道知识库推送方法有效性,进行一次实验,实验平台搭建在 MATLAB 上。对本文所提方法整体性能进行验证,实验用到的数据集合分别为 Lymphography 数据集、Glass Identification 数据集以及 Housing 数据集,以访问和响应的方式开展测试。其中,在各数据集合中加入 70 个新知识,新加入的知识中有一半和Lymphography 相关。
验证本文方法的指标为:
1)召回率
2)用户满意度
召回率表示查全率,从实验结果中可以看出,本文提出的基于Python的智能机器人多渠道知识库推送方法利用离线和云在线两种信息识别方式对访问信息结构和特征进行 识别,且在线识别过程中结合了百度云识别和云聊天以及百 度云语音三个体系,有效提升了知识库推送的召回率。
图 5 中,明显本文方法推送结果的用户满意度最高。该方法在对访问信息进行识别时,使用到的百度云语音识别平 台能够使机器人更加高效地理解用户表现出的意图,从而在 一定程度上提高了用户的满意程度。以提升推送结果的精 确度和用户满意度为目的,基于义项之间的相似程度获取推 送内容,进一步增强了所提方法可靠性。
不同研究成果推送召回率对比
图中为相似度阈值对召回率的影响,其中将相似度阈值分别定义为 0.5 和 0.7。实验结果显示,相似度阈值越大则召回率越低,反之越 高。主要原因为随着相似度阈值的增加,判定条件会越来越 严格,由此符合条件的知识就会比较少,推送的知识数量就 会相应减少。
总结:
鉴于当前相关需求,提出基于 Python 的智能机器人多渠道知识库推送方法。过程中,利用访问信息结构特征识别为 知识推荐奠定基础,通过相似程度计算得到推送内容,实现 机器人多渠道知识库推送。实验结果显示,本文方法性能相 较当前相关成果更为优越,具有鲁棒性。

相关推荐文章:
智能客服机器人工作原理

在线客服免费试用,输入手机号即可

免费试用
权威认证

ISO27001信息安全管理 高新技术企业 CMMI3

联系我们

服务热线:400-900-1323

地址:厦门市集美软件园三期B20栋11-13层

扫码关注微信公众平台

仅需10秒,立即免费试用!
企业
行业
  • 请选择行业
  • IT/通讯/电子
  • 电商行业
  • 互联网
  • 房地产/建筑业
  • 工艺美术
  • 婚纱摄影
  • 交通/运输/物流/仓储
  • 教育行业
  • 金融业
  • 旅游/餐饮/娱乐/休闲/购物
  • 贸易/批发/零售/租赁业
  • 能源/矿产/环保
  • 农、林、牧、渔业
  • 生产/加工/制造
  • 食品业
  • 文化/传媒/体育
  • 医疗/美容
  • 医药行业
  • 政府/非盈利机构
  • 咨询业
  • 医疗行业
  • 服务业
  • 其他