可用于智能机器人的互联网知识库都有哪些

机器人

533人已加入

描述

(文章来源:百家号)

知识工程、Web数据挖掘、自然语言处理等领域大量的研究工作,致力于大规模知识的获取,为打造机器智脑提供了丰富的知识库来源。目前互联网上可用于智能机器人的知识库包括以下各类知识:

事实知识(Factual Knowledge)是关于某个特定实体的基本事实。例如(中国,首都,北京)。事实知识是知识图谱中最常见的知识类型。大部分实体的事实可以对应实体的特定属性或者关系。很多以实体为中心组织的知识库均富含此类知识,比如DBpedia、Freebase以及CN-DBpedia等。

概念知识(Taxonomy Knowledge)分为两类,一类是实体与概念之间的类属关系,例如(柏拉图,哲学家)另一类为子概念与父概念的子类关系(Subclass,比如(唯心主义哲学家,Subclassof,哲学家)一个概念有子概念,也可能同时具有父概念,使得整个概念集合构成层级体系。概念之间的层级关系是本体定义中最为重要的部分,特定领域的概念知识是机器认知领域的基本框架。

典型概念知识图谱(有时简称概念图谱)包括Yago、Probase、WikiTaxonomy等。概念是归纳的前提,是基于概念推理的(类别推理taxonomy reasoning)依据。概念知识是一种典型的元知识(meta-knowledge)元知识除了概念知识之外还包括概念之间的属性,概念与属性的领域与约束等这些知识通常在传统的本体中加以定义与明确。

词汇知识:主要包括实体与词汇之间的关系(比如实体的命名、称谓、英文名等)以及词汇之间的关系(包括同义词、反义词、缩写词以及上下位词关系等)例如(柏拉图,英文名,“Plato”)(赵匡胤,庙号,宋太祖)、(妻子,同义词,老婆)些跨语言知识库比如BabelNet,专注于建立实体或概念之间的跨语言等价关系。
       词汇知识的自动化获取在目前的实际应用中已经取得较好效果。从丰富的领域语料自动挖掘领域词汇,并建立词汇之间的语义关联以及词汇与实体之间的关联已经成为知识图谱构建最为重要的一步。词汇知识也是相对简单的知识。人类学习某个新领域往往是从该领域的术语或者词汇开始的。因此,赋予机器认知领域词汇,是实现机器认知整个领域知识的第一步。此类典型知识图谱包括WordNet等。

常识知识:常识是人类通过身体与世界交互而积累的经验与知识,是人们在交流时无须言明就能理解的知识。例如我们都知道鸟有翅膀,鸟能飞等。再比如,若x是个人,那么x要么是男人,要么是女人。常识的表征与定义、获取与理解等问题一直都是人工智能发展的瓶颈。常识知识的基本特点是我们每个人都知道,但很少在文本里提及,使得基于文本抽取的常识获取方式效果有限。典型的常识知识图谱包括Cyc、ConceptNet等。

领域知识服务机器人需要建立人类社会与生活相关的方方面面的知识库。比如日常陪伴机器人需要具备衣食住行等各方面的知识库,当用户抱怨“空气不好”时,机器人能够开启空气净化器;当用户感冒了,机器人应该能够结合医学和用户医疗知识库提供相应的药物与生活建议;在午餐时间,机器人能通过饮食知识库推荐近期的饮食等。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分