0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种改变标准的谷歌关键词搜索的新方式

DPVg_AI_era 来源:未知 作者:胡薇 2018-04-17 11:28 次阅读

昨天,谷歌发布“Talk to Books”(撩书??)和一个名为Semantris的游戏。这两项都是基于自然语言文本理解,用户能够凭语义而非关键词来实现搜索功能。这些创新来源于“在向量空间中表示语言”想法的延伸,以及词向量模型的发展。

未来的搜索,可能不需要输入关键词,直接表达想法就好。

谷歌昨晚放出大招:上线Semantic Experiences(语义体验)网站,网站有两项特殊功能,一个是“Talk to Books”(撩书??),一个是名为Semantris的语义联想游戏。

这两个大招都是基于自然语言文本理解,用户能够凭语义而非关键词来实现搜索功能。

过去几年里,自然语言理解(Natural language understanding)有了很大发展,部分原因是词向量(word vectors)的发展使得算法能够根据实际语言使用的例子来理解单词之间的关系。这些向量模型根据概念和语言之间的等价性、相似性或相关性将语义上相似的短语映射到相近的点。去年,谷歌已经使用语言的分层向量模型(hierarchical vector models)改进了Gmail的智能回复。

当“Talk to Books”时,只需要输入模糊的词汇,算法模型会在超过10万本书中搜索对应的每一个句子,以查找最有可能在对话中匹配的书籍,摆脱了以往通过书名或作者的搜索方式。

“Semantris”是一个单词语义联想游戏,当输入单词时,游戏会对屏幕中所有单词进行评分,简单有趣。

这篇博客由著名的未来学家、谷歌研究的工程总监Ray Kurzweil和产品经理Rachel Bernstein发布,博客地址:

https://research.googleblog.com/2018/04/introducing-semantic-experiences-with.html?m=1

游戏试玩地址:

https://research.google.com/semantris/

谷歌还公开了论文“Universal Sentence Encoder”,论文中详细描述了这些示例所使用的模型。此外,谷歌Semantic Experiences网站还在TensorFlow平台上提供了一个预先训练好的模型供其他研究人员进行实验。

不用关键词,轻松去“撩书”

“Talk to Books”可以让用户与用机器学习训练的算法进行对话,该算法可以从人写的文本中找到相关段落的答案。

“撩书”的方法很简单:你只要输入一句话,这句话可以是一个陈述句或一个疑问句,然后而“Talk to Books”会在书中找到相应的句子,完全不依赖于关键字匹配。

比如,问“为什么天空是蓝色的?”你会得到很多不同的答案,这些答案都是在清晰的文本中显示出来的,并且显示来自于关于这个主题的书籍。

这种做法改变了以往使用标准的谷歌关键词搜索的方式,并且也不需要必须点击链接并解析文章或网页。

此外,“Talk to Books”的Web界面非常整洁、完美(更没有竞价排名的医疗小广告)。

Kurzweil和Berstein说,这个模型接受了10亿次类似的训练,比如对句子进行分析,并学会识别出好的反应可能是什么样的。“一旦你问了你的问题(或者做了一个陈述),这些工具就会在超过10万本书中搜索所有的句子,找出那些根据句子层面的语义含义对你的输入做出反应的句子。你输入的和你得到的结果之间的关系没有预先定义的规则。

不过,“Talk to Books”并不是最完美的。TheVerge报道称,这个工具更适合回答原始的事实问题,而在处理复杂的地缘政治问题或现代文化和历史重要性的话题时表现不佳。

但是作为一个简单的Web工具,谷歌表示,这个技术能帮助改进像Gmail智能回复这样的产品,而且与书籍对话是一种以自然语义的方式搜索Web的有趣方式。更重要的是,它让我们意识到,当人工智能真正成熟到可以处理几乎所有我们抛出的问题时,未来的界面会是什么样子。

Semantris:开脑洞、发散思维的小游戏

跟“撩书”一起推出的是一款叫做Semantris的游戏,它主要测试用户单词联想能力。

举个例子,如果你把“床”(Bed)这个单词放在一个10个单词的最上面,你可能会把“睡眠”(Sleep)作为一种反应。Semantris将对这10个单词进行排序,并根据它认为床与睡眠之间的语义关系与列表中的其他单词之间的关系进行比较,最后还可以打分。

应该指出的是,很多谷歌实验也是公司收集用户数据的方法,通过给用户提供丰富的关于文字关系的信息,有助于信息技术的发展。这似乎是Semantris的案例,但无论如何,游戏是测试你自己能力的一种有趣的方式,看看软件如何判断单词之间的联系。

此外,你也可以玩一个类似tetris的游戏,它可以让你输入文字来清除屏幕上的文字块,根据你自己的假设,软件可以在彩色方块上的文字和你输入的答案之间的文字之间画出什么关联。

建模方法

谷歌使用的方法是“在向量空间中表示语言”这一想法的延伸,方法是为更大的语言块(如完整句子和小段落)创建向量。由于语言是由概念层次组成的,我们使用一个模块层级结构创建向量,每个模块考虑与不同时间尺度的序列对应的特征。如果以正确的方式训练,然后提出正确的“问题”,那么就可以用向量空间语言模型来表示相关性、同义词、反义词、部分整体关系、同形异义词以及其他许多类型的关系。谷歌在论文“Efficient Natural Language Response for Smart Reply”中描述了这种方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6166

    浏览量

    105340
  • 关键词
    +关注

    关注

    0

    文章

    16

    浏览量

    9810
  • 自然语言
    +关注

    关注

    1

    文章

    288

    浏览量

    13348

原文标题:谷歌发大招:搜索全面AI化,不用关键词就能轻松“撩书”

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    探索AC自动机:多关键词搜索的原理与应用案例

    引言 目前,大多数自由文本搜索技术采用类似于Lucene的策略,通过解析搜索文本为各个组成部分来定位关键词。这种方法在处理少量关键词时表现良好。但当
    的头像 发表于 08-26 15:55 872次阅读
    探索AC自动机:多<b class='flag-5'>关键词</b><b class='flag-5'>搜索</b>的原理与应用案例

    [讨论]提高网站关键词排名的28个SEO小技巧

    ) 内容中自然出现关键词 内容第段和最后段出现关键词 H1,H2标签中出现关键词 导出链接锚文本中包含
    发表于 12-01 17:08

    亚马逊代运营 amazon Search term 关键词填写的“神技”

    、转化率,且与自己产品相关的关键词,单独拿出来放进 search term 里面进行优化 listing 的操作。2.自己利用些工具去筛选出些买家搜索词,然后根据自己对产品的理解,
    发表于 06-05 15:41

    关键词优化有哪些实用的方法

    我们在做关键词优化排名的时候,有经验的seo人员都会有自己的套关于关键词应该怎么去优化排名的方法,但是对于些刚接触seo的新手来说就会比较迷茫,不知道应该怎么去做好
    发表于 08-11 01:19

    百度关键词排名掉完了怎么办

    夜之间关键词排名掉完了,没有被K,也没有出现违规操作,这是怎么回事呢?
    发表于 01-27 11:01

    #2023,你的 FPGA 年度关键词是什么? #

    FPGA 年度关键词,我的想法是“标准化”;今年的工作中遇到了不少同事的issues,本身都是小问题或者很细节的东西但是却反复出现问题,目前想到的最好的办法是做好设计规则的标准化才能避免,不知道大家有没有更好的建议?
    发表于 12-06 20:31

    2010年10大流行搜索关键词 Facebook居首

    2010年10大流行搜索关键词 Facebook居首 据国外媒体报道,调研公司Hitwise数据显示,2009年Facebook超越Myspace成为最流行的搜索
    发表于 02-25 10:39 923次阅读

    基于关键词的最优路径查询算法

    为改进基于关键词的最优路径查询算法,在大规模图以及多查询关键词下复杂度过高与可扩展性不足的缺陷,依据查询关键词序列构建候选路径的策略提出一种高效查询算法。该算法在路径构建过程中优先满足
    发表于 12-06 11:28 0次下载

    基于盲GDH签名的无记忆模糊关键词搜索

    在云计算中,用户在计算过程中的数据安全问题已经成为制约云计算发展的个瓶颈。本文针对云计算中的加密搜索问题,提出个有效的加密搜索方案。在搜索
    发表于 12-14 14:14 0次下载

    对加密电子医疗记录的关键词搜索

    被称为MCKS I的简单的多域连接关键词搜索(MCKS)方案,该方案仅支持连接相等查询,为了实现更加灵活而复杂的多域关键词连接查询,例如子集查询和范围查询,又提出了被称为MCKS II的提高方案.该方案利用了分层属性的矢量表示
    发表于 01-14 10:42 0次下载

    Chrome新增项功能 部分标签页可显示该页面关键词

    作为全球最受欢迎的互联网浏览器,Chrome的功能仍在不断丰富,从而为用户提供更无缝的使用体验。近日谷歌在Chrome浏览器中新增了项新功能,在部分标签页预览中能够显示该页面的关键词。例如在
    的头像 发表于 04-15 08:38 3285次阅读

    融合BERT向量与TextRank的关键词抽取方法

    结合文档本身的结构信息与外部词语的语义信息,提出一种融合BERT向量与 Textrank的关键词抽取方法。在基于网络图的 Textrank方法基础上,引入语义差异性并利用BERT
    发表于 03-21 09:55 18次下载
    融合BERT<b class='flag-5'>词</b>向量与TextRank的<b class='flag-5'>关键词</b>抽取方法

    一种基于和文档嵌入的关键词抽取方法

    各类应用领域的文本数据日益增多,如何从这些海量数据中迅速准确地提取核心内容,已成为关键词抽取的主要任务。提出一种基于和文档嵌入的关键词抽取方法,通过计算单词与文档在同
    发表于 04-02 14:59 4次下载
    <b class='flag-5'>一种</b>基于<b class='flag-5'>词</b>和文档嵌入的<b class='flag-5'>关键词</b>抽取方法

    一种基于位置信息的关键词自动化提取算法

    关键词提取是进行未知网络协议逆向的关键步骤。鉴于现有的关键词提取方法存在精确度不髙、需要较多先验知识、操作繁琐等问题,提出了一种基于位置信息的关键词
    发表于 04-25 13:56 3次下载
    <b class='flag-5'>一种</b>基于位置信息的<b class='flag-5'>关键词</b>自动化提取算法

    ADI年度关键词曝光,这些你肯定搜索过!

    大数据时代,每个人的搜索框在某种程度上都代表着这个人的所思所想。如果将时间放长,样本量放大,那么 份年度搜索关键词就会呈现出了这个世界上绝大部分人是如何走过这
    的头像 发表于 12-30 00:05 855次阅读