0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌搜索算法究竟是怎么工作的?为什么谷歌不做搜索结果个性化?

DPVg_AI_era 来源:未知 作者:李倩 2018-10-04 09:04 次阅读

谷歌搜索算法究竟是怎么工作的?谷歌如何调整和改变其搜索算法,依据的标准和进行的测试是怎样的?为什么谷歌不做搜索结果个性化?本文告诉你全部答案。

自特朗普总统指责谷歌操纵搜索结果以来,谷歌一直否认其搜索系统存在任何政治偏见。

Google一下,净说我坏话!

尽管谷歌的个别员工在政治领域倾向于自由派,但没有证据表明搜索引擎的结果故意偏向任何特定的意识形态。

监管机构和Yelp等竞争对手批评谷歌通过其他网站的信息增强自己的服务,如地图,职位发布,商业评论和旅游信息等。去年,欧盟对谷歌的购物搜索结果开出了27亿美元的反托拉斯罚单,美国司法部副部长Jeff Sessions则公开调查包括谷歌在内的科技企业是否正在扼杀竞争。

为了揭开它如何运行其搜索引擎的神秘面纱,谷歌邀请CNBC参加了一个内部会议,会上搜索业务的主管们讨论是否要进行一项变动:在某些搜索结果旁边放上图片。

提议的更改很小,而且非常具体,谷歌的这项更改决定是数据驱动的。会议表明了谷歌是如何实现搜索产品的巨大复杂性和渐进式简洁的统一。

先来点基本知识:谷歌搜索的工作原理究竟是怎样的?

人们有时会对Google搜索进行拟人化,认为搜索引擎“理解”了他们的查询请求,比如用户输入“电影 排球岛”,Google返回了汤姆·汉克斯的电影《荒岛求生》的相关结果。

但是,搜索引擎其实并不知道这些词是什么意思:而只是在搜索那些词及其同义词,甚至是常见的拼写错误出现的页面,以及和这些页面相关度最高的页面。

谷歌的程序(称为网络抓取工具)会搜索互联网,从数千亿个网页中收集信息。然后将这些数据存储在一个巨大的、不断变化的索引中,记录信息的新鲜度和页面创建位置等信号。当用户在搜索栏中输入内容时,会通过所谓Google搜索“算法”的一系列规则和流程提供这些信息和信号。在此过程中,将用户的查询请求与索引中的信息进行比较,并确定出现在搜索结果顶部的页面,这些过程都在几分之一秒内完成。

20年前,谷歌刚刚成立时,其中一个搜索排名指标是PageRank,以谷歌联合创始人拉里·佩奇的名字命名。PageRank根据有多少用户链接到某页面,判断该页面的与搜索内容相关性。也就是说,如果网上很多人发现一个页面足够有用,与其建立了链接,这个页面就可能比大家都忽略的页面的相关性更高。今天,PageRank仍然是Google算法尚在使用的排名因素之一。

谷歌故意没有透露排名系统的全部指标,部分原因是它不希望人们利用这些信息来玩弄搜索系统,因为出现在搜索页面顶部可以带来大量的流量和经济利益。

对这些指标保密,也有助于谷歌领先潜在的竞争对手。

如何提升谷歌搜索排名?关注页面的专业知识、权威性和可靠性

当谷歌考虑改变搜索的算法时,会组建一个团队对一小部分真实用户进行测试,了解他们的搜索习惯,也会与名为“搜索质量评估者”的承包商团队一起调查。

Google在全球范围内约有10000名评估者,虽然他们无法直接影响搜索结果,但他们的意见有助于Google的搜索小组评估是否应该实施调整。评估者通常会同时查看新旧搜索结果,并确定哪个更好。

“更好”并不是一个纯粹主观的判断。而是会由过去发布的搜索质量评估指南文档来定义,该文档描述评估者应如何判断显示在其结果中的页面的好坏。文档内容特别关注页面的专业知识、权威性和可信赖性。

“你可以将评估指南中的内容视为我们希望搜索算法的发展方向。”Google搜索、智能助理和新闻副总裁Ben Gomes表示。“他们虽然没有告诉你算法如何对结果进行排名,但从根本上说明了算法应该做什么。”

改不改,怎么改?一切由数据驱动

谷歌在今年7月份对该指南进行了一些重大更改,其中包括要求评估者考虑页面作者的声誉。因此,作者不明的页面现在可能被评为低质量页面。

2017年,谷歌与其评估者共同进行了31584次实验,并推出了2453次搜索规则更改。虽然这些更改会对任何给定网站的排名产生巨大影响,但普通谷歌搜索用户通常根本不会注意到这些更改。

在CNBC本次受邀参加的会议中,测试团队测试了一种新的移动搜索格式,在搜索结果旁边显示网页上的照片及链接。他们假定这样做可以帮助用户更好地确定要点击哪个链接,找到与搜索内容最相关的页面。

最终评估数据显示,91%的情况下,评估者发现展示图像很有用。在实时实验中,真实用户也点击了图片。在权衡了增加图片导致延迟增加与用户体验的正反馈之后,Gomes和Nayak批准了这次调整。

这次调整并没有激烈的辩论或哲学上的探索,是数据推动了这一决定。

“对此我们有严格的测试过程,” Gomes说。“我们的改动是数据指标驱动的,这是我们运营方式的核心。”

谷歌为什么不做个性化搜索?

谷歌会倾听用户的反馈意见,包括一些由于结果错误导致的丑闻事件,比如用户曾发现谷歌将白人至上主义网站链接为“大屠杀是否发生?”的第一个搜索结果。如果出现明显问题,谷歌不仅要去掉糟糕的搜索结果。更常见的情况是,谷歌要试图弄清楚如何更改其算法及其评估指南,以避免类似的错误。

通过不对搜索结果进行个性化,谷歌摆脱了大部分Facebook和Twitter所遭受的批评——创建“过滤圈”(filter bubbles),也即用户只看到他们原本就倾向于相信或喜欢的信息。(谷歌的视频产品YouTube则无法躲开这种批评,尤其是它对于相关视频的推荐算法。这两种算法是完全独立的,不是由同一个团队创建或维护。)

个性化也可能导致人们对谷歌失去信任。虽然谷歌没有对其大部分搜索排名进行个性化,但由于其收集的大量数据(Google允许用户关于其收集的数据管理进行隐私设置,但其方法在过去一直存在误导性),其广告非常个性化。

对于所有用户测试,谷歌知道错误不可避免,有时是因为有人故意破坏,有时是则是因为算法存在问题,还有的时候是因为结果反映了社会偏见。

“我们并不认为搜索是完美的,”Nayak说:“但我们绝对致力于应对我们所面临的挑战并继续改进。这就是人们在这里做的事情。”

其他时候,算法更改的想法来自公司内部的广泛意见。 Nahak表示,一些员工长期以来一直认为谷歌搜索结果应该更加个性化。目前,谷歌搜索个性化的内容很少,现有的搜索重点是用户的位置或先前搜索的直接上下文。 (例如,如果你搜索了与棒球有关的东西,然后是“巨人队”,那么结果就不会影响到足球队。)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6166

    浏览量

    105340
  • 算法
    +关注

    关注

    23

    文章

    4609

    浏览量

    92858

原文标题:谷歌搜索歧视特朗普?全面拆解Google搜索算法及优化

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Meta开发新搜索引擎,减少对谷歌和必应的依赖

    将基于Meta AI聊天机器人进行生成。 据一位曾与Meta搜索引擎团队交流过的人士透露,Meta希望通过这款搜索引擎降低对谷歌搜索和微软必应的依赖。目前,这两家
    的头像 发表于 10-29 11:49 382次阅读

    谷歌取消“站点链接搜索框”,适应新搜索需求

    近日,谷歌发布了一则通知,决定取消搜索结果中的“站点链接搜索框”。这一功能已经陪伴了用户十多年,它允许用户在特定网站上进行更深入的搜索,为许
    的头像 发表于 10-23 11:20 336次阅读

    tas5756m使用GPIO口加内部PLL产生MCLK的方法究竟是怎么样的?

    tas5756m使用GPIO口加内部PLL产生MCLK的方法究竟是怎么样的?
    发表于 08-19 06:06

    OpenAI将推出在线搜索工具“SearchGPT”

    科技巨头OpenAI正悄然酝酿一场搜索领域的变革,其最新推出的在线搜索工具“SearchGPT”正悄然挑战着Alphabet旗下谷歌搜索霸主地位。这款被寄予厚望的新工具,目前正处于紧
    的头像 发表于 07-26 16:54 685次阅读

    AI搜索挑战百度谷歌,重塑信息检索的市场?

    自然语言处理技术理解用户的复杂查询,从而提供更为丰富和个性化搜索结果。就像搜索引擎在过去几十年里彻底改变了我们获取信息的方式一样,AI搜索
    的头像 发表于 07-04 21:15 249次阅读
    AI<b class='flag-5'>搜索</b>挑战百度<b class='flag-5'>谷歌</b>,重塑信息检索的市场?

    揭秘谷歌搜索算法工作原理,与官方声明存在矛盾

    有着十多年搜索引擎优化经验的兰德·菲什金,近日透露他收到一份长达2500页的文件,据称这是对谷歌搜索算法工作原理的真实揭示,而非谷歌官方所声
    的头像 发表于 05-29 16:00 599次阅读

    谷歌将在AI搜索中加入广告

    谷歌近日宣布,将在美国测试在人工智能生成的答案中嵌入搜索和购物广告。这一创新举措紧随其年度I/O大会上推出的人工智能概览功能之后。
    的头像 发表于 05-23 09:23 465次阅读

    谷歌将为AI搜索结果中的商品提供购物广告

    比如,顾客通过谷歌搜索如何去除衣物褶皱,AI 将为他们提供多种解决方案,同时在页面底部推荐商家提供的广告商品。谷歌表示,广告商只需提供提示词即可实现相关内容展示,无需进行复杂设置。
    的头像 发表于 05-22 11:51 572次阅读

    OpenAI计划下周一宣布对标谷歌搜索的竞品

    OpenAI即将在下周一揭晓一项重大创新,他们计划推出一款全新的AI搜索产品,以挑战当前搜索领域的巨头谷歌。这一决定无疑将加剧双方在搜索市场的竞争态势。虽然具体的发布日期之前并未公开,
    的头像 发表于 05-11 09:22 362次阅读

    STM32擦除后数据究竟是0x00还是0xff ?

    STM32擦除后数据究竟是0x00还是0xff ,百度查了许多发现大多数都是0xff的多,都说SD卡(TF)储存介质是Flash 所以擦除后为0xff,但是我遇到了读出来的数据是0x00的情况,为什么呢
    发表于 04-18 07:59

    谷歌Vertex AI搜索在医疗保健领域正式推出

    谷歌公司近日宣布,其Vertex AI搜索功能在医疗保健领域正式亮相,并已成功与MedLM以及医疗保健数据引擎(HDE)完成集成。这一创新功能专为医护人员设计,旨在从繁杂的医疗记录中快速且精准地提取出关键的临床信息。
    的头像 发表于 03-22 14:08 617次阅读

    谷歌将打击AI生成内容及内容农场,削减搜索垃圾内容40%

    谷歌产品管理总监伊丽莎白·塔克特别指出,接下来的更新主要聚焦于升级核心排名系统,从而更好地衡量网页质量、用户体验与真实性。此外,本次更新还将重点识别常见的大规模低价值内容如伪造搜索结果的垃圾网站
    的头像 发表于 03-06 15:53 687次阅读

    苹果微软曾洽购必应,因谷歌搜索质量未果

    CNBC及其他媒体引述的美国司法部反垄断公诉书详细列举了谷歌搜索领域所持的垄断角色。诉状中透露,尽管微软多次试图将必应用户作为Safari浏览器的默认搜索引擎,但每一次均因搜索
    的头像 发表于 02-25 10:39 686次阅读

    谷歌测试搜索新功能:帮用户减少等待接通客服时间

    根据谷歌的详细说明,当用户在Google搜索客服电话信息后,会在结果页面找到“Request a call”图表,提供了深入通信的意图和电话号码的填写位置。
    的头像 发表于 02-19 13:51 529次阅读

    谷歌搜索引擎优化的各个方面和步骤

    谷歌搜索引擎是最受欢迎和广泛使用的搜索引擎之一,为了使你的网站在谷歌上更好地排名并提高曝光度,你可以采取一些谷歌
    的头像 发表于 01-25 10:29 881次阅读