跳至主要内容

CNBC 参与了解 Google 搜索算法是如何被调整的

CNBC 参与了 Google 内部的一个会议,当中搜索高管们讨论了是否应该在某些搜索结果旁边放置图片的提议。这也许能够揭示一点关于 Google 是如何调整其算法的信息。

1. 算法基础。

20 年前 Google 发布的 PageRank 把评价一个网页的相关度与这个页面被索引的次数关联起来。也就是说,一个被很多网页索引的网页,是比较重要且有用的网页。

PageRank 仍然是 Google 算法的一个考虑因素,但还有其他因素。Google 不公开这些因素,就是为了避免有人利用这些信息来操控系统。算法保密也使 Google 能够领先于竞争对手。

2. 搜索质量评估员。

Google 在全球招募约 10 000 名搜索质量评估者,把新旧算法的搜索结果并列排在他们面前,听取他们的反馈信息。

评估员并不是单纯地主观判断搜索质量好坏,有评估指导原则需要遵守。评估原则会告诉评估员算法应该怎么做。

7 月,指导原则进行了大幅更新,把页面作者的声誉考虑在内。意味着一个网页页面如果没有明确的作者,其排名可能受到影响。

CNBC 在参与的会议中发现,Google 搜索高管从了解提议到作决定只用了 20 分钟。团队成员只用数据说话,没有激情的讨论和哲学式的解释。

这就是 Google 运营的核心特点,完全以指标驱动,用数据指导决定。

3. 纠结的地方。

测试、呈现数据、下决定很直接,但选择做什么测试,则很纠结。

Google 听取用户的反馈。Google 搜索有出现重大失误的时候。这时候,Google 并不是简单地移除这些结果就宣称大功告成了,而是会考虑如何调整算法和评估原则,以避免类似的问题再次出现。

Google 搜索并没有太多个性化,这也是纠结的一个问题。

Google 搜索的个性化较少,只有基于位置和刚刚搜索过的关键词的个性化。有员工长期以来认为 Google 应该增加更多个性化的内容,但测试后 Google 发现个性化对改善搜索结果作用有限。

没有较多个性化,Google 也避免了受到类似于 Facebook、Twitter、YouTube 所遭受的“过滤气泡”的批评。我觉得“过滤气泡”也可以称为“网络回音室”,指社交平台往往会给用户打造一个封闭空间,用户选择接收的信息都是用户已经提前认可或相信的内容。

个性化不仅效果不佳,还可能让人们对 Google 失去信任。Google 广告有很强的个性化,这是因为 Google 收集了用户大量的数据。

Google 搜索还会出现这样或那样的问题,这不可能完全避免,有的是人为破坏,或者是算法问题,或者是社会固有偏见造成的。

搜索结果不可能完美,所以 Google 的工作人员会不断地去改进它。

https://www.cnbc.com/2018/09/17/google-tests-changes-to-its-search-algorithm-how-search-works.html

评论

此博客中的热门博文

Gboard 继续增加关键功能

在 Android 上,Google 拼音是一款简洁、高效的中文输入法,再加上 Google 手写输入,Google 给 Android 用户提供了一整套中文输入工具。 Google 拼音的 Windows 版本早已不再更新,用户无法同步自己的输入习惯,其 下载页面现在也无法找到了 。不过在我看来,Google 拼音仍然是 Windows 上少有的简单、可靠、美观、低调的中文输入法。这款软件即使不再更新,功能也不健全,但仍然特别好用。 在移动设备上,Google 在 Google 拼音等输入法之后又推出 Gborad,把移动设备上的输入体验提升到另外一个层次。 最近我注意到 Gboard Beta 版本增加了“剪贴板”功能。这个功能之前已有报道,现在终于可用,是一个重要的、有用的输入辅助工具。简单说就是,用户可以把自己复制的内容存放到剪贴板,如果有多次复制,剪贴板会记忆用户复制过的内容,方便用户随时选取使用。用户还可以固定某些复制的内容,使它们更为突出地显示在剪贴板里。 这显然是一个很有用的工具,如果用户经常在手机或平板上处理文字内容的话。否则,用户就必须把自己可能需要使用的复制的内容存在其他文档或者应用比如 Google Keep 里,然后一遍一遍地去复制、粘贴。这个功能使这些操作在 Gboard 应用里就可以实现。 Gboard 还改变了右下侧“确定”按钮的形状和功能。形状从圆形变成矩形。功能上,长按会出现单手操作和 Emoji(表情符号)按钮,如下图所示。这与左下角的 Emoji / 单手操作 / 设置综合按钮类似。 我认为唯一不足的地方是,Gboard(Android)中文输入法一直没有书名号(《》)按钮,只能以书名号的另外一种形式(『』)代替。 Gboard 重新设计了 Emoji 的布局,现在变成菜单在顶部,下滑式查看、选择表情符号的设计。以前是左右滑动。在贴纸、动态图(GIFs)搜索方面没有变化。 综合来看,Gboard 现在内置了包括 Google 搜索在内的 9 个关键功能,其中搜索、翻译等相关功能需要联入互联网,文本处理操作(移动光标、选取、复制、粘贴等)、剪贴板两个功能可以离线使用。主题、悬浮键盘则属于个性化键盘设置。 上述这些变化包括其他一些变化在 9To5Google 的一则报道 中有

Google Chrome 增加 DuckDuckGo 搜索

Google Chrome 浏览器增加了 DuckDuckGo(DDG)搜索引擎选项,据 TIME 报道。DuckDuckGo 是一款注重隐私的搜索引擎,它不记录用户的搜索历史,加密用户的搜索,不允许广告商追踪用户的浏览习惯。 Chrome 在全球 60 多个市场添加了 DDG 这个选项 ,给用户更多选择。法国用户还可以选择法国的搜索引擎 Qwant 作为自己的默认搜索。之前,用户需要安装 DDG 的 Chrome 扩展以切换到自己喜欢的搜索服务里。 DDG 创始人赞赏 Google 意识到给用户提供能够保护隐私的搜索服务这一选项的重要性。 DDG 的名称较长,用户记起来比较不容易。去年年底, Google 将自己所拥有的网址 Duck.com 移交给 DDG 。不清楚 DDG 是否因获得此域名而有掏钱给 Google。以前,用户输入 Duck.com 会被导向 Google 网站。Google 获得 Duck.com 域名是因为收购了视频技术公司 On2。Google 还拥有大量域名,包括对 Google 这个词拼写错误的很多情况。 Chrome 增加 DDG 搜索在当前显得尤为必要,因为不少用户希望使用更能保护自己隐私和数据安全的服务。Chrome 一直以来都默认提供若干搜索引擎供用户选择,在中国大陆有360、百度、搜狗、Bing。 DDG 的创始人 在 Quora 有文章 阐述 DDG 与 Google 搜索的不同及其优势所在。

Google解释为什么巴勒斯坦没有在Google地图上标记出来

一个位于加沙的记者组织注意到巴勒斯坦国在Google地图上完全消失,以色列取而代之,引发中东媒体报道和网友愤怒,继而出现对Google的抵制和网络请愿活动。巴勒斯坦记者论坛谴责Google的犯罪行为,要求Google撤销其决定,并向巴勒斯坦人民道歉。 网友指出,巴勒斯坦地区在地图上的显示是:划定界限但未予标记。Google宣称,7月25日Google地图并没有删除巴勒斯坦,对这一区域的标记从未改变过,也从未标记过“巴勒斯坦”。Google承认,出现了一个故障(Bug)致使“约旦河西岸”和“加沙”标记被移除,Google随后恢复了此标记。 此外,点击此区域内的城市,Google的确将其标记为“巴勒斯坦的”,“巴勒斯坦”被视为法理上的主权国家,2013年联合国指定将“巴勒斯坦领土”称呼改为“巴勒斯坦“。 与Google地图不同的是,Bing地图的确将巴勒斯坦标记出来,部分巴勒斯坦人表示已转至Bing地图。Apple地图则既没有标记此区域,也没有将其与以色列划分开。 此事表明,Google、Apple、微软等公司在如何呈现某一地区时必须小心谨慎。Google地图利用内置的、第三方和公共数据,仍然需要额外注意政治敏感地区的标识。 《华盛顿邮报》的作者继续指出Google知识图谱的错误或偏差。例如,将台湾列为独立的国家;将爱尔兰第四大城市称之为”德里“,一个非正式而属于民族主义的称谓;将耶路撒冷归为以色列的首都;克里米亚的归属则根据搜索来自乌克兰或俄罗斯而不同。 奇怪的是,天涯论坛早在2010年就有人开始讨论此事,即Google地图上没有巴勒斯坦。最后的一条回复出现在2013年,其判断是Google被封杀有一定的道理。疑问是,帖子的发布者没有给出任何截图或网络报道连接,怎么就能够对这种消息展开讨论或判断? 关于Google知识图谱的错误或偏差,我个人认为了解事实需要个人的分析判断。知识图谱并不是完全地准确,甚至会有错误,用户可以随时进行反馈指出哪些内容不准确。维基百科,新闻报道,也都不可能是绝对的准确和权威。无论是人类的工作还是机器的生成,都可能存在不足之处。好在,人是具有这种获知准确信息的能力的,只要愿意。 Engadget报道 https://www.engadget.com/2016/08/10/google-explains-why-p