跳至主要内容

Google 发布 AI 工具应用于解析人类基因组序列数据

Google 的研究人员(来自 Google Brain、Verily)参与开发了一个工具 DeepVariant,使用了最新 AI 技术,以从序列数据中构建更为精准的人类基因组图像。

人类基因组测序已经开展了 15 年,但从海量数据中解码更多信息,仍具有相当挑战性。世纪初,高通量测序的出现,使基因组测序更为方便可用。可是,高通量测序的数据所能提供的,只是有限而容易出错的全基因组快照。科学家很难从随机误差中识别出小的突变,尤其是基因组的重复部分。而这些突变,则很可能对应于某些疾病,比如癌症。

DeepVariant 可以帮助把高通量测序结果转变为全基因组图片。它自动识别测序数据中的小的插入和缺失突变,以及单碱基对突变。

已存在若干解读高通量测序结果的工具,它们一般是属于简单的统计和机器学习方法,通过试图排除读取错误,来识别突变。

参与帮助开发 DeepVariant 的哈佛大学公共卫生学院科学家 Brad Chapman 指出,困难之一在于对于基因组的不同部分,这些方法都有强有弱。这些不同区域对于临床测序越来越重要,所以拥有多种方法是关键的。

去年,DeepVariant 赢得 precisionFDA Truth Challenge 第一名,这项比赛是由 FDA 举办的,旨在推动更为精准的基因测序。

DeepVariant 还可通过 Google Cloud Platform 获取。Google 和竞争对手都在云平台上增加机器学习功能,以吸引那些希望使用这些技术的客户。

多家公司都在试图通过 AI 技术,梳理疾病的遗传原因,并找出潜在的药物治疗办法。

Deep Genomics 是其中之一。其 CEO 表示,DeepVariant 的成功意义重大。它表明在基因组学里,深度学习可以被用来自动训练系统,使其表现超过复杂的手工系统。他说,目前阻碍着医学发展的,是人类无法准确地构建出遗传变异与疾病机制之间的关系,并借助这些知识找到拯救生命的治疗方法。AI 终将发挥更大的作用,而不只是帮助解析序列数据。

此领域另一个领先的公司是 Wuxi Nextcode(明码生物科技)。此公司聚集了世界上最大的全序列人类基因组,并在机器学习上投入巨大。Wuxi Nextcode 在上海、冰岛雷克雅未克和马萨诸塞州剑桥有办公室。

未来几年,医学的诸多领域将借助 AI 而有长足的进步。基因组医学是其中的重头戏,因为其数据的规模和复杂度都是前所未有的。

人类对自身生物学的检测的能力,甚至应对、修正它的能力,历史上首次超过了人类理解它的能力。解析这些数据的唯一的技术是 AI,医学也将因此彻底改变。

评论

此博客中的热门博文

Gboard 继续增加关键功能

在 Android 上,Google 拼音是一款简洁、高效的中文输入法,再加上 Google 手写输入,Google 给 Android 用户提供了一整套中文输入工具。 Google 拼音的 Windows 版本早已不再更新,用户无法同步自己的输入习惯,其 下载页面现在也无法找到了 。不过在我看来,Google 拼音仍然是 Windows 上少有的简单、可靠、美观、低调的中文输入法。这款软件即使不再更新,功能也不健全,但仍然特别好用。 在移动设备上,Google 在 Google 拼音等输入法之后又推出 Gborad,把移动设备上的输入体验提升到另外一个层次。 最近我注意到 Gboard Beta 版本增加了“剪贴板”功能。这个功能之前已有报道,现在终于可用,是一个重要的、有用的输入辅助工具。简单说就是,用户可以把自己复制的内容存放到剪贴板,如果有多次复制,剪贴板会记忆用户复制过的内容,方便用户随时选取使用。用户还可以固定某些复制的内容,使它们更为突出地显示在剪贴板里。 这显然是一个很有用的工具,如果用户经常在手机或平板上处理文字内容的话。否则,用户就必须把自己可能需要使用的复制的内容存在其他文档或者应用比如 Google Keep 里,然后一遍一遍地去复制、粘贴。这个功能使这些操作在 Gboard 应用里就可以实现。 Gboard 还改变了右下侧“确定”按钮的形状和功能。形状从圆形变成矩形。功能上,长按会出现单手操作和 Emoji(表情符号)按钮,如下图所示。这与左下角的 Emoji / 单手操作 / 设置综合按钮类似。 我认为唯一不足的地方是,Gboard(Android)中文输入法一直没有书名号(《》)按钮,只能以书名号的另外一种形式(『』)代替。 Gboard 重新设计了 Emoji 的布局,现在变成菜单在顶部,下滑式查看、选择表情符号的设计。以前是左右滑动。在贴纸、动态图(GIFs)搜索方面没有变化。 综合来看,Gboard 现在内置了包括 Google 搜索在内的 9 个关键功能,其中搜索、翻译等相关功能需要联入互联网,文本处理操作(移动光标、选取、复制、粘贴等)、剪贴板两个功能可以离线使用。主题、悬浮键盘则属于个性化键盘设置。 上述这些变化包括其他一些变化在 9To5Google 的一则报道 中有

庆祝人类获得第一张黑洞照片

Google 在 首页提示并庆祝 4 月 10 号人类获得了第一张黑洞的照片。 星期三早上 NSF 的科学家宣布了所捕捉到的 第一张黑洞照片 。这个黑洞位于 M87 星系( 室女 A 星系 )的中心,星系距离地球 5 500 万光年,这个黑洞的质量是太阳质量的 65 亿倍。我们所在的银河系中心有一个质量为 400 万太阳质量的黑洞,离我们 25 000 光年。 第一张黑洞图片. 来源: CNN 全球 200 多名研究人员合作,使用 事件视界望远镜 (Event Horizon Telescope)花费十几年时间使人类第一次真正看到黑洞的样子。 第一张黑洞图片的重要性在于它证明 爱因斯坦广义相对论的公式仍然是可靠的 。1915 年爱因斯坦发表的广义相对论将引力视为当物质扭曲时空时就会发生的一种现象。反过来,扭曲的时空也能够决定物质的运动。很快, 德国物理学家卡尔·施瓦西 计算认为,当物质足够致密时,其创造的引力场使光也无法逃脱,即为黑洞。爱因斯坦并不相信施瓦西的观点。 黑洞本身并不可见,因为光线无法逃离其视界范围以内。科学家尝试观测到 视界边缘以极高速度运行的物质和辐射所形成的光环 。爱因斯坦的理论精准地预测到了黑洞的体积和阴影的样子。 今天的成就在十几年前还被认为是不可能实现的。人类看到了之前不曾见到过的景象。今天是天体物理学最为重要的一天,NSF 主管 France Córdova 说。 在这张重要的图片发布之前,YouTube 频道 Veritasium 发布了一个介绍视频,预测了黑洞图片应该会有的样子以及原因。(这是一个内容质量极高的科普频道) Brian Green 介绍了黑洞照片的相关信息。 Vox 则解释了为什么这张照片意义重大。 注:上述 3 个视频是我了解此次黑洞照片发布前后所看过的视频,链接的新闻报道也是之前浏览过的,维基百科页面有的是之前浏览过的,有的则是为编辑此文而补充的。我估计 Google 应该会用 Doodle 对这个重大的天文学突破进行庆祝,就像 月球上发现水 、 新视野号飞跃冥王星 、 日全食 等等“天文事件”一样。我频繁访问 Google Doodles 网站,发现 Google 确实没有令人失望。

Google Chrome 增加 DuckDuckGo 搜索

Google Chrome 浏览器增加了 DuckDuckGo(DDG)搜索引擎选项,据 TIME 报道。DuckDuckGo 是一款注重隐私的搜索引擎,它不记录用户的搜索历史,加密用户的搜索,不允许广告商追踪用户的浏览习惯。 Chrome 在全球 60 多个市场添加了 DDG 这个选项 ,给用户更多选择。法国用户还可以选择法国的搜索引擎 Qwant 作为自己的默认搜索。之前,用户需要安装 DDG 的 Chrome 扩展以切换到自己喜欢的搜索服务里。 DDG 创始人赞赏 Google 意识到给用户提供能够保护隐私的搜索服务这一选项的重要性。 DDG 的名称较长,用户记起来比较不容易。去年年底, Google 将自己所拥有的网址 Duck.com 移交给 DDG 。不清楚 DDG 是否因获得此域名而有掏钱给 Google。以前,用户输入 Duck.com 会被导向 Google 网站。Google 获得 Duck.com 域名是因为收购了视频技术公司 On2。Google 还拥有大量域名,包括对 Google 这个词拼写错误的很多情况。 Chrome 增加 DDG 搜索在当前显得尤为必要,因为不少用户希望使用更能保护自己隐私和数据安全的服务。Chrome 一直以来都默认提供若干搜索引擎供用户选择,在中国大陆有360、百度、搜狗、Bing。 DDG 的创始人 在 Quora 有文章 阐述 DDG 与 Google 搜索的不同及其优势所在。