跳至主要内容

Google 开发出一个新算法,使街景照片看起来更“无缝”一些

Google 街景里的 360 度全景照片有时候看起来并不自然,比如建筑物边缘出现的偏移或断裂现象。如果使用手机上的街景应用(Street View app)拍摄全景照片,这种情况可能更为严重。其他拍摄全景的设备也存在这个问题。这是多张照片没有很好缝合的缘故。

一张手机拍摄的出现错位现象的球形照片的局部

拍摄街景的相机是由一组 15 个相机构成,分布在一个球形表面;用手机去拍摄全景照片时,用户是站在一个固定的位置通过旋转身体来拍摄多张不同方向照片。两者都需要软件对照片进行拼接,而拼接往往并不完美。

基于光流法(Optical flow),Google 开发出一个新的算法,试图解决街景照片无法无缝对接的问题。总体的构想是,微妙地扭曲每一张输入照片,使图片的重合区的内容可以对齐。

Google Research 在博客里介绍了具体做法。简单说,这个过程分为两步。(1)确定每一对照片的重合区的对应像素(corresponding pixel)位置。(2)全局优化。扭曲照片,同时对齐重叠区域的所有对应点。

据 TechCrunch,使重叠区像素一一对应后,有一个简化数据集的过程,消除那些没有足够视觉结构数据的对应点(比如建筑物边缘),从而准确地计算一张图片到另一张图片的光流。

这个新算法的效果显著,从示例图中可以明显感受到差别。其挑战在于:确保图片的其余部分看起来“正常”。

Google 的办法类似于之前有学者发表论文所报道的“消幻影”全景的工作。那篇论文的标题是:Construction of Panoramic Image Mosaics with Global and Local Alignment(全局和局部对齐全景图像拼接的构建)。

Google 的办法的新意在于预测了密度和平滑的对应性(dense, smooth correspondences)。研究人员还解决了一个最终扭曲非线性优化的问题。

新的算法已经应用到 Google 街景的拼接工作中,一些之前扭曲、断裂、变形的全景照片可能很快就会变得正常起来了。

1. https://research.googleblog.com/2017/11/seamless-google-street-view-panoramas.html
2. https://techcrunch.com/2017/11/09/googles-improved-image-blending-means-a-more-seamless-street-view/

评论

此博客中的热门博文

Gboard 继续增加关键功能

在 Android 上,Google 拼音是一款简洁、高效的中文输入法,再加上 Google 手写输入,Google 给 Android 用户提供了一整套中文输入工具。 Google 拼音的 Windows 版本早已不再更新,用户无法同步自己的输入习惯,其 下载页面现在也无法找到了 。不过在我看来,Google 拼音仍然是 Windows 上少有的简单、可靠、美观、低调的中文输入法。这款软件即使不再更新,功能也不健全,但仍然特别好用。 在移动设备上,Google 在 Google 拼音等输入法之后又推出 Gborad,把移动设备上的输入体验提升到另外一个层次。 最近我注意到 Gboard Beta 版本增加了“剪贴板”功能。这个功能之前已有报道,现在终于可用,是一个重要的、有用的输入辅助工具。简单说就是,用户可以把自己复制的内容存放到剪贴板,如果有多次复制,剪贴板会记忆用户复制过的内容,方便用户随时选取使用。用户还可以固定某些复制的内容,使它们更为突出地显示在剪贴板里。 这显然是一个很有用的工具,如果用户经常在手机或平板上处理文字内容的话。否则,用户就必须把自己可能需要使用的复制的内容存在其他文档或者应用比如 Google Keep 里,然后一遍一遍地去复制、粘贴。这个功能使这些操作在 Gboard 应用里就可以实现。 Gboard 还改变了右下侧“确定”按钮的形状和功能。形状从圆形变成矩形。功能上,长按会出现单手操作和 Emoji(表情符号)按钮,如下图所示。这与左下角的 Emoji / 单手操作 / 设置综合按钮类似。 我认为唯一不足的地方是,Gboard(Android)中文输入法一直没有书名号(《》)按钮,只能以书名号的另外一种形式(『』)代替。 Gboard 重新设计了 Emoji 的布局,现在变成菜单在顶部,下滑式查看、选择表情符号的设计。以前是左右滑动。在贴纸、动态图(GIFs)搜索方面没有变化。 综合来看,Gboard 现在内置了包括 Google 搜索在内的 9 个关键功能,其中搜索、翻译等相关功能需要联入互联网,文本处理操作(移动光标、选取、复制、粘贴等)、剪贴板两个功能可以离线使用。主题、悬浮键盘则属于个性化键盘设置。 上述这些变化包括其他一些变化在 9To5Google 的一则报道 中有...

YouTube Music 增加播放本地音频的功能

YouTube Music 应用新增了 播放本地音频文件 的功能。如上图所示,打开 YouTube Music 后在“Library”(库)一栏可以找到单独的一个列表,显示出设备上可播放的文件。 我通过 Google Podcasts 下载的若干节目音频通过 YouTube Music 可以播放收听,而且能够背景播放。免费版 YouTube Music 流媒体播放音乐时,是不支持背景播放功能的。 注意,如果用户所处的国家或地区不支持 YouTube Music 服务,那么这个播放本地音频文件的功能就不可用,因为 YouTube Music 界面都不会正常显示。可是,当用户处于离线状态时,YouTube Music 却可以播放这些音频。令我感到奇怪的是,我下载的一些播客可以播放,新近下载的一些又不能播放,不知道具体机制是什么。 9To5Google 网站 认为这是 YouTube Music 取代 Google Play Music 作为 Android 默认音频播放器的重要一步。

Google Chrome 增加 DuckDuckGo 搜索

Google Chrome 浏览器增加了 DuckDuckGo(DDG)搜索引擎选项,据 TIME 报道。DuckDuckGo 是一款注重隐私的搜索引擎,它不记录用户的搜索历史,加密用户的搜索,不允许广告商追踪用户的浏览习惯。 Chrome 在全球 60 多个市场添加了 DDG 这个选项 ,给用户更多选择。法国用户还可以选择法国的搜索引擎 Qwant 作为自己的默认搜索。之前,用户需要安装 DDG 的 Chrome 扩展以切换到自己喜欢的搜索服务里。 DDG 创始人赞赏 Google 意识到给用户提供能够保护隐私的搜索服务这一选项的重要性。 DDG 的名称较长,用户记起来比较不容易。去年年底, Google 将自己所拥有的网址 Duck.com 移交给 DDG 。不清楚 DDG 是否因获得此域名而有掏钱给 Google。以前,用户输入 Duck.com 会被导向 Google 网站。Google 获得 Duck.com 域名是因为收购了视频技术公司 On2。Google 还拥有大量域名,包括对 Google 这个词拼写错误的很多情况。 Chrome 增加 DDG 搜索在当前显得尤为必要,因为不少用户希望使用更能保护自己隐私和数据安全的服务。Chrome 一直以来都默认提供若干搜索引擎供用户选择,在中国大陆有360、百度、搜狗、Bing。 DDG 的创始人 在 Quora 有文章 阐述 DDG 与 Google 搜索的不同及其优势所在。