大规模3D数据集ScanNet：让机器人理解真实世界-bet9九卅娱乐

时间：2024-11-17 21:19:01 文章作者：bet9九卅娱乐点击：次

本文摘要：按：国际计算机视觉与模式识别顶级会议CVPR 2017于 7 月 21 日—7 月 26 日在美国夏威夷开会。

按：国际计算机视觉与模式识别顶级会议CVPR 2017于 7 月 21 日—7 月 26 日在美国夏威夷开会。(公众号：)记者团也兹回国夏威夷为大家带给一手报导。在会上，许多卓越的青年学者都将讲解自己的研究和论文，也不会对部分内容不作讲解。

Angela Dai 是斯坦福大学的一名博士生，在 CVPR 上有一个 Spotlight talk，主要讲解 ScanNet，一个享有标示过 3D 室内场景重构信息的大规模 RGB-D 数据集。她最初的点子是，推展数据短缺的机器学习算法的发展，特别是在 3D 数据上。

3D 数据包括更加多信息，比如比如大小和物体之间的距离。但 3D 数据更加无以提供，为其加到标示也更加无以，现在 3D 数据并不多。Angela期望用 ScanNet 创建一个可拓展数据采集框架。他们首先必须搜集3D 修复数据，然后用有效地的方式对数据展开标示，以便搜集更加多数据。

目前团队早已搜集大约 1500 个 RGB-D 的视频序列，通过 iPad 应用于特深度传感器而搜集的。然后视频不会被上传遍服务器，并被自动修复。然后，视频不会被给到亚马逊 Mechanical Turk，将标示工作众包在过来。

数据标示是在一个等价的 3D 场景中，绘制出有物体，例如，绘制一个椅子、桌子或者计算机，从而理解什么是什么，以及所在位置。每个图像一般来说必须 5 个人来标示。

扣除数据可以在做到物体分类这样的训练任务时，作为标准参照。ScanNet 数据集可以协助必要在 3D 数据上训练算法。

例如，如果有一个机器人在房间移动，它必须辨识房间里有什么对象，而且不仅必须辨识远处有一个物体，还要确认这个物体是什么。Angela 和团队还在现实数据上做到了几个场景解读的基准测试。因为现在有数的大型 3D 数据集都是制备的，这与现实世界搜集的 3D 数据有相当大有所不同。

一般来说情况下，如果你通过制备数据库来训练算法，当算法用作现实数据时效果会过于好，因为计算机并没自学到现实世界的数据特征。现实中有很多噪音，很难仔细观察到一个对象的全部特征。基准测试指出，计算机在现实数据中的训练效果，比在制备数据中的训练效果要好得多。

现实数据以后不会有更大的市场需求。Angela 以前仍然在研究 3D 修复，研发动态的 3D 修复系统，但她后来找到很难运用于实践中，因为缺乏对于场景的语义解读。

在一个场景中，人们不会期望告诉物体在哪个方位，究竟是什么物体，这样还可以有虚拟世界助手或聊天机器人一样的东西，协助做到场景的交互。这也是她研发新的数据集的原因。另外，除了众包在标示任务，他们也期望能众包在场景修复任务。

除此之外，在语义解读方面还要做到很多工作。但他们现在的任务是，解决问题物体辨识。

3D 场景数据未来还不会有更加多有意思的应用于。Angela 还很感兴趣于将真实世界的数据与制备的 CAD 模型结合，相关联一起。这么做到的一个益处是，制备数据较为更容易取得而且更容易操作者，如果制备数据与现实数据创建了联系，那就可以让在模型上训练的系统，更容易迁入到现实数据上。当然，更加最重要的任务是给 3D 数据彰显语义说明，这不利于使机器人更佳地解读世界。

关于ScanNet的论文，在这里iTunes。版权文章，予以许可禁令刊登。

下文闻刊登须知。

本文关键词：bet9九卅娱乐,BET9官网在线登录,bet9官网登录手机入口,BET9十年信誉备用登录入口,BET9登录入口网址

本文来源：bet9九卅娱乐-www.pxky01.cn

标签：bet9九卅娱乐 BET9官网在线登录 bet9官网登录手机入口 BET9十年信誉备用登录入口 BET9登录入口网址

上一篇：首款5G芯片瞄准物联网周晨详解紫光展锐5G图谋_BET9十年

下一篇：一脸鲜肉模样扎克伯格早期采访视频曝光_bet9官网登录手机入

新闻资讯

大规模3D数据集ScanNet：让机器人理解真实世界-bet9九卅娱乐

【随便看看】

【产品推荐】