这个CV数据集生成器火了,支持13类CV任务,DeepMind等打造丨开源

2022-05-21科技196

萧箫 发自 凹非寺量子位 | 公众号 QbitAI

这年头,AI玩家们想找到合适的图像数据集,简直是越来越难了。

不仅数据质量参差不齐,合适的数据类型也难找(如光流图、深度图等)。

为了解决这些问题,来自谷歌、MIT、DeepMind、MILA和剑桥大学等11家机构的34名研究人员,联手打造了一个名叫Kubric的数据集生成器,不仅能自己渲染,而且图像效果也非常真实。

不仅各种图像数据都能做,像语义分割、深度图或光流图这种“特殊数据”都能一键生成:

还能控制渲染的真实度,渲染出的视频可以达到以假乱真的效果:

据作者们表示,目前Kubric支持13类CV任务的数据类型生成,效果也不比用已有数据集训练出来的差。

这样的一个数据集生成器,到底要怎么上手?

可生成13类CV任务所需数据先来看看这个Kubric数据集生成器究竟是个啥。

简单来说,它有点像是一个专为图像AI打造的“数据车间”,基于跨平台开源物理引擎PyBullet和3D图像渲染软件Blender打造。

其中,PyBullet给用户提供了一个模拟3D物体运动的平台,例如两个球之间的弹性碰撞参数就可以用它来模拟。(当然,除了PyBullet以外,也可以扩展到其他物理引擎如MuJoCo上)

Blender则是一个渲染3D动画的平台,但它的优势在于操作方便,而且既可以做出照片级逼真的渲染图像,也可以输出3D动画效果。(例如有设计师拿它设计服装纹理)

可能这时候你会问,Kubric相比自己手动渲染视频或图像数据集,方便在哪?

一方面,Kubric自带一系列预处理的基础图像数据库。

除了11个基础3D模型以外:

还内置了Google Scanned Objects(GSO)室内家具物品数据集中的一系列模型,以及包含背景、光照、材料纹理等参数的Polyhaven数据集,还有ShapeNet数据集等(包含55种常见的物品类型及51300个3D模型)。

也就是说,如果你对渲染不太了解,也能利用内置的数据库快速生成想要的图像。

另一方面,Kubric直接提供了从“渲染数据”到输出“AI训练数据”的管道,省去了将渲染图像转成特殊数据(如深度图、光流图)、或是额外收集如视场、相机参数、光照等数据的麻烦。

这也使得Kubric支持生成13类CV任务所需的图像数据,具体包括光流、NeRF、姿态估计、3D重建等。

没错,即使这些生成的图像中有2D也有3D类型,需要的数据量也从MB到TB级别不等,但Kubric都能满足。

嗯,作者们还专门针对各种视觉任务,用Kubric生成的数据集一个个试了试,强调“用他们生成的数据集效果更好”。

△Kubric生成的光流图

那么,这样的数据集生成器究竟要怎么用呢?

自带Python接口作者提供了一些简单的操作流程。

在安装之后,第一步就是创建默认场景:

然后,再通过这两步,分别创建一块地板、和一个球体(也可以换成其他形状):

接下来就是在场景中加一个照明,以及渲染摄像头采集图像:

导出文件后,就能获取一个3D球体的图像了:

△Blender中的效果

如果需要深度图、灰度图等特殊图层的话,也是几行代码就能搞定:

比自己手动导出要更方便一些:

当然,如果还是感觉上手较难,作者也直接提供了示例代码,改改参数就能用:

在原基础上,再加5行代码就能直接运行出动态视频版:

看起来,做完数据集后,即使不懂渲染的也能成为半个行家了(doge)

目前新的一批内置数据集还在施工中,感兴趣的小伙伴可以先上手试玩~

项目地址:

论文地址:

参考链接:

— 完 —

量子位 QbitAI · 新知号签约

关注我们,第一时间获知前沿科技动态

相关文章

有没有类似天珠变之类的书?

如果是喜欢这个作者,那么唐家三少写的书都可以看看,但前期太白,后期有变水的趋向,最推荐中期作品,《琴帝》、《酒神》、《天珠变》、《神印王座》如果是喜欢武魂类的设定,推荐《杀神》,但戾气较重,不像斗罗般阳光另外强烈推荐《盘龙》,阳光,简单,热血,痛快,看起来特别爽,我已N刷,类似的西方背景,主角对感情...

怎样才能看懂三体?

三体是一本硬科幻小说,对于科幻迷来说,应该很早就读过了,而且读得并不费力,有的看过好几次,每次都有新的体会,科幻迷看三体就是一种愉悦的享受。 但是随着三体这本书和作者刘慈欣火起来以后,特别是雷军等商业巨头以及奥巴马等名人推荐以后,三体更多的体现在,不止是一本硬科幻小说了,而是一本站在宏大背景和宇宙视...

张惠妹和莫文蔚,谁的好歌更多?

张惠妹和莫文蔚,谁的好歌更多?如果以歌曲的好坏来答题,无须质疑是张惠妹!但显然不能单单一句话就肯定了答案!我从几个方面来讲一下! 其一:歌曲多与少 张惠妹号称经典歌曲100首!莫文蔚号称经典歌曲30首!当然这是网友自己做的一个统计!不用想水分一定有!我们从字面上其实也可以看出!以歌曲的数量张惠妹已经...

起点中文网上有哪些值得一看的小说?

一、三戒大师-《官居一品》近些年来看到的最好的历史小说之一,另一本可堪一比的是《新宋》。完全是建立在详实史料基础上的历史推演,让人看到嘉万年间大明朝可能的另外一条道路。书中一切历史的演绎都合情合理,让人觉得历史就应该是这样发展的。此外,作者对于历史和社会发展的规律也有很好的描述,这本书完全可以当...

鲁迅称昆虫记是什么?

鲁迅称《昆虫记》为讲昆虫生活的楷模。 《昆虫记》是法国昆虫学家、文学家让·亨利·卡西米尔·法布尔所著的长篇科普文学作品,共十卷。该作品是一部概括昆虫的种类、特征、习性和婚习的昆虫学巨著,同时也是一部富含知识、趣味美感和哲理的文学宝藏。这部著作的法文书名直译为《昆虫学的回忆》,副标题为“对昆虫的本能及...

书荒!现代都市小说求推荐?

推荐几本非常好看的都市小说,希望喜欢,可以点击“+”哦1《美食供应商》简介:会做菜的猫 简介:在遥远的东方,存在着一个数次拒绝了米其林三星评价的奇怪小店。那里价格昂贵,一碗配汤蛋炒饭288RMB,哦忘了还有一碟泡菜,但就算是这样也有很多人排队等候。那里不接受预定,只接受本人现场排队,无数人开着专机专...

求好看的高干文,类似《半是蜜糖半是伤》《绝代风华之代黎篇》?

《乔城遗事》作者:独钓寒江(以民国为时代背景的小说) 《那一瞬的地老天荒》(原名:金陵公主)是民国的虐文,好看 金陵雨,北平梅 关山暮雪 流云浦 梅子青时雨 胭脂醉 《流云浦》作者:凝欣 【点评】 描写的是在民国期间的一个俊朗军官和知性女大学生的相知相遇继而相爱的故事,个人觉得该文文风清雅而又缠绵,...

为什么大风刮过的原著没有红,唐七的抄袭反而红了?

先说观点:我是支持原创的 接着说理由: 1.你的概念是错的,三生三世不见得比原著红,红的是三生三世的电视剧; 2.举个例子,摄影大赛拍出来的图片不一定火,但是有人通过图片处理就能让照片火了,这和你说的问题是同样的道理。那么问题来了,你在处理的时候应该声明图片是自己拍的还是借鉴别人的,借鉴别人的你要注...

有哪些关于王者荣耀的小说推荐?

这几篇游戏文,不是王者荣耀,但是是有关电竞的,非常好看,强烈推荐,虽然小编不打游戏,但是看的仍然是津津有味。 《他和她的猫》 作者:默默唧唧的猫 小编简评:女主宠男主,男主小公主。男主话少爱和女主撒娇。简直是狗系男友,萌萌哒❤ 《蜜汁炖鱿鱼》 作者:墨宝非宝 小编简评:一见钟情,前期女主想方设法撩男...

《春》中的春花图中的花美在哪里?

你好,我是眉画张敞。 《春》是现代作家朱自清的一篇散文,其地位就如林逋“疏影横斜水清浅,暗香浮动月黄昏”之写梅;如《爱莲说》中“出淤泥而不染,濯青涟而不妖”之赞莲;如“忽如一夜春风来,千树万树梨花开”之写雪。 此文一出,其它写春的散文全都黯然失色,让很多作家有“眼前有景道不得,自清有《春》在前头“之...

唐七的《三生三世十里桃花》抄袭桃花债拍了电视剧可粉丝说电视剧归电视剧,这合理吗?

我记得以前有看过事件缘由,最开始唐七确实有承认抄袭,桃花债作者表示不会追究,后面又有一系列变故。虽然有人说大风刮过(桃花债)作者是蹭热度,但是我很不赞同。小说本来就有涉嫌抄袭,只不过在电视剧(我现在也在追这电视剧)没有爆发之前只有看小说的粉丝才知道,播出之后是更多人关注这部小说,当然就更多人知道这个...

430人跌出10亿美元富豪榜,雷军损失300亿,张近东落榜,你怎么看这届富豪榜?

对于我们这些平头老百姓而言,总喜欢去聊聊这些富豪们有多少钱了,又谁谁谁成为首富了,但是我们总在聊富豪榜,那么也首先要知道富豪榜都是怎么计算出来的。 富豪榜是如何计算的呢?福布斯排行榜从2003年开始,每年都会更新一次中国的富豪排行榜。而为了这每年更新的排行榜,福布斯的编辑团队中有100人会专注于手机...