NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - AI模型在线查看 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 - 3D道路快速建模
近年来,3D机器学习领域取得了巨大进展,它是一个融合了计算机视觉、计算机图形学和机器学习的跨学科领域。
本文列举了最流行的16个3D机器学习数据集,可以利用这个在线转换工具将3D模型文件转到你的算法需要的格式。
1、Princeton Shape Benchmark
Princeton Shape Benchemark(2003)数据集从网络收集的 1,814 个3D模型,格式为 .OFF。 用于评估基于形状的检索和分析算法。
2、Dataset for IKEA 3D models
Dataset for IKEA 3D models and aligned images(2013)数据集包含759 张图像和 219 个模型,包括 Sketchup (skp) 和 Wavefront (obj) 文件,非常适合姿势估计。
3、Open Surfaces
OpenSurfaces(SIGGRAPH 2013) 数据集是一个大型数据库,其中包含根据真实消费者照片创建的带标注表面。 OpenSurfaces的标注框架利用众包来分割照片中的表面,然后用丰富的表面属性(包括材质、纹理和上下文信息)对其进行注释。
4、PASCAL3D+
PASCAL3D+(2014)数据集包含12 个类别,平均每个类别 3k+ 对象,用于 3D 对象检测和姿态估计。
5、ModelNet
ModelNet (2015)数据集包含662 个类别的 127915 个 3D CAD 模型。其中ModelNet10包含10 个类别的 4899 个模型,ModelNet40包含40个类别的12311个模型,全部都是统一定向的。
6、ShapeNet
ShapeNet (2015)数据集包含超过 300 万个模型和 4K+ 类别。 数据集规模大、组织良好且注释丰富。ShapeNetCore包含55 个类别的 51300 个模型。
7、A Large Dataset of Object Scans
A Large Dataset of Object Scans(2016)数据集包含RGBD 格式的 10K 扫描 + .PLY 格式的重建 3D 模型。
8、ObjectNet3D
ObjectNet3D(2016)数据集包含100 个类别、90,127 个图像、这些图像中的 201,888 个对象和 44,147 个 3D 形状。ObjectNet3D数据集主要用于如下任务:区域提议生成、2D 对象检测、联合 2D 检测和 3D 对象姿态估计以及基于图像的 3D 形状检索
9、Thingi10K
Thingi10K: A Dataset of 10,000 3D-Printing Models (2016)数据集包含
thingiverse.com 上特色“事物”的 10,000 个模型,适合测试 3D 打印技术,例如结构分析、形状优化或实体几何操作。
10、ABC
ABC: A Big CAD Model Dataset For Geometric Deep Learning引入了一个用于几何深度学习的数据集,由超过 100 万个单独的(高质量)几何模型组成,每个模型都与分解为补丁的准确地面实况信息、明确的清晰特征注释和分析微分属性相关。
11、ScanObjectNN
🎲ScanObjectNN: A New Benchmark Dataset and Classification Model on Real-World Data(ICCV 2019) 引入了 ScanObjectNN,一个基于扫描室内场景数据的新的现实世界点云对象数据集。
这项工作中的综合基准表明,该数据集对现有的点云分类技术提出了巨大的挑战,因为来自现实世界扫描的对象通常与背景杂乱和/或由于遮挡而部分化。 确定了点云对象分类的三个关键开放问题,并提出了一种新的点云分类神经网络,该网络在对杂乱背景的对象进行分类时实现了最先进的性能。
12、VOCASET
VOCASET: Speech-4D Head Scan Dataset(2019) 数据集是一个 4D 人脸数据集,包含以 60 fps 捕获的约 29 分钟的 4D 扫描和同步音频。 该数据集包含 12 个主题和 480 个序列,每个序列约 3-4 秒,句子选自一系列标准协议,可最大限度地提高语音多样性。
13、3D-FUTURE
3D-FUTURE: 3D FUrniture shape with TextURE (2020)数据集包含 5,000 多个不同房间中的 20,000 多个干净逼真的合成场景,其中包括 10,000 多个独特的高品质 3D 家具实例,具有由专业设计师开发的高分辨率信息纹理。
14、Fusion 360 Gallery
Fusion 360 Gallery 数据集(2020)包含源自参数化 CAD 模型的丰富 2D 和 3D 几何数据。 重建数据集提供来自简单“草图和拉伸”设计子集的连续构造序列信息。 分割数据集提供基于 CAD 建模操作的 3D 模型分割,包括 B-Rep 格式、网格和点云。
15、Mechanical Components Benchmark
Mechanical Components Benchmark (2020)数据集是机械部件 3D 对象的大规模数据集。 其机械部件总数为68类,58696个。
16、Combinatorial 3D Shape
Combinatorial 3D Shape Dataset (2020)数据集由 14 个类的 406 个实例组成。 数据集中的每个对象都被认为相当于一系列原始放置。
与其他 3D 对象数据集相比,该数据集包含单元基元的组装序列。 这意味着我们可以快速获得一个顺序生成过程,这是一种人类组装机制。 此外,在验证采样序列后,我们可以从给定的组合形状中采样有效的随机序列。
总而言之,组合 3D 形状数据集的特征是 (i) 组合、(ii) 顺序、(iii) 可分解和 (iv) 可操作。
原文链接:A resource repository for 3D machine learning
BimAnt翻译整理,转载请标明出处