678CHAT AI资讯 杭州六小龙开源新模型SpatialLM,让机器人秒懂3D世界

杭州六小龙开源新模型SpatialLM,让机器人秒懂3D世界

杭州的群核科技最近又在科技界掀起了一阵波澜,其开源的空间理解模型 SpatialLM 在谷歌的一篇论文中被特别提及并致谢。这一模型的出现,为机器人训练领域带来了前所未有的变革,它能够让机器人仅通过普通视频就理解物理世界的几何关系,堪称机器人训练领域的一次重大突破。

杭州六小龙开源新模型SpatialLM,让机器人秒懂3D世界插图

SpatialLM 的核心功能是将手机拍摄的视频转化为三维空间布局信息。用户只需用手机录制家中的布局,SpatialLM 就能够生成一个详细的 3D 场景,涵盖房间的结构、家具的摆放位置以及通道的宽度等信息。这一过程极大地降低了机器人训练的成本,同时也显著提高了训练的效率。

在 GTC2025 大会上,群核科技还展示了他们的虚拟训练平台 SpatialVerse。该平台结合了 SpatialLM 生成的数据,允许机器人在模拟环境中进行避障、抓取等训练,从而形成从认知到行动的完整闭环。换言之,机器人通过这个系统不仅能 “看到” 空间布局,还能理解如何在这些环境中进行操作。

SpatialLM 的工作原理并不复杂。它利用 MASt3R-SLAM 技术将视频拆解为无数帧,提取出沙发、桌子等物体的细节并构建成点云模型。随后,模型将这些数据转化为结构化的 3D 布局,记录下每个物体的关键信息,如尺寸和位置。与传统的训练方法相比,SpatialLM 不仅节省了时间和资源,还提升了机器人的空间认知能力。

这项技术的独特之处在于,它使机器人可以像人类一样理解和处理复杂的环境变化。无论是家庭生活中的日常物品,还是工作场所的各种工具,SpatialLM 都能帮助机器人快速适应并执行任务。这种能力对于提升机器人在真实环境中的表现至关重要,尤其是在当前的具身智能领域,许多技术依然面临落地难题。

通过开源 SpatialLM 和 SpatialVerse,群核科技正在重塑机器人训练的未来,使其能够在真实世界中灵活应对各种挑战。这一举措不仅为机器人技术的发展提供了新的思路,也为相关领域的研究和应用开辟了更广阔的空间。

项目地址:https://top.aibase.com/tool/spatiallm

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/12272.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部