Appearance
World Labs
空间智能(Spatial Intelligence)领域的先锋 AI 公司,将"看见"转化为"理解",将"想象"转化为"创造"。
World Labs 是一家位于美国的前沿 AI 研究与产品公司,专注于构建能够感知、生成、推理和与 3D 世界交互的基础世界模型(Foundation World Models)。公司由计算机视觉领域的权威学者李飞飞(Fei-Fei Li)联合创始。
公司概览
| 属性 | 内容 |
|---|---|
| 名称 | World Labs |
| 定位 | 空间智能(Spatial Intelligence)公司 |
| 创始人 | Fei-Fei Li(李飞飞)、Justin Johnson、Christoph Lassner、Ben Mildenhall |
| 成立时间 | 2024 年 |
| 总部 | 美国 |
| 官网 | worldlabs.ai |
| 首款产品 | Marble |
核心团队
World Labs 的创始团队由四位在机器学习、生成式 AI、计算机视觉和图形学领域的世界级专家组成:
Fei-Fei Li(李飞飞)- CEO & 联合创始人
- 斯坦福大学教授,计算机视觉领域最具影响力的学者之一
- ImageNet 创建者,该数据集被广泛认为深度学习革命的关键催化剂
- 曾任 Google Cloud 首席科学家,也是美国国家工程院院士
- 长期专注于让 AI 理解视觉世界,World Labs 是其在"空间智能"方向的继续
Justin Johnson - 联合创始人
- 斯坦福大学计算机科学博士,专注于生成式模型和视觉理解
- 在图像生成、风格迁移、神经网络视觉理解方面有深厚积累
Christoph Lassner - 联合创始人
- 在 3D 重建、神经渲染、可动人身体重建等领域有丰富经验
- 曾于 Meta 和 Amazon 从事相关研究
Ben Mildenhall - 联合创始人
- NeRF(Neural Radiance Fields)论文的第一作者,该技术革命性地改变了 3D 重建领域
- 在斯坦福大学期间与李飞飞合作,后加入 Google Research
核心理念:空间智能
World Labs 提出了 **Spatial Intelligence(空间智能)**的概念,作为对传统 AI 能力的进一步扩展: n
| 阶段 | 能力 | 代表技术 |
|---|---|---|
| 语言智能 | 处理文本、理解语义 | LLM (GPT、Claude) |
| 视觉智能 | 识别图像内容 | 图像分类、目标检测 |
| 空间智能 | 理解三维空间、在其中推理和交互 | World Labs 的方向 |
"Spatial intelligence transforms seeing into doing, understanding into reasoning, and imagining into creating."
— World Labs
首款产品:Marble
Marble 是 World Labs 的首款产品,一个基于生成式 3D 世界模型的创作工具:
核心能力
- 多模态输入:支持从文本、图像、视频或 360° 全景图创建 3D 世界
- 3D 布局控制:精确控制生成世界的三维布局
- 交互式编辑:调整特定元素或重整个 3D 世界
- 世界扩展:扩展、编辑和组合已生成的世界
- 多格式输出:支持 2D 和 3D 多种格式导出
技术特点
- 空间一致性:生成的 3D 环境在空间上保持一致
- 高保真度:细节丰富的视觉质量
- 持久性:用户移动和交互时世界状态持续保持
- 实时渲染:支持在生成的环境中自由移动
应用场景
- 游戏开发:快速生成游戏场景和关卡
- 影视制作:虚拟场景和预可视化
- 建筑设计:空间概念验证
- 教育与培训:沉浸式环境创建
与行业的关系
与传统 3D 技术的区别
| 维度 | 传统 3D 工具 | World Labs / Marble |
|---|---|---|
| 创建方式 | 手动建模、编程 | AI 生成,自然语言/图像输入 |
| 时间 | 数周至数月 | 秒级至分钟级 |
| 技能门槛 | 需要专业 3D 软件技能 | 面向任何人 |
| 交互性 | 静态渲染或预计算动画 | 实时交互、可探索 |
与其他 AI 公司的定位差异
- OpenAI (Sora):专注视频生成,隐式学习物理规律
- Google DeepMind (Genie):专注可交互的 2D 游戏世界
- World Labs:专注 3D 空间理解与生成,支持实时交互
投资与资本
World Labs 获得了顶级风投的支持,包括:
- Andreessen Horowitz (a16z)
- New Enterprise Associates (NEA)
- Radical Ventures
- 其他知名投资者
公司在成立不久后就获得了显著的资本支持,反映了市场对空间智能方向的高度关注。
前景与挑战
机遇
- 游戏产业革命:降低 3A 游戏和 VR/AR 内容的制作门槛
- 机器人与自动驾驶:为机器人提供可交互的 3D 训练环境
- 虚拟现实与元宇宙:支持创建持久、可探索的虚拟世界
- 创意产业:为影视、建筑、设计师提供新的创作工具
挑战
- 计算成本:高保真 3D 生成的计算需求巨大
- 物理一致性:确保生成的 3D 世界符合物理规律
- 实时性:实现真正的实时交互体验
- 内容安全:游戏和 VR 内容的安全与适当性管理
延伸阅读
- World Labs 官网
- Marble 产品页面
- World Labs 博客
- Fei-Fei Li 在 TED 的演讲:Spatial Intelligence: Why AI's Next Frontier Is Understanding the 3D World
相关概念:World Models、Multimodal Models、Text-to-Video
相关实体:Google DeepMind (Genie)、OpenAI (Sora)
- Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程
相关页面
- World Models — World Models
- LLM vs World Models — LLM vs World Models