Appearance
Databricks
Databricks 由 Apache Spark 创始团队于 2013 年创立,是 Lakehouse 架构的开创者,提供统一的数据、分析与 AI 平台。2023 年以 13 亿美元收购 MosaicML 后,Databricks 成为企业级生成式 AI 训练与部署的核心平台之一。
核心产品
Data Intelligence Platform
- Unity Catalog:统一的数据与 AI 资产治理层
- Delta Lake / Delta Sharing:开放、安全的零拷贝数据共享
- Lakehouse Architecture:融合数据仓库与数据湖的优势
- Serverless 架构:自动扩缩容的 SQL 分析与数据工程
AI 与机器学习
- MosaicML 集成:企业级模型训练与微调平台
- DBRX(2024 年 4 月):132B 参数开源 MoE 模型,Databricks 自研
- Lakebase:面向数据应用与 AI Agent 的 Postgres 数据库
- Agentic AI 支持:内置 AI Agent 开发框架与工具链
安全与治理
- LakeWatch:面向 AI 时代的开放式 Agentic SIEM
- 细粒度访问控制、数据血缘追踪、合规审计
关键里程碑
| 时间 | 事件 |
|---|---|
| 2013 | 公司成立,Apache Spark 商业化 |
| 2020 | 提出 Lakehouse 架构概念 |
| 2023.6 | 13 亿美元收购 MosaicML |
| 2024.4 | 发布 DBRX 开源大模型 |
| 2024+ | 整合数据+AI 为统一 Intelligence Platform |
生态定位
- 企业数据+AI 一体化:从 ETL 到模型训练到部署的完整链路
- 开源友好:Delta Lake、MLflow 等核心项目开源
- 多云部署:AWS、Azure、GCP 均支持
相关页面
Snowflake — 数据云竞争对手
Amazon / AWS — 云平台合作伙伴
MosaicML — 被收购的模型训练平台
Vector Databases — Databricks Vector Search
Cloud AI 平台对比 — Cloud AI 平台对比
AI 训练与微调平台 — AI 训练与微调平台