Skip to content

Databricks

Databricks 由 Apache Spark 创始团队于 2013 年创立,是 Lakehouse 架构的开创者,提供统一的数据、分析与 AI 平台。2023 年以 13 亿美元收购 MosaicML 后,Databricks 成为企业级生成式 AI 训练与部署的核心平台之一。

核心产品

Data Intelligence Platform

  • Unity Catalog:统一的数据与 AI 资产治理层
  • Delta Lake / Delta Sharing:开放、安全的零拷贝数据共享
  • Lakehouse Architecture:融合数据仓库与数据湖的优势
  • Serverless 架构:自动扩缩容的 SQL 分析与数据工程

AI 与机器学习

  • MosaicML 集成:企业级模型训练与微调平台
  • DBRX(2024 年 4 月):132B 参数开源 MoE 模型,Databricks 自研
  • Lakebase:面向数据应用与 AI Agent 的 Postgres 数据库
  • Agentic AI 支持:内置 AI Agent 开发框架与工具链

安全与治理

  • LakeWatch:面向 AI 时代的开放式 Agentic SIEM
  • 细粒度访问控制、数据血缘追踪、合规审计

关键里程碑

时间事件
2013公司成立,Apache Spark 商业化
2020提出 Lakehouse 架构概念
2023.613 亿美元收购 MosaicML
2024.4发布 DBRX 开源大模型
2024+整合数据+AI 为统一 Intelligence Platform

生态定位

  • 企业数据+AI 一体化:从 ETL 到模型训练到部署的完整链路
  • 开源友好:Delta Lake、MLflow 等核心项目开源
  • 多云部署:AWS、Azure、GCP 均支持

相关页面

AI Knowledge Base — 持续积累