Appearance
Together AI
Together AI 是一家专注于开源大语言模型推理和训练的 AI 基础设施公司,由 Vipul Ved Prakash、Ce Zhang 和 Chris Ré 等于 2022 年在美国加州创立。Together AI 提供了高性能的模型推理 API、微调服务和自研模型,是开源 AI 生态的重要基础设施提供商。
概览
Together AI 的核心理念是推动开源 AI 的可访问性和性能。公司自研了 Together Inference Engine,通过优化的内核和编译技术提升开源模型的推理速度,同时提供便宜的模型训练和微调服务。
核心产品
模型推理 API
| 模型类别 | 支持模型 |
|---|---|
| 开源 LLM | Llama、Mistral、Qwen、DeepSeek |
| 图像模型 | Stable Diffusion、FLUX |
| 嵌入模型 | BGE、E5 |
| 自研模型 | StripedHyena、Mamba |
微调服务 (Fine-tuning)
- 全参数微调: 支持各种开源模型的完整微调
- LoRA/QLoRA: 高效参数高效微调
- 数据集管理: 内置数据预处理和验证
自研模型
- StripedHyena: 混合架构 (注意力 + 次线性),支持超长上下文
- Mamba 系列: 状态空间模型的高性能实现
技术亮点
- Together Inference Engine: 自研推理引擎,比标准 vLLM 更高效
- 优化编译: 针对特定硬件的模型优化
- 分布式训练: 支持多节点大规模训练
- 开源友好: 专注开源模型,避免厂商锁定
定价
| 服务 | 定价 |
|---|---|
| 推理 API | 按 token 计费,比主流商家便宜 2-3 倍 |
| 微调 | 按训练时间计费 |
| 专属实例 | 按小时计费 |
生态定位
- 开源 AI 基础设施: 专为开源模型提供高性能服务
- 与闭源模型竞争: 以更低成本提供相当质量
- 研究驱动: 团队来自顶级学术机构 (Stanford、Princeton)
相关实体
OpenAI: 主要竞争对手
vLLM: 开源推理引擎
Llama: 主要支持的开源模型
Mamba / State Space Models: 支持的状态空间模型架构
Model Inference & Deployment — 模型推理与部署
开源模型生态趋势 — 开源模型生态趋势