Skip to content

Sakana AI

Overview

Sakana AI (さかな AI,"鱼 AI") 是一家总部位于日本东京的 AI 研究公司,成立于 2023 年,由原 Transformer 论文八作者之一的 Llion JonesDavid Ha (原 Google Brain) 共同创立。公司名称"鱼"源于日本传统园艺中的"群游"概忶——多个简单个体通过自组织形成复杂智能,这正是 Sakana 的核心理念。

核心技术

Evolutionary Model Merging

Sakana 最著名的技术创新,将进化计算 (Evolutionary Computation) 应用于模型合并 (Model Merging):

  • 问题: 传统模型合并依赖人工设计的合并规则
  • 解决: 用进化算法自动搜索最优合并策略
  • 效果: 在日语 LLM 合并中达到最新最高 (SOTA)

具体方法

1. 初始化: 从多个源模型中生成合并候选
2. 评估: 在任务上评估每个合并模型的性能
3. 选择: 保留表现最好的合并策略
4. 突变: 对合并规则进行随机变异
5. 迭代: 重复 2-4 步,直至收敛

代表成果

项目时间成就
Evolutionary Model Merging2024日语 LLM SOTA,无需训练即可合并
The AI Scientist2024首个自动科学研究系统,自动提出假设、实验、写论文
Transformer²2025动态权重更新架构,实时适应任务

定位与影响

日本 AI 生态的重要组成

Sakana 是日本 AI 创业生态中最受关注的公司之一:

  • 2024 年获得 $30M+ 融资
  • 日本政府和企业的重点支持对象
  • 吸引了全球顶级 AI 研究人才

开源贡献

  • mergekit: 模型合并工具包
  • Evolutionary Model Merging 论文: 开源方法和代码
  • 推动了模型合并从"技巧" 变为"科学"

与竞品的差异

维度Sakana AI传统 LLM 公司其他合并工具
核心方法进化计算梯度下降手动/简单加权
目标自动发现最优合并训练新模型快速合并
创新性
开源程度

Synthesis

Sakana AI 代表了 AI 研究的一个重要趋势:从"大规模训练"转向"智能组合"。通过进化计算自动发现最优模型合并策略,Sakana 证明了不需要大量计算资源也能创造出有竞争力的模型。这一思路对开源社区和资源受限的研究者具有重要启发。

Sources

  • Sakana AI 官方博客

  • "Evolutionary Optimization of Model Merging Recipes" 论文

  • "The AI Scientist" 技术报告

  • Large Language Model (LLM) — 大语言模型的核心定义、技术原理与发展历程

相关页面

AI Knowledge Base — 持续积累