Skip to content

Amazon / AWS

Amazon Web Services (AWS) 是全球最大的云基础设施提供商,其 AI 服务栈覆盖模型托管、机器学习平台、自研 AI 芯片与数据工程基础设施,是企业级 AI 部署的核心选择之一。

核心 AI 服务

Amazon Bedrock

托管式基础模型平台,提供对数百个 FM(Foundation Models)的统一访问:

  • 多模型接入:Anthropic Claude、Meta Llama、Mistral AI、Amazon Nova、OpenAI(预览中)等
  • AgentCore:端到端 Agent 构建、连接与优化平台,支持任意框架和模型
  • 知识库与 RAG:内置 Knowledge Bases、Bedrock Data Automation
  • 安全与治理:Bedrock Guardrails 可拦截高达 88% 的有害内容;支持 HIPAA、FedRAMP High、GDPR
  • 成本优化:模型蒸馏(提速 500%、降本 75%)、Prompt Caching、智能路由

Amazon SageMaker

全托管机器学习平台,覆盖数据准备、训练、部署与 MLOps:

  • SageMaker HyperPod:大规模分布式训练集群管理
  • SageMaker Canvas:无代码 ML 工作流
  • SageMaker Pipelines:端到端 MLOps 自动化
  • 原生集成 PyTorch、JAX、Hugging Face 等框架

AWS Trainium / Inferentia

自研 AI 加速器家族:

芯片定位关键规格
Trainium1训练Trn1 实例,降低训练成本 50%
Trainium2训练/推理4× Trainium1 性能;Trn2 UltraServers 支持 64 芯片互联
Trainium3训练/推理3nm 工艺;2.52 PFLOPs FP8;144GB HBM3e;专为 MoE 和推理优化
Inferentia2推理Inf2 实例,高吞吐低延迟推理
  • Neuron SDK:原生 PyTorch 集成,无需改代码即可训练部署
  • NeuronLink:专有芯片间互联技术

生态定位

  • 企业级首选:超过 100,000 家组织使用 Bedrock
  • 客户案例:Anthropic、Databricks、poolside、Ricoh 等
  • 与云基础设施深度整合:VPC、IAM、CloudWatch、S3 等原生集成

相关页面

AI Knowledge Base — 持续积累