Skip to content

向量数据库与 RAG 工具

RAG(检索增强生成)是 LLM 应用的标配架构。本页汇总向量数据库、嵌入模型、文档切分与 RAG 框架等核心组件,帮助你构建高效的知识检索系统。

向量数据库

托管服务

数据库开发者特点最佳场景链接
PineconePinecone全托管、自动扩缩、混合搜索快速上线、无运维负担pinecone.io
Zilliz CloudZilliz基于 Milvus、企业级、高可用大规模企业部署zilliz.com
Weaviate CloudWeaviateGraphQL 接口、模块化 AI 集成需要灵活查询能力weaviate.io
Chroma CloudChroma轻量、开源、开发者友好原型开发、小团队trychroma.com

自托管/开源

数据库语言特点最佳场景链接
MilvusGo企业级、分布式、十亿级向量大规模生产环境milvus.io
WeaviateGo向量+对象混合存储、模块化复杂查询、多模态weaviate.io
QdrantRust性能优越、过滤器强大、云原生高性能、过滤查询qdrant.tech
ChromaPython轻量、嵌入式、开发者体验好快速原型、本地开发trychroma.com
pgvectorCPostgreSQL 扩展、ACID 事务已有 PG 基础架构GitHub
ValdGo基于 NGT、Kubernetes 原生K8s 环境、云原生vald.vdaas.io

向量数据库选型对比

维度PineconeMilvusWeaviateQdrantChromapgvector
部署复杂度极低
扩展性自动优秀良好良好中等依赖 PG
查询能力中等简单中等
过滤器支持基础基础中等
多模态部分部分部分
自托管不可
定价按用量免费/企业免费/企业免费/企业免费/企业免费

嵌入模型 (Embedding Models)

通用文本嵌入

模型维度上下文长度特点链接
text-embedding-3-large30728192OpenAI 最强、多语言OpenAI
text-embedding-3-small15368192性价比高OpenAI
BGE-M310248192多语言、密集+稀疏、开源HuggingFace
E5-Mistral409632768长文档、高质量HuggingFace
GTE-Qwen23584131072极长上下文、中文优化HuggingFace
Jina-Embeddings-v310248192多任务、轻量HuggingFace
Nomic-Embed7688192开源、高性能、全视觉HuggingFace

多模态嵌入

模型模态特点链接
CLIP图像+文本开源标准、通用HuggingFace
OpenAI text-embedding-3文本API 便捷OpenAI
BGE-VL图像+文本中文优化HuggingFace

文档切分策略

切分方法对比

方法原理优点缺点适用场景
固定长度按 token/chunk 数切分简单、可控语义裂解结构化文档
递归分割按标点/段落分割保持语义完整块大小不均文章、报告
语义分割基于相似度聚类语义连贯计算成本高复杂文档
Agentic 分割LLM 决定切分点智能、上下文感知慢、成本高高价值文档

切分工具

工具功能链接
LangChain Text Splitters多种策略切分Docs
LlamaIndex Node Parser智能分割、多级解析Docs
Semantic Chunker基于嵌入相似度分割GitHub

RAG 框架与工具

综合 RAG 框架

框架特点最佳场景链接
LlamaIndex数据载入、检索、Agent 一体化复杂 RAG 、企业级应用llamaindex.ai
LangChain模块化、生态丰富、灵活快速原型、自定义流程langchain.com
RAGFlow深度文档理解、可视化复杂文档处理GitHub
Dify可视化编排、快速上线产品团队、低代码dify.ai
Flowise拖拽式、开源无代码/低代码flowiseai.com

高级 RAG 技术

技术原理效果实现工具
Hybrid Search向量搜索 + 关键词搜索提高准确率大多数数据库
Re-ranking初检 + 精排显著提升相关性Cohere Rerank, BGE-Reranker
Query Expansion扩展查询词提高召回率LangChain, LlamaIndex
Hypothetical Document生成假设文档再检索解决词汇错配LangChain HyDE
Self-RAG模型自检检索质量减少幻觉自实现或框架
GraphRAG知识图谱增强全局上下文理解Microsoft GraphRAG

相关页面

参考来源

  • Pinecone 学习中心
  • Milvus 官方文档
  • Weaviate 文档
  • Qdrant 文档
  • LangChain RAG 指南
  • LlamaIndex 文档

AI Knowledge Base — 持续积累