Appearance
Query
Query(查询)是用户或系统向 AI 模型、数据库、搜索引擎等系统发出的请求,用于获取信息、触发操作或生成内容。在 AI 和 LLM 领域,Query 是人与模型交互的最基本单元,也是检索增强生成(RAG)、Agent 系统、搜索引擎等应用的核心环节。
Query 的核心要素
一个完整的 Query 通常包含以下要素:
- 意图(Intent) — 用户想要完成什么任务:信息检索、内容生成、代码编写、数据分析等
- 上下文(Context) — 与当前任务相关的背景信息,包括对话历史、用户偏好、系统状态等
- 约束(Constraints) — 输出格式、长度限制、风格要求、时间范围等限制条件
- 输入数据(Input Data) — 需要模型处理的具体内容,如文档、代码、图像等
Query 在 LLM 系统中的类型
直接生成 Query
直接向 LLM 发送的自然语言请求,是最常见的交互形式:
"请用 Python 写一个快速排序算法,并添加详细注释"
"总结这篇论文的核心贡献和实验结果"
"将以下英文翻译成中文,保持学术风格"检索 Query
在 RAG 和搜索引擎中,Query 用于从外部知识库检索相关信息:
- 关键词 Query — 传统的关键词匹配搜索
- 语义 Query — 通过 Embedding 将查询向量化,进行语义相似度匹配
- 混合 Query — 结合关键词和语义检索的优势,提升召回率和准确性
结构化 Query
在数据库和 API 交互中,Query 通常具有严格的结构化格式:
- SQL Query — 关系型数据库查询语言
- GraphQL Query — 灵活的数据获取接口
- Function Calling Query — LLM 通过结构化参数调用外部工具
Agent 系统中的 Query
在 AI Agent 架构中,Query 是 Agent 感知环境、触发工具调用和决策的核心驱动力:
- 任务分解 Query — 将复杂任务拆解为子任务序列
- 工具选择 Query — 根据当前状态选择合适的工具
- 状态查询 Query — 获取系统或环境的当前状态信息
Query 工程(Query Engineering)
Query Engineering 是通过优化查询的构造方式来提升系统输出质量的技术,与 Prompt Engineering 密切相关但侧重点不同:
| 维度 | Prompt Engineering | Query Engineering |
|---|---|---|
| 关注点 | 引导模型生成期望输出 | 优化信息检索的准确性和相关性 |
| 应用场景 | 直接 LLM 交互 | RAG、搜索、数据库查询 |
| 核心技术 | 少样本示例、链式思维、角色设定 | 查询扩展、重写、向量化、过滤 |
Query 优化技术
- 查询扩展(Query Expansion) — 通过同义词、相关术语或 LLM 生成来扩展原始查询,提高召回率
- 查询重写(Query Rewriting) — 将模糊或口语化的查询转换为更精确、结构化的形式
- HyDE(Hypothetical Document Embeddings) — 让 LLM 先生成假设答案,再用答案的 Embedding 去检索,解决查询-文档语义鸿沟
- 查询分解(Query Decomposition) — 将复杂查询拆分为多个简单子查询,分别检索后合并结果
- 多路召回(Multi-way Retrieval) — 同时使用多种检索策略(关键词、语义、图检索等),融合排序结果
Query 在 RAG 系统中的关键作用
在 Retrieval Augmented Generation 系统中,Query 的质量直接决定最终生成质量:
用户原始 Query → Query 理解/重写 → 向量检索/关键词检索 → 重排序 → 上下文构建 → LLM 生成Query 处理环节的典型挑战:
- 语义鸿沟 — 用户查询与文档表述方式不一致
- 意图歧义 — 一词多义或上下文缺失导致理解偏差
- 复杂查询 — 多条件、多步骤查询难以一次性准确表达
- 领域适配 — 通用查询模型在专业领域效果下降
Query 与 Prompt 的关系
Query 和 Prompt 在 AI 交互中经常被混用,但存在细微区别:
- Query 更偏向"请求信息"的语义,常用于检索、搜索、数据库场景
- Prompt 更偏向"引导生成"的语义,常用于直接 LLM 交互场景
在实际应用中,两者经常融合:一个 RAG 系统的 Prompt 中会嵌入检索 Query 返回的结果,而一个复杂的 Prompt 也可能包含多个子 Query。
相关概念
- Prompt Engineering — 通过精心构造提示来引导 LLM 输出质量的核心技能
- Retrieval Augmented Generation — 将外部知识检索与生成结合的常见落地方法
- Semantic Search — 基于向量表示的语义搜索技术,RAG 系统的核心召回层
- Embedding Models / Vector Representations — 文本嵌入与向量表示技术,语义搜索和 RAG 的基础组件
- Vector Databases — 向量数据库,RAG 系统的核心存储层与高效检索基础设施
- Function Calling / Tool Use — LLM 与外部世界交互的标准化接口,Agent 架构的核心支柱
- AI Agents — 结合推理、工具调用和任务执行的 AI 系统形态