面向RAG(检索增强生成)系统的落地难点,提出了覆盖“查询理解—动态扩展—知识治理—图谱推理”的全栈优化技术框架,明确指出索引构建、精准召回与上下文感知生成三大环节的关键痛点并给出工程化解决路径。查询层通过五类Query结构化改写与三层联网搜索决策,解决口语化表述与时效性缺失问题;召回层则以MultiQueryRetriever、离散+向量混合索引与Small-to-Big轻量索引为核心,辅以BGE-Rerank或Cohere Rerank重排序提升相关性。知识库治理实现问题生成、对话知识沉淀、健康度检查与版本管理四大闭环,使检索准确率和迭代可测化;进一步通过GraphRAG构建分层知识图谱并支持Global/Local Query,实现跨文档复杂推理能力的显著增强
在小宇宙查看该单集文稿