RAG 文档切割如果把完整语义拆散,向量检索可能召回不到真正答案。围绕重叠切割、语义边界切割、句子窗口检索、父子切割、命题化切割和 Contextual Retrieval,讲清语义截断的成因、解决思路和工程取舍。
RAG 系统做文档切割时,固定长度分块容易把完整语义拆散,导致向量检索召回失败。这里系统讲解重叠切割、语义边界切割、句子窗口检索、父子切割、命题化切割和 Contextual Retrieval 的原理、实现方式与选型取舍。