怎么给LLM 总结结论进行溯源
先搞清「寻址函数 α」是什么
L3 / L4 已经把 12 万条文本压成 8 类模式 + 几条原话证据。可这时候 LLM 看到的只是抽象论断:
「机型 X1C 的喷头堵塞,主要原因是耗材含水(占该类 18%)」
分析师马上会追问:“这 18% 具体是哪 5,200 条工单?给我看原始记录。”
如果 prompt 里没东西能回答这个问题,方案就结构性地做不到溯源——这就是 P3 的死穴:Map-Reduce、递归摘要在 reduce 时把指针抹掉了,reduce 后的产物只剩"18%"这个数字,没法回查源头。
寻址函数 α用数学语言写就是:
α:C → 2{ 1,…,N}\alpha:\mathcal{C}\;\to\;2^{\{1,\ldots,N\}}α