在产品层面约束大模型的"不靠谱"

type

status

date

slug

summary

为什么大模型不能达到百分之百的正确率？

概率生成范式：现在的大模型都是基于神经网络（Transformer架构）的模型，本质上是基于统计概率的序列预测。

验证机制缺失：与传统搜索引擎不同，大模型缺乏实时知识校验能力。其参数化记忆方式无法通过溯源校验来保证信息的可靠性。

现在有没有办法完全解决这个问题？

为了解决模型幻觉的问题，当前从使用模型的层面主要解决方案有：外挂RAG知识库、反思（Self-Reflection）、思维链（CoT）等。尽管这些方法在一定程度上缓解了幻觉问题，但由于大模型的复杂性和生成机制的局限性，仍不能完全消除幻觉。而且在未来技术发展过程中，现在的框架体系，也可预见地不能完全消除。

因为“大模型不能替代人去坐牢”，所以对于正确率有要求的业务，大多数场景模型产出的内容并不能直接交付，人工审核甚至人工介入是必要的。