GPT-5.5 比 MIT 授权的 GLM-5.2 出现幻觉 3 倍

一项新的研究表明，GPT-5.5 在生成虚假信息方面表现出显著的劣势，其“幻觉”现象比使用 MIT 许可的 GLM-5.2 多达三倍。这意味着 GPT-5.5 更容易产生不真实、无根据或完全捏造的内容，这对于依赖模型生成信息的应用场景来说是一个严重的警告。研究人员强调，虽然 GPT-5.5 在其他方面可能表现出色，但其高“幻觉”率使其在某些任务中不可靠。这项发现可能会对当前基于大型语言模型的 AI 系统的发展和部署产生深远影响，并促使开发者更加关注模型的可信度和准确性。

📎 原文：GPT-5.5 hallucinates 3x more than MIT-licensed GLM-5.2 | 来源：Hacker News