一项新的研究表明,GPT-5.5 在生成虚假信息方面表现出显著的劣势,其“幻觉”现象比使用 MIT 许可的 GLM-5.2 多达三倍。这意味着 GPT-5.5 更容易产生不真实、无根据或完全捏造的内容,这对于依赖模型生成信息的应用场景来说是一个严重的警告。研究人员强调,虽然 GPT-5.5 在其他方面可能表现出色,但其高“幻觉”率使其在某些任务中不可靠。这项发现可能会对当前基于大型语言模型的 AI 系统的发展和部署产生深远影响,并促使开发者更加关注模型的可信度和准确性。
📎 原文:GPT-5.5 hallucinates 3x more than MIT-licensed GLM-5.2 | 来源:Hacker News