一部分人工智能安全研究人员对 Anthropic 公司开发的 Fable 模型所采用的安全措施表示担忧。他们认为,这些限制可能阻碍模型在某些关键领域的有效应用和发展,例如需要高度创造性和灵活性的任务。具体来说,他们担心过于严格的约束可能会导致模型无法充分利用其潜力,从而影响其在解决复杂问题、进行创新研究等方面的能力。此外,一些研究人员也指出,现有的安全措施可能存在漏洞,容易被恶意用户利用,从而对模型的安全性构成威胁。因此,他们呼吁 Anthropic 公司重新评估和调整 Fable 模型的设置,以实现更好的安全性和性能平衡。


📎 原文:Cybersecurity researchers aren’t happy about the guardrails on Anthropic’s Fable | 来源:Hacker News