LongCat-2.0 是一个基于 Mixture of Experts (MoE) 的大规模语言模型。该模型拥有惊人的 1.6 万亿个总参数,其中 480 亿个是活跃的参数。这意味着在给定任务下,模型可以动态地激活一部分参数进行计算,从而实现更高的效率和性能。虽然具体的技术细节尚未完全公开,但其规模表明 LongCat-2.0 在处理复杂语言理解和生成任务方面具有巨大的潜力。
📎 原文:LongCat-2.0, a large-scale MoE model with 1.6T total and 48B Active | 来源:Hacker News