MiniMax发布新一代开源模型 性能比肩顶尖模型
1月15日,MiniMax发布了新一代01系列模型,并将其开源。该系列包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。据称,这些模型首次大规模实现了线性注意力机制,使得传统Transformer架构不再是唯一选择。新模型的参数量达到4560亿,单次激活参数为459亿。其综合性能可与海外顶尖模型媲美,能够高效处理长达400万token的上下文,这一长度是GPT-4o的32倍,也是Claude-3.5-Sonnet的20倍。