卷起来了呀,MiniMax也玩起了开源周,哈哈哈哈,这是对标DeepSeek开源周的节奏呀! 先***地期待一手,不知道后面四天都会有什么内容,不过,现在大模型厂真的卷到飞起了! Day1,MiniMax 是先开源了混合注意力推理模型-M1,这个模型是在今年1月份开源的MiniMax-Text-01模型上增量训练得来的,结构跟MiniMax-Text-01模型一致,MoE结构,总参数456B,激活参数45.9B。
Paper:***s://github***/MiniMax-AI/MiniMax-M1/blob/main/…。
Rust 的设计缺陷是什么?
Rust 的设计缺陷是什么?...(144 )人阅读时间:2025-06-24 20:10:11
平面设计主KV做成这样,在你的城市薪资一般多少?
平面设计主KV做成这样,在你的城市薪资一般多少?...(144 )人阅读时间:2025-06-24 20:45:11
Mac上有那些你认为极其好用的***?
Mac上有那些你认为极其好用的***?...(144 )人阅读时间:2025-06-24 20:15:11
为什么用 electron 开发的桌面应用那么多?
为什么用 electron 开发的桌面应用那么多?...(144 )人阅读时间:2025-06-24 20:45:11