阿里终于在深夜发布了Qwen3,这可是个不得了的大事儿。这次一共推出了8个不同尺寸的模型,包括6个Dense稠密模型和2个重量级MoE模型,从小巧的0.6B到超大的235B,几乎涵盖了所有使用场景。而且全部采用Apache 2.0开源协议,无论是个人还是企业都可以毫无顾虑地使用,甚至用于商业用途。
Qwen3的最大亮点在于它是第一个开源的混合推理模型,既可以用作普通模型,也可以开启推理模式,相当于把两个模型合为一体,极大地方便了开发者和使用者。在性能方面,Qwen3的表现堪称惊艳。即使是最小的4B模型,性能也能和上一代32B的QwQ模型相媲美。而30B-A3B模型更是全方位超越了QwQ-32B。至于旗舰版的235B-A22B模型,其部署成本仅是DeepSeek R1的三分之一,性价比简直爆表。
此外,Qwen3还支持MCP协议,并且将支持的语言种类从上一代的29种扩展到了119种,这无疑大大增强了其在全球范围内的适用性。可以说,阿里这次发布的Qwen3,无论是在技术层面还是在应用场景上,都展现出了极大的诚意和强大的实力。