怎么评价阿里Qwen3系列大模型?

硅基玩家

2025年4月29日

1. Qwen3 性能如何?

  • 旗舰版Qwen3-235B-A22B模型也是国产模型Top1,开源模型Top1,具体对比参数可以查看下面的对比图片,或者访问这个链接 https://qwenlm.github.io/blog/qwen3/

 

2. Qwen3有什么特色?

主要有两点:

  1. 本次开源的Qwen3是国内首个“混合推理模型”,这个概念最早是Claude3.7提出来的。简单讲就是一个模型既可以推理,也可以不推理。
  2. 千问之前的开源模型最大尺寸是72B,而deepseek的参数是671B。这次Qwen 3终于拿出了235B的MoE架构模型Qwen3-235B-A22B,虽然离671B有差距,但仍然是一个好的改变和亮点。

 

3. 外界评价如何?

看了下美国版贴吧(reddit)上网友的反应,讨论还挺热烈,评价不错。其中有人提到使用4090显卡,在ollma下运行 Qwen3-30B-A3B MoE 非常慢,而在lm studio上的速度则如期望的一样快。遇到同样问题的,大家可以试试。

 

 

4. Qwen大模型下载地址

https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

 

5. 目前总结

自己试用后,发现比Qwen 2.5是有进步的。但是具体进步多少,还不好评价,有待更多使用后再反馈给大家。

 

 

 

 

 

发表评论