1. Qwen3 性能如何?
- 旗舰版Qwen3-235B-A22B模型也是国产模型Top1,开源模型Top1,具体对比参数可以查看下面的对比图片,或者访问这个链接 https://qwenlm.github.io/blog/qwen3/
2. Qwen3有什么特色?
主要有两点:
- 本次开源的Qwen3是国内首个“混合推理模型”,这个概念最早是Claude3.7提出来的。简单讲就是一个模型既可以推理,也可以不推理。
- 千问之前的开源模型最大尺寸是72B,而deepseek的参数是671B。这次Qwen 3终于拿出了235B的MoE架构模型Qwen3-235B-A22B,虽然离671B有差距,但仍然是一个好的改变和亮点。
3. 外界评价如何?
看了下美国版贴吧(reddit)上网友的反应,讨论还挺热烈,评价不错。其中有人提到使用4090显卡,在ollma下运行 Qwen3-30B-A3B MoE 非常慢,而在lm studio上的速度则如期望的一样快。遇到同样问题的,大家可以试试。
4. Qwen大模型下载地址
https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f
5. 目前总结
自己试用后,发现比Qwen 2.5是有进步的。但是具体进步多少,还不好评价,有待更多使用后再反馈给大家。