火速适配国产算力!阿里Qwen3全家桶上线超算互联网:支持企业级部署
作者:小编日期:2025-04-30浏览:12848分类:热门事件
问鼎娱乐网4月29日消息,今日,阿里云正式开源Qwen3系列模型,参数量为DeepSeek-R1的1/3,成本大幅下降。
今晚,国家级算力服务平台超算互联网宣布,平台火速上线Qwen3全家桶,包含六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B;以及两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参数),Qwen3-30B-A3B(300亿总参数、30亿激活参数)。
Qwen3系列模型采用Apache2.0协议开源,开发者、企业可在超算互联网下载模型文件进行快速开发。
超算互联网表示,平台即将上线Qwen3系列模型镜像、应用空间快速体验服务,无需安装依赖,用户可0代码体验Qwen3系统模型对话服务,实现云端开箱即用。
据介绍,Qwen3-235B-A22B在编码、数学、通用能力等基准评测中表现出竞争力,能够与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等模型媲美。
此外,小型MoE模型Qwen3-30B-A3B以激活参数数量的10倍优势超越了QwQ-32B,Qwen3-4B小型模型也能匹敌Qwen2.5-72B-Instruct的性能。
猜你还喜欢
- 07-26 李想开抖音了:我的第一条抖音恳请大家听我讲完
- 07-26 时间不多了!现在下定小米YU7还能享受首销期权益:价值66000元
- 07-26 iPhone 17 Pro橙色新配色上热搜:辨识度最高的苹果手机
- 07-26 图灵奖得主点赞中国科幻小说《三体》 刘慈欣隔空回应
- 07-26 iPhone 17绿色机模开箱:清新配色 一眼种草
- 07-26 女演员高海宁回应患精神疾病:还没有完全康复
- 07-26 为什么建议每天最少走7000步 研究发现能降低死亡风险
- 07-26 泰国一男子一个月不吃饭 仅靠“液体面包”度日:家中暴毙
- 07-26 特斯拉辅助驾驶排第一:懂车帝这个测试有意义吗
- 07-26 在玉米地和牧场里采铀!中国的铀矿到底是怎么开采的
- 07-25 特朗普嫌AI名字太土 “人工”之说低估了它的智慧!
- 07-25 美团拼好饭推出百万亮厨计划:联合20万商家图文、直播展示后厨环境
取消回复欢迎 你 发表评论:
- 热门文章
暂无评论,来添加一个吧。