腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
作者:小编日期:2025-03-22浏览:13405分类:热门事件
问鼎娱乐网3月22日消息,腾讯正式发布了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。
腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。
通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。
在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于o1。
在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。
T1还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。
混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。
这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本。
基于出色的长文捕捉能力,混元T1能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。
同时,混合Mamba架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在相近的激活参数量下,实现了解码速度提升2倍。
目前腾讯混元T1已经开放体验,同时还上线了API:输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。
猜你还喜欢
- 05-28 小米15S Pro支持UWB车钥匙 小米回应手机丢失别人能否解锁YU7
- 05-28 40岁抗癌博主输液时意外离世:患肝癌晚期
- 05-28 明明评测个个满帧 你的手机打游戏为什么还是这么卡
- 05-28 最梦幻的苹果手机!iPhone将迈入全面屏时代:史无前例
- 05-28 很多人被蒙骗了:减重专家破解减肥九大谣言
- 05-28 曹氏鸭脖一门店碗底印“你像猪一样能吃” 网友热议
- 05-28 REDMI率先在2500元档普及金属中框+超声波:产品力领先同档
- 05-28 平板就是生产力!雷军带两部小米平板7 Ultra:一部会议 一部记笔记
- 05-28 被指撞期高考 张学友东莞演唱会延期 补偿通告发布
- 05-28 深蓝汽车车机开屏广告引争议 CEO道歉:是我提的要求 我的错
- 05-27 小米辟谣玄戒O1是向Arm定制芯片:研发过程没用Arm CSS服务
- 05-27 小米15S Pro采用外挂基带方案 官方:体验和其它主流旗舰一致
取消回复欢迎 你 发表评论:
- 热门文章
暂无评论,来添加一个吧。