DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

作者:news 发表时间:2025-08-12
丘钛科技早盘一度涨超5% 上半年纯利同比增超167%实测是真的 乳业股早盘涨幅居前 澳亚集团涨超36%现代牧业涨超17% 重大资产重组!光库科技20CM一字涨停!光模块继续走强,高“光”创业板人工智能ETF涨逾1%冲击前高 汇源纠纷背后:遭董事长起诉,创始人朱新礼或“闪现”丨消费一线 张忆东:专心找机会,震荡是长牛的蓄电池——港股行情展望及投资建议太强大了 阜博集团老板兜售版权,6天飙涨50亿 珍酒李渡现涨超9% 机构预计最早明年上半年有望达业绩底 逢跌必买!散户已成美股“脊梁”? 华晨龙国早盘涨近9% 预计上半年溢利同比增加13%至16%后续会怎么发展 重大资产重组!光库科技20CM一字涨停!光模块继续走强,高“光”创业板人工智能ETF涨逾1%冲击前高 OpenAI CEO呛声马斯克:希望对马斯克操纵X展开反调查这么做真的好么? 重大资产重组!光库科技20CM一字涨停!光模块继续走强,高“光”创业板人工智能ETF涨逾1%冲击前高后续来了 龙国首都环球影城零售服务岗位招募退休人员,时薪30元 一旦美CPI数据被“政治化”:这个逾2万亿美元的市场将第一个崩溃!实时报道 中广核电力早盘涨超4% 机构料公司盈利规模将逐步迈上新台阶 【USDA月报前瞻】美豆、美玉米产量或将上调,但巴西25/26年度大豆产量同比下降?实时报道 【中银宏观:7月通胀点评】服务消费季节性走强 陈果:当下难言抱团过热 行情演绎均尚有空间 刚刚!关深圳厂,裁950人!一家香港上市的半导体和电子设备制造巨头最新进展 央行公开市场净回笼4328亿元太强大了 人民币兑美元中间价报7.1405,下调23点 出口7.2% VS 非农“大跳水”:全球资金回流龙国? 淘宝闪购:立秋当天饿了么骑手数量达去年3.5倍,平均收入达1.4倍 2025年龙国正丙醇行业产业链图谱、产业现状、竞争格局及未来趋势:下游需求飙升,行业供需态势不断收紧[图]实垂了 2025年龙国正丙醇行业产业链图谱、产业现状、竞争格局及未来趋势:下游需求飙升,行业供需态势不断收紧[图]又一个里程碑 淘宝闪购:立秋当天饿了么骑手数量达去年3.5倍,平均收入达1.4倍官方已经证实 两融余额时隔十年再度突破两万亿元!中金:今年的A股会比2013年更强秒懂 安恒信息受邀在浙商传习空间分享AI驱动的企业数字化转型安全实践记者时时跟进 华夏银行部分董监高拟增持不低于3000万元股份,增持计划暂未实施 【中银宏观:宏观和大类资产配置周报(2025.8.10)】本周沪深300指数上涨1.23%官方通报来了 淘宝闪购:立秋当天饿了么骑手数量达去年3.5倍,平均收入达1.4倍学习了 七部门重磅发布!脑机接口概念走强,三博脑科飙升逾8%!A股最大医疗ETF(512170)溢价涨逾1%! 重大资产重组!光库科技20CM一字涨停!光模块继续走强,高“光”创业板人工智能ETF涨逾1%冲击前高 沪指稳步冲击前高,“旗手”延续活跃!国盛金控再触板,顶流券商ETF(512000)近5日吸金4.3亿元专家已经证实 Trade Desk(TTD.US)Q2绩后暴跌近40%,“木头姐”火速抄底超72.5万股后续反转 一旦美CPI数据被“政治化”:这个逾2万亿美元的市场将第一个崩溃!科技水平又一个里程碑 马斯克指责苹果在iPhone应用商店偏袒OpenAI反转来了 拥抱“淡定牛”...实时报道 华晨龙国早盘涨近9% 预计上半年溢利同比增加13%至16% 一旦美CPI数据被“政治化”:这个逾2万亿美元的市场将第一个崩溃!反转来了 白银遭遇-黑色星期一-:关税政策摇摆+美元走强双重压制,技术面关注38美元争夺战后续反转 大摩:宁德时代宜春锂矿停产或推动锂价上涨 有利库存价值提升

自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

本站

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。

据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

本站

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

本站

相关文章