OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-12
2025年中信用趋势|商业银行:银行业务增长和盈利性承压,政府支持态度保证高风险银行的正常经营实测是真的 调查显示印度7月通胀预计降至1.3% 有望创12年新低实测是真的 专用设备行业董秘观察:速达股份谢立智2024年薪酬为73万元 较前一年薪酬减少104万元下滑近60% 通用设备行业董秘观察:中集集团吴三强博士学历违规1次 薪酬高达264万元领跑全行业官方已经证实 通用设备行业董秘观察:新莱应材朱孟勇因内幕交易被罚没217万元 2024年薪酬为51万元 棒杰股份:8月11日召开董事会会议后续会怎么发展 国网上海电力 | 上电股份 | 华东电力设计院 | 上海铁塔 | 采日能源 | 良信电器 | 天炜能源 | 欧秒电力 |宝临电气 专用设备行业董秘观察:凯格精机邱靖琳28岁 为行业内最年轻 薪酬达76万元超行业平均后续来了 专用设备行业董秘观察:*ST星农王黎明收3次警示函 薪酬为30万元 149元 小米无线键鼠套装舒适版开售:全尺寸手托键盘、非对称鼠标 百果园迟早要“迎合消费者”实垂了 国网上海电力 | 上电股份 | 华东电力设计院 | 上海铁塔 | 采日能源 | 良信电器 | 天炜能源 | 欧秒电力 |宝临电气秒懂 上市银行首份半年报出炉,赚得投资收益同比涨30%至12亿,代销理财规模增155% 专用设备行业董秘观察:杰克股份谢云娇薪酬最高 高达186万元又一个里程碑 长宁区发出上海首张“个转企”营业执照,个体户转企业全程辅导不用愁官方处理结果 2025年中信用趋势|不良资产证券化:发行持续增长,回收分化显著实测是真的 荷兰国际银行:7月核心CPI月率若为0.3%,美联储9月将有降息空间最新报道 通用设备行业董秘观察:咸亨国际叶兴波博士学历 违规次数高达3次 薪酬仍高达100万元 洪田股份:控股子公司掩模版和玻璃基板设备所获订单金额约375万元 专用设备行业董秘观察:花溪科技史守义薪酬垫底 仅不到12万元秒懂 永安期货助力武昆股份完成上期所螺纹钢仓单交付首单反转来了 事关稳定币!蚂蚁集团辟谣 通用设备行业财务总监CFO观察:大元泵业叶晨晨年龄30岁为行业内最年轻 2024年薪酬为34万元 专用设备行业财务总监CFO观察:蓝英装备余之森博士学历 薪酬高达320万元 高居行业首位是真的吗? 宏光MINIEV销量突破170万辆 连续60个月领跑微型新能源车市场 连续三周新基募集超30只!权益基金占比超八成,指数型成主流! 休闲食品概念震荡拉升,桂发祥涨停官方通报 专用设备行业财务总监CFO观察:威派格归母净利润暴跌1008% 而财务总监陈平薪酬上涨35% 专用设备行业财务总监CFO观察:科达制造曾飞仅大专学历 2024年薪酬为150万元为行业第五太强大了 7月比亚迪销量为34.4万辆,市场份额达13.6%居新能源车企首位最新进展 泰国东北部降雨覆盖率达70%,全国降雨将增多这么做真的好么? 601718,突遭立案!投资者权益如何保护?最新进展 *ST汇科被处罚预告 股民索赔持续推进 具身机器人挤满“90后”,“学渣”王兴兴在前,“学霸”王鹤在后 具身机器人挤满“90后”,“学渣”王兴兴在前,“学霸”王鹤在后 行动教育:上半年归母净利润1.31亿元,同比下降3.51%最新报道 乐聚机器人冷晓琨:一年后双足人形机器人会刷新人们认知 罗博特科:ficonTEC与美国苹果公司有合作官方处理结果 继东方通(300379)公司,实控人也被立案,股民索赔可期最新进展 南方精工(002553)投资者索赔分析官方通报来了 601718,突遭立案!投资者权益如何保护?后续来了 小米汽车公布碰撞检测专利,有利于保障用户人身安全后续会怎么发展 牧原股份:业绩增长、港股上市拓出海赛道、多项ESG指标居行业末位又一个里程碑 博时宏观观点:降息预期升温,看好科技成长行情专家已经证实 东方通(300379)投资者索赔分析实时报道 东方雨虹:收到龙国首都证监局警示函记者时时跟进 际华集团被立案 受损股民可索赔 高鸿股份(000851)收到证监会行政处罚事先告知书,投资者索赔启动 博时宏观观点:降息预期升温,看好科技成长行情后续反转

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章