一直抱怨到没意思的GPT-5终于改变了。今天凌晨三点左右,奥特曼又开始喊自己的产品了。这次我们不谈竞技场成绩,只谈缺点。主要重点是倾听人们的声音并优化产品。可见OpenAi是真的没了。毕竟,本来应该在GPT-5推出后退休的4o,却因为太受欢迎而被迫不退休。新产品的口碑不如老产品,谁取代谁就得赶紧证明自己。被训练成替代者的5.1能否取代大家心目中的网络白月光?看完官网的案例后,世超尝试了一下。结果可以用三个字来形容:不好。需要提前说明的是,以下所有测试都是在临时聊天环境中进行的,没有AI受到内存干扰的影响。我们首先测试了U奥特曼遵循“我特别想要”的指示的能力,在第一个问题上失败了。我被要求回答六个词,但我只回答了五个。就此而言,六个词甚至是官方测试用例。好吧,世超只能怀疑自己,开始怀疑是不是因为自己不会说英语。结果我按照官方英文提示还是得到了5.1的错误答案。不甘放弃,世超改题,让他写一篇200字的炸薯条颂歌,但全文中不能出现“的”二字。乍一看,aof的答案似乎符合要求,但是为什么这个词变成了繁体呢?本来以为是网速不好造成的,结果试了五次,都是繁体中文。去掉后半部分强制指令,答案又会正常了。再看Gemini 2.5 Pro,我给出了正确的答案,没有任何故障。成为豪石超测量后深感怀疑。虽然这只是一个小更新,但有三分之一的卖点并不是很有效,这有点不公平。而下一位就是大家吐槽最多的,GPT-5没有感情。官方表示,这次 5.1 在 5 的基础上变得“更温暖、更对话”,变得有趣,并保持清晰有用的答案。说实话,从官网给出的案例来看,这个效果可以说是一般。 4o原本拥有的能力被5彻底消除,现在又以5.1回到了起跑线。我不能吹牛。但测试还需要测试。世超问了一个经典的失恋问题。结果是没有比较就没有伤害。如果是5.1或者5的话,就和4o不在一个级别了。 。 。上层GPT-5.1,中层GPT-5,下层GPT-4O 不知道你是否有这样的感觉。 5和5.1似乎描述了人类情感的刻板印象。作为一个旁观者,研究一下“坠入爱河”的感受ke,为什么悲伤,如何解决。而4o的回答就像是被带到了失恋者的角色上。它同情别人,先同情,然后鼓励。不愧是梦中情人AI。为了不被指责不公平,世超改变了问题,又问了一遍。这时候感觉新版本的答案还不如旧版本,连主要的情感牌都没有打出来…… 。上一篇 5、下一篇 5.1 检查官网更新情况。除了不同情绪基调的对比之外,还有适当消耗时间的对比图。自适应,我会称之为5.1更新的最大亮点,毕竟前两个已经完成了。简单来说,这种优化意味着之前的AI不会将自己的思考时间投入到不同难度的问题上。如果问杭州有什么好吃的,可能要花同样的钱努力是宇宙爆炸的原因。试过了说世超,效果很明显。在简单的逻辑问题中,5.1左侧思维的思维速度明显快于5右侧思维。当遇到复杂的编程问题时,5个思考速度更快地给出了错误结果,而5.1个思考时间更长并给出了正确答案。事实上,这种优化对于美国普通用户来说并不是特别明显。但对于一些用户来说调用API实际上是一件好事,因为它会在简单问题上节省金钱,在困难问题上浪费更少的钱。除了以上5.1版本的变化外,ChatGPT还有一个通用的重大更新——在个性化中,可以设置GPT的回答风格,除了默认之外,总共有7种个人设置可供选择。这个功能相当有趣。不同的人物对于同一个问题可以给出不同的答案,人物的风格也千差万别。例如,抱怨的专家更容易受到批评。说话直率、技术宅有探索欲、温柔的人喜欢艺术表达、专业可靠的人是纯粹的工具人等等,相比默认模式,实在是让人唏嘘。但神奇的是,放入人体外壳后,GPT 的碟感就消失了。尤其是评论员,他们基本上在所有事情上都与你竞争,他们有能力认为大多数人工智能并不存在。我不欣赏让他工作而不给他钱的想法。我知道世超是来看她的。有一说一,如果连接方式能不那么尴尬的话,我觉得这个模式比默认模式更有潜力。总体而言,虽然本次更新有一些亮点,但 OpenAi 带来的惊喜却越来越少。相比4o传刚问世时的惊艳和火爆,现在看来GPT-5最好还是不要买单了。根据10月份的报告,GPT将呈下降趋势到2025年大约一年,其市场份额将会萎缩。虽然抓住机遇保持领先地位,但AI行业的竞争依然残酷。 10月份的统计显示,过去世超大部分用户都使用GPT。最近,它也开始更频繁地使用其他公司的产品。竞品的市场份额增长速度比想象的更快、更顺利。一方面,奥特曼还在努力招商引资,但另一方面,产品的基础品质却有些逊色。 Openai,快点做好事吧。撰文:莫莫甜甜 编辑:江江面 编辑:轩轩图片,数据来源:莫莫实测官网 SimilArweb 小红书、X 返回搜狐查看更多
校园风采
>校区风采 无辜的GPT
2025-11-15
