无辜的GPT_51吃瓜爆料黑料网曝门-黑料网爆料-黑蘑菇爆料视频

无辜的GPT

2025-11-15

一直抱怨到没意思的GPT-5终于改变了。今天凌晨三点左右，奥特曼又开始喊自己的产品了。这次我们不谈竞技场成绩，只谈缺点。主要重点是倾听人们的声音并优化产品。可见OpenAi是真的没了。毕竟，本来应该在GPT-5推出后退休的4o，却因为太受欢迎而被迫不退休。新产品的口碑不如老产品，谁取代谁就得赶紧证明自己。被训练成替代者的5.1能否取代大家心目中的网络白月光？看完官网的案例后，世超尝试了一下。结果可以用三个字来形容：不好。需要提前说明的是，以下所有测试都是在临时聊天环境中进行的，没有AI受到内存干扰的影响。我们首先测试了U奥特曼遵循“我特别想要”的指示的能力，在第一个问题上失败了。我被要求回答六个词，但我只回答了五个。就此而言，六个词甚至是官方测试用例。好吧，世超只能怀疑自己，开始怀疑是不是因为自己不会说英语。结果我按照官方英文提示还是得到了5.1的错误答案。不甘放弃，世超改题，让他写一篇200字的炸薯条颂歌，但全文中不能出现“的”二字。乍一看，aof的答案似乎符合要求，但是为什么这个词变成了繁体呢？本来以为是网速不好造成的，结果试了五次，都是繁体中文。去掉后半部分强制指令，答案又会正常了。再看Gemini 2.5 Pro，我给出了正确的答案，没有任何故障。成为豪石超测量后深感怀疑。虽然这只是一个小更新，但有三分之一的卖点并不是很有效，这有点不公平。而下一位就是大家吐槽最多的，GPT-5没有感情。官方表示，这次 5.1 在 5 的基础上变得“更温暖、更对话”，变得有趣，并保持清晰有用的答案。说实话，从官网给出的案例来看，这个效果可以说是一般。 4o原本拥有的能力被5彻底消除，现在又以5.1回到了起跑线。我不能吹牛。但测试还需要测试。世超问了一个经典的失恋问题。结果是没有比较就没有伤害。如果是5.1或者5的话，就和4o不在一个级别了。。。上层GPT-5.1，中层GPT-5，下层GPT-4O 不知道你是否有这样的感觉。 5和5.1似乎描述了人类情感的刻板印象。作为一个旁观者，研究一下“坠入爱河”的感受ke，为什么悲伤，如何解决。而4o的回答就像是被带到了失恋者的角色上。它同情别人，先同情，然后鼓励。不愧是梦中情人AI。为了不被指责不公平，世超改变了问题，又问了一遍。这时候感觉新版本的答案还不如旧版本，连主要的情感牌都没有打出来…… 。上一篇 5、下一篇 5.1 检查官网更新情况。除了不同情绪基调的对比之外，还有适当消耗时间的对比图。自适应，我会称之为5.1更新的最大亮点，毕竟前两个已经完成了。简单来说，这种优化意味着之前的AI不会将自己的思考时间投入到不同难度的问题上。如果问杭州有什么好吃的，可能要花同样的钱努力是宇宙爆炸的原因。试过了说世超，效果很明显。在简单的逻辑问题中，5.1左侧思维的思维速度明显快于5右侧思维。当遇到复杂的编程问题时，5个思考速度更快地给出了错误结果，而5.1个思考时间更长并给出了正确答案。事实上，这种优化对于美国普通用户来说并不是特别明显。但对于一些用户来说调用API实际上是一件好事，因为它会在简单问题上节省金钱，在困难问题上浪费更少的钱。除了以上5.1版本的变化外，ChatGPT还有一个通用的重大更新——在个性化中，可以设置GPT的回答风格，除了默认之外，总共有7种个人设置可供选择。这个功能相当有趣。不同的人物对于同一个问题可以给出不同的答案，人物的风格也千差万别。例如，抱怨的专家更容易受到批评。说话直率、技术宅有探索欲、温柔的人喜欢艺术表达、专业可靠的人是纯粹的工具人等等，相比默认模式，实在是让人唏嘘。但神奇的是，放入人体外壳后，GPT 的碟感就消失了。尤其是评论员，他们基本上在所有事情上都与你竞争，他们有能力认为大多数人工智能并不存在。我不欣赏让他工作而不给他钱的想法。我知道世超是来看她的。有一说一，如果连接方式能不那么尴尬的话，我觉得这个模式比默认模式更有潜力。总体而言，虽然本次更新有一些亮点，但 OpenAi 带来的惊喜却越来越少。相比4o传刚问世时的惊艳和火爆，现在看来GPT-5最好还是不要买单了。根据10月份的报告，GPT将呈下降趋势到2025年大约一年，其市场份额将会萎缩。虽然抓住机遇保持领先地位，但AI行业的竞争依然残酷。 10月份的统计显示，过去世超大部分用户都使用GPT。最近，它也开始更频繁地使用其他公司的产品。竞品的市场份额增长速度比想象的更快、更顺利。一方面，奥特曼还在努力招商引资，但另一方面，产品的基础品质却有些逊色。 Openai，快点做好事吧。撰文：莫莫甜甜编辑：江江面编辑：轩轩图片，数据来源：莫莫实测官网 SimilArweb 小红书、X 返回搜狐查看更多