91书院(91shuyuan.com)更新快,无弹窗!
演示到逻辑推理环节时,尴尬的事情发生了。
虽然GPT-5在GSM8K上的得分也提升到了85%左右,但在LogiQA和ProofWriter这种纯逻辑任务上,提升幅度却微乎其微,甚至在某些复杂场景下,依然会出现明显的「幻觉」。
更糟糕的是,为了强行提升逻辑能力,OpenAI在RLHF阶段引入了大量的逻辑数据进行微调,导致模型在日常对话中变得更加「机械」丶「冷漠」,失去了GPT-4那种讨人喜欢的「人情味」。
直播弹幕里,原本狂热的气氛开始冷却。
「就这?」
「那个屠榜的X呢?怎麽没看到?」
「感觉跟GPT-4没啥区别啊,甚至说话更像机器人了。」
「失望,退钱!」
……
发布会后的记者问答环节,气氛更是尖锐到了极点。
一位来自《纽约时报》的记者,直接站起来,抛出了那个所有人都想问的问题:
「奥特曼先生,最近在各大榜单上屠榜的神秘模型『X』,是否就是GPT-5的某个内部版本?为什麽我们在今天的演示中,没有看到那种令人震撼的逻辑推理能力?」
奥特曼的嘴角抽搐了一下。
他早就料到了会有这一问。
他深吸一口气,露出了一个高深莫测的笑容。
「关于『X』……」
他故意停顿了一下,目光扫过全场。
「我们OpenAI一直致力于探索AGI的边界。我们在内部确实有许多正在研发中的丶具有不同特性的实验性模型。」
「GPT-5是我们目前认为最平衡丶最适合推向市场的产品。至于其他的技术路径……」
他耸了耸肩,摊开双手。
「未来,一切皆有可能。」
这番话,说了等于没说。
既没有承认X是他们,也没有否认。
典型的「顾左右而言他」。
虽然公众对GPT-5的表现略有微词,但在奥特曼这番「画饼」操作下,OpenAI的股价在盘后依然坚挺。
只有奥特曼自己,回到后台后,瘫坐在沙发上,长长地叹了口气。
「这个X……到底是谁啊?」
……