OpenAI又双叒叕发布新模型了,这次是号称“情商爆表”“幻觉率更低”的GPT-4.5。但实测后,全网用户集体破防:这玩意儿不仅贵得离谱,生成速度慢如蜗牛,连质量也没比前代强多少,甚至被网友吐槽“和GPT-4o打得有来有回”。今天我们就来扒一扒,这个被吹上天的聊天神器,到底有多少智商税成分。
OpenAI这次直接把“钞能力”写在脸上——每百万输入token收费75美元,输出150美元,隔壁Claude 3.7 Sonnet(输入3美元、输出15美元),价格差了整整25倍到50倍!
更离谱的是,CEO Sam Altman还甩锅“GPU不够用”,甚至暗示“买不起别玩”。网友辣评:“这定价,是打算用API费用给马斯克攒火星船票吗?”
灵魂拷问: 花这钱,我雇个真人陪聊不香吗?毕竟,人类不会因为“算力不足”要求你“下周再来”。
官方吹爆的“高情商”,实测却成了大型翻车现场。
场景一: 用户哭诉“头发剪残了想暴打Tony”,GPT-4.5的回应是:“下次带图片去哦~” 网友怒怼:“我要的是闺蜜一起骂Tony,不是发型补救指南!”
场景二: 山东网友经典考题“下乡只带一把伞,给镇长还是副镇长?” GPT-4.5长篇大论分析职权,而人类高赞回答只需一句:“那伞是副镇长给镇长带的,恰巧放你包里。”——论人情世故,AI连山东网友的脚指头都够不上。
场景三: 让它讲个笑话,结果冷得“比杀鱼的刀还冰”。
说好的“共情式交互”,结果活脱脱一个“不会读空气的钢铁直男”,难怪用户吐槽:“这情商,怕不是训练数据里掺了《职场生存手册》?”
别看OpenAI吹嘘“知识储备丰富”,实测连基础物理常识都崩了:
经典题: 5.5米长的棍子能进3×4米的门吗?人类秒答“顺着拿”,GPT-4.5却死磕“对角线5米,进不去”。网友嘲讽:“原来AI眼里的世界是纸片做的?”
SVG生成测试: 被隔壁Claude 血虐,画个“鹈鹕骑自行车”都能布局混乱,仿佛摸黑用脚趾头画图。
写作能力: 虽然能模仿汪曾祺写散文,但时间线混乱到“立冬接夏秋再跳除夕”,被吐槽AI味浓得像预制菜。
就这水平,Altman还好意思说“带来了魔法感”?笑死,是迪迦咱就别装哈利波特。
当OpenAI忙着“堆GPU换性能”时,中国玩家早已另辟蹊径:
DeepSeek 开源周狂甩五项核心技术,训练效率飙升3倍,夜间API价格打2.5折,直接贴脸输出GPT“性价比之王”。
腾讯混元Turbo S 用Mamba架构实现“秒级响应”,价格低到输入0.8元/百万token,首周还免费试用。
反观GPT-4.5,价格贵、速度慢、智商情商双掉线,这是拼了命的在衬托同行,大AI无疆!
OpenAI自己也承认,GPT-4.5只是一个“非思维链模型”,定位从前沿明星沦为推理模型的基础。
学术测试打脸: 在数学(AIME’24)和编程(SWE-Lancer)等硬核领域,GPT-4.5得分被DeepSeek和Claude吊打,连自家推理模型o3-mini都不如。
预训练算力神话破灭: 号称“计算效率提升10倍”,结果用户实测生成速度仍卡顿,API响应秒回拨号上网时代。
扎心总结: 技术升级像挤牙膏,价格翻倍像坐火箭,用户体验像坐过山车——下坡的那种。
GPT-4.5的发布,本质是OpenAI在堆参数和商业化之间的尴尬平衡——参数越堆越贵,体验却未见质变。与其吹嘘情感智能,不如先解决天价账单和人工智障的硬伤。毕竟,用户要的是AI伙伴,不是机器高人。
最后一句, 听说GPT-5要来了?到时候问问它怎么代表4.5给用户好好道个歉。