谷歌和 OpenAI 又杠上了。
在新版 GPT-4o 刚登顶竞技榜后 1 天,立马发布最新查考版模子 Gemini-Exp-1121 夺回冠军宝座。
要知说念,一周前上一版模子 Gemini-Exp-1114 才发布。
这怕不是拿准了 OpenAI 会来争擂台,专门留了一手。
这等于带领 OpenAI 发新版 GPT-4o,然后再用更好的模子来狙击它。
谷歌的看管东说念主员们昭彰很沸腾。
谷歌 DeepMind 首席科学家 Jack Rae,称这是一场兴趣兴趣的后教诲"闪电战"。示意 post-training 的迭代速率要比预教诲快得多。
DeepMind 看管副总裁 Oriol Vinyals 还隔空提问奥特曼:最近还有提交筹谋吗?
炸药味很足,也很自信啊。
是以" 1121 "有多强?来看具体性能。
代码 / 推理 / 视觉相识全训导
按照官方说法,Gemni-Exp-1121 要点训导了三方面性能。
代码才调显耀训导
更强推理才调
更强视觉相识才调
除了作风闭幕外,其他方面现时都位于第一。
在视觉才调方面,Gemini-Exp-1121 比上一版还有训导。
作风闭幕下的复杂教导词方面,Gemini-Exp-1121 和 o1-preview、New Sonnet 3.5 水平零散。
竞技场中的试验胜率如下。
当今也能径直上手体验。
比如针对兼并张漫画,让 Gemini-Exp-1121 和 GPT-4o-lastest-1120 给出相识。
Gemini-Exp-1121 的回答愈加全面且精通,何况善用小标题、要点加粗。
新版 4o 的回应就比拟爽直和无极。
在经典的动物过河逻辑推理题上,Gemini-Exp-1121 回答皆备正确,新版 4o 出现了一些造作,把第三次过河和第四次过河合并了,因此回答有误。
问题:农夫需要把狼、羊和白菜都带过河,但每次只可带通常物品,而且狼和羊不可单独相处,羊和白菜也不可单独相处,问农夫该怎样过河。
One More Thing
值得一提的是,OpenAI 这边也有新音讯。
有东说念主在 ChatGPT 最新测试版块中初度发现了"及时摄像"(Live Camera)视频功能的代码。
它具体包括及时摄像、及时措置、语音神态集成以及视觉识别才调。
在高等语音神态推出时,一些用户有体验到这一才调。
这意味着 OpenAI 依然作念好了上线这一功能的准备。
另一边谷歌也演示过雷同的 demo,还没上线。按照 OpenAI 的调性,很可能会抢在谷歌前全量铺开。
玩忽比及来岁,和 Chatbot 的主要商酌形势,就要从翰墨对话转为语音和 agent 了。Live Camera 可能等于运行,你认为呢?
参考贯通:
[ 1 ] https://x.com/OfficialLoganK/status/1859667244688736419
[ 2 ] https://x.com/adonis_singh/status/1859682100569571399
[ 3 ] https://x.com/OriolVinyalsML/status/1859730969600852222
[ 4 ] https://x.com/rowancheung/status/1859301345993556277开云kaiyun.com