发布日期:2024-12-08 12:08 点击次数:104
o1 满血版此次不搞灰度了反差 推特,发布仅 4 个小时后,已推送给系数(付费)用户!
手快的网友照旧耍起来了~
不外此次推出了更高等的 Pro 形状,每月 200 好意思元的订价也确切让东谈主望而生畏。
Pro 形状和郑再版 o1 究竟有啥分手,快要 1500 元的价钱到底值不值?
很多好心东谈主照故友钱帮行家测了。
要是让它完成一个数独,足足能念念考5 分 30 秒。
AI 在念念考历程中依然会犯很多弱点,但此次分手在于它有了自我蜕变的能力,直到得出正确谜底为止。
花了这样多钱,那对它的期待势必是很高的,有东谈主上来便是一个"请养息癌症"。
AI 亦然绝不客气,径直在念念维链中接下"正在养息癌症"这个任务。别管恶果若何,就冲它真的致力去尝试少量,就值得点赞。
26 秒事后,o1 pro 给出了它的戒备谜底:
领先融会目下莫得治疗系数类型癌症的单一设施
先容当代常用多种设施组合的"鸡尾酒疗法"
例如目下可被养息的癌症类型
补充来日有远景的计议标的
临了忽视用户寻求更专科的商议
正如奥特曼强调的:Pro 形状的上风在于,它不错愈加致力地去念念考最清贫的问题。
o1 pro 形状,1500 值不值?
再来看另一个与生物医学联系的问题,o1 pro 形状找出了同期得志 6 个复杂条目的特定卵白质,用时 53 秒。
反差 推特
固然,要是真的给它一个超出能力边界的问题,它在致力念念考事后也会当令放弃。
只用 HTML 代码复刻经典游戏《废弃战士》。
o1 pro 形状:这是不行能完成的。
o1 恰是之前里面代号"草莓"的模子,此次" strawberry 里有几个 r "是约略率难不住它了。
以致能够全程不提这个单词的情况下,把" strawberry 中有 3 个 r "这层意旨兴趣兴趣用诗发达出来。
咱们尝试把这首诗再喂给一个新的 o1 对话,发现它也能够贯串这首诗想说什么,且给出了另一个合适条目的谜底" Rasberry "(也便是树莓派的阿谁树莓),况且把诗翻译成汉文。
为什么它莫得预料 Strawberry 呢?张开念念维链,发现它其实也斟酌到了草莓,但决定"无核"这个态状更合适树莓,毕竟草莓名义照旧有籽的,树莓的籽更小且藏在里面。
另外咱们还发现,把诗翻译成汉文这个教唆,尽然无需占用推理 token,解谜完成后念念考就限度了。
它很强,但也会出错,会把 6 个手指的手当成竣工平常的。
鉴于 AI 生图也常常画出六个手指,东谈主类的手指对 AI 来说就这样难吗?
是以到临了,200 好意思元到底值不值?奥特曼也给出了官方恢复:
绝大多数东谈主用免费版或 20 好意思元版就充足了,200 好意思元版只适合很小一部分东谈主,他们想要无数使用,且惬心为科罚信得过清贫的问题付更多钱。
20 好意思元版 o1 也很强
要是确乎不想一个月花 200 好意思元,20 好意思元版 o1 也充足强。
目下它不错汲取视觉输入,基于图像推理了。
有东谈主把十年前的 XKCD 讥笑漫画发给它,其时需要 5 年才能科罚的代码,这回 o1 就地就给写出来喽。
甲方:当用户拍照时,APP 要判断他们是否位于国度公园……
才智员:这很容易,用地舆信息查询,给我几个小时。
甲方:……还要判断是否是鸟类的像片。
才智员:那我需要一个计议团队和 5 年技巧。
在诡计机科学中,很深邃释浅易和近乎不行能之间的分手。
再来望望这个绕得脑壳疼的问题:
说出某种文娱体式的一个特定作品,这种文娱体式的首字母缩略词也不错代表看望过一个地区的团体的名字,该地区来日的引导东谈主与意大利东谈主结婚了。
出题者称 ChatGPT 4o、o1-mini、Claude 3.5 Sonnet 作念三次错三次,而 o1 是作念三次对三次!
至于为什么《最终幻想》合适要求,相似不错让 o1 我方来诠释。
One More Thing
o1 郑再版以及 o1 pro 形状,仅仅 OpenAI 12 天直播发布筹划中的第一份大礼。
未来凌晨 2 点,新发布还将无间。
鉴于 o1 郑再版目下只发布在 ChatGPT 期骗上,API 接口还未洞开。
况且已有东谈主 ChatGPT 的前端代码中扒出 GPT-4.5 的存在。
不少东谈主臆测,下一场发布将是 GPT-4.5 和对应 API,以便与隔邻 Claude 竞争,霸占建树者市集。
参考相连:
[ 1 ] https://x.com/liambolling/status/1864761137436537139
三级[ 2 ] https://x.com/__nmca__/status/1864739625140654469
[ 3 ] https://x.com/goodside/status/1864806604735955080
[ 4 ] https://x.com/emollick/status/1864744770695815234反差 推特