在AI界里最火,也最被关注的就是OpenAI的GPT。他们的发布会跟苹果发布会,华为发布会一样备受全球的科技互联网爱好者的关注。因为这些都代表着互联网科技的未来和方向。就在当地时间5月13日上午10点,OpenAI春季发布会终于千呼万唤始出来。
而上一次的发布会已经是一年前的事了。在上次发布会推出GPT-4后,震惊了整个科技互联网,而这次发布会,大家都带着强烈的期待,在此之前有太多的猜测,像AI搜索引擎,GPT5等等,但真的没有一个能猜到。在新发布的版本里,还有大家更猜不到的。
如果没空看的话,可以直接点击上面的:听全文收听。
本次发布会发布的不是GPT-5,而是GPT-4的迭代版本,GPT-4o。OpenAI表示,GPT-4o是一个“原生多模态”模型,它的命名来源于“omni”,即包罗万象之意。
这么一上来就来了一个“王炸”,真的让人又有了更高的期待。米拉·穆拉蒂一上来就说OpenAI的目标是进一步减小人们使用AI的障碍,让所有人都能在工作、学习、创造中用上AI工具。
看来OpenAI在过去的一年中,也发现了不少的问题,其中最大的问题就是功能太分散,用户使用不方便,现在这么一更新,也算是把用户的痛点给整上了。发布会上也说:在未来几周内,用户将会陆续自动更新到GPT-4o。
总结一下:在这一年中,OpenAI做了三件事:
1、集合研究了更强大的模型GPT-4o
2、更新用户界面提高使用体验
3、免费开放给用户。
GPT-4o作为新一代旗舰模型,把AI工具的使用门槛降到了更低的程度,不仅比上一代速度快两倍,能实现无延迟实时对话,而且用户不用注册,功能全部免费。这一次已经给了用户不少的惊喜啦。
ChatGPT现在也有桌面版本了,据OpenAI的CTO米拉·穆拉蒂(Mira Murati)表示,这也是他们第一次在易用性上做出改进。
另外,萨姆·奥尔特曼在X上补充道,模型升级不止在GPT上,开发者也可以在API里同步使用GPT-4o,价格是GPT-4 Turbo的一半,速度是GPT-4 Turbo的两倍。GPT-4o还在50多种除英文外的语言能力上得到了加强。在发布会上,还有一个现场测试的环节。
说到现场测试就让我想起了雷军在叫小爱的现场测试,太调皮了。我们来看看OpenAI研究员Marc Chen和Barret Zoph现场测试怎么测试GPT-4o。
可以毫不夸张地说,新模式的接受能力太强了,连呼吸都能辨别!Chen对GPT说,自己有点紧张,然后开始急促地呼吸。
GPT识别到了他呼吸的声音,说,别紧张,你喘得像个吸尘器,深呼吸,再吐气,接着GPT还开始指导Chen怎么深吸慢呼平复心情。能辨别周围环境的动静,还能即时反馈!
这么智能的反应,这么快就能有对策,比真人还要快啊。另外,就像我们生活中的一样,当你想打断对方的讲话时,对方会怎么回应呢?
在新模型中,又会有什么样反馈?Chen让GPT给Zoph讲个睡前故事哄他入睡,Chen反复打断GPT的讲述,问它能不能讲得更刺激点,最后,GPT跟迪士尼公主似的把故事用歌唱了出来。在新版本里,你要是不想听可以立刻打断或者提出意见,就像在真实生活里的交流一样。
最后,我们再总结一下,GPT-4o可以综合利用语音、文本和视觉信息进行推理,该模型将在未来几周内分阶段集成至OpenAI的各个产品之中,将免费提供给所有用户使用。
新模型 GPT-4o的基本的功能:
1、API 2 倍速度、一半价格、5 倍频率,更快的响应频率,就像人与人之前的对话交流一样。
2、语音更自然,可以唱歌,可以学机器人说话,音频功能还可以实时打断不必等待完成,更加人性化了。
3、通过视觉功能,可以在线教你解题,还可以看你的表情并理解。
4、能读懂你的屏幕,可以直接展示代码,它告诉你代码什么问题、图表是什么意思。
5、强大的实时翻译功能,作为中介帮你翻译给对方,并帮对方翻译给你,以后的翻译都要失业了。
另外,对于咱们来说,还有一个功能很友好,那就是GPT-4o对中文的理解能力更强了。看完发布会,还有这些介绍之后,真的很想马上就去体验一下这一款号称:包罗万象 的AI新工具。
看完,记得给点个赞 或者 转发,谢谢!
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有