OpenAI推理大模型来了,它真的能改变世界吗

财云财经 阅读:2750 2024-09-14 14:22:00 评论:0
摘要: OpenAI推出可像人类思考解题的推理大模型,有新特点与优势,不过也有局限性,受到广泛关注。

OpenAI推理大模型的惊艳登场

OpenAI在北京时间周五凌晨1时许,揭开了AI新时代的序幕,向全体订阅用户推送了OpenAIo1预览模型。这一模型的出现,标志着人工智能在通用复杂推理领域迈出了重要的一步。

像人类一样思考的大模型

以往的大模型通过学习大量数据集中的模式来预测单词生成的序列,并非真正理解提问。而OpenAIo1推理大模型的独特之处在于,它会在回答之前花更多时间进行思考,就如同人类思考解决问题的过程。

OpenAI推理大模型来了,它真的能改变世界吗

能力的显著提升

相较于GPT-4o等现有的大模型,OpenAIo1能够解决更加困难的推理问题,并改善过往模型中的机制性缺陷。例如,它能够准确数出“strawberry”里“r”的个数,在编程问题的解答上也更加有条理。

在预设条件的写诗任务中,GPT-4o往往只能满足部分条件且不会自我纠正,而o1模型会不断试错并打磨答案,从而大大提高了生成结果的准确率和质量。

超越以往的表现

OpenAI的研究负责人JerryTworek透露,o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿训练数据中的模式,而o1的训练旨在让其独立解决问题。

在国际数学奥林匹克的资格考试中,o1模型能够拿到83%的分数,而GPT-4o只能正确解决13%的问题。在编程能力比赛Codeforces中,o1模型拿到89%百分位的成绩,而GPT-4o只有11%。

令人期待的未来发展

OpenAI表示,在下一个更新的版本中,AI在物理、化学和生物学的挑战性基准测试中,表现能够与博士生水平类似。这无疑让人们对其未来充满了期待。

仍存在的局限性

OpenAIo1模型并非完美无缺。它至少目前还不是多模态大模型,在回答事实性问题时也不如其他模型。所以在图像互动、常识问答、互联网搜索方面,GPT-4o依然更具优势。

另一个问题则是高昂的价格。o1-预览模型的定价是每百万个输入tokens15美元,每百万个输出tokens则要60美元,分别是GPT-4o的3倍和4倍。

而且从OpenAI的限制举措来看,这个推理模型恐怕非常消耗算力。公司对ChatGPT订阅用户、企业版ChatGPT和教育用户的访问及使用都做了相应的限制。

对各行业的影响

会自己思考问题的AI模型,对于程序员、创意工作者,以及几乎所有的理科相关专业工作者而言无疑是有益的升级。但它的局限性也可能在一定程度上影响其在某些领域的应用。

OpenAI推理大模型的出现是人工智能领域的一次重大突破,但要实现更广泛和深入的应用,还需要不断克服其局限性,降低成本,拓展功能。

OpenAI推理大模型来了,它真的能改变世界吗

相关问答

OpenAIo1模型与以往模型最大的不同是什么?

OpenAIo1模型最大的不同在于它会像人类一样在回答前花更多时间思考解题逻辑,而非单纯模仿训练数据中的模式。

OpenAIo1模型在哪些方面表现出色?

它在解决困难推理问题、提高编程回答的条理性和准确性、不断试错打磨答案等方面表现出色。

OpenAIo1模型有哪些局限性?

目前它不是多模态大模型,回答事实性问题不如其他模型,价格昂贵且消耗算力大。

OpenAIo1模型在哪些测试中表现优异?

在国际数学奥林匹克资格考试和编程能力比赛Codeforces中表现优异。

OpenAIo1模型未来会有哪些改进?

未来可能会增加联网、文件和图像上传等功能,在物理、化学和生物学的测试中有望达到博士生水平。

OpenAIo1模型的价格有多高?

o1-预览模型的定价是每百万个输入tokens15美元,每百万个输出tokens则要60美元,分别是GPT-4o的3倍和4倍。

声明

转载声明:欢迎分享本文,转载请保留出处!

本文网址:https://www.caiair.cn/post/openai-tuili-da-moxing-858794.html

上一篇:

下一篇:

搜索