OpenAI推理大模型来了，它真的能改变世界吗

财云财经阅读：2750 2024-09-14 14:22:00 评论：0

摘要： OpenAI推出可像人类思考解题的推理大模型，有新特点与优势，不过也有局限性，受到广泛关注。

OpenAI推理大模型的惊艳登场

OpenAI在北京时间周五凌晨1时许，揭开了AI新时代的序幕，向全体订阅用户推送了OpenAIo1预览模型。这一模型的出现，标志着人工智能在通用复杂推理领域迈出了重要的一步。

以往的大模型通过学习大量数据集中的模式来预测单词生成的序列，并非真正理解提问。而OpenAIo1推理大模型的独特之处在于，它会在回答之前花更多时间进行思考，就如同人类思考解决问题的过程。

OpenAI推理大模型来了，它真的能改变世界吗

相较于GPT-4o等现有的大模型，OpenAIo1能够解决更加困难的推理问题，并改善过往模型中的机制性缺陷。例如，它能够准确数出“strawberry”里“r”的个数，在编程问题的解答上也更加有条理。

在预设条件的写诗任务中，GPT-4o往往只能满足部分条件且不会自我纠正，而o1模型会不断试错并打磨答案，从而大大提高了生成结果的准确率和质量。

OpenAI的研究负责人JerryTworek透露，o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿训练数据中的模式，而o1的训练旨在让其独立解决问题。

在国际数学奥林匹克的资格考试中，o1模型能够拿到83%的分数，而GPT-4o只能正确解决13%的问题。在编程能力比赛Codeforces中，o1模型拿到89%百分位的成绩，而GPT-4o只有11%。

OpenAI表示，在下一个更新的版本中，AI在物理、化学和生物学的挑战性基准测试中，表现能够与博士生水平类似。这无疑让人们对其未来充满了期待。

OpenAIo1模型并非完美无缺。它至少目前还不是多模态大模型，在回答事实性问题时也不如其他模型。所以在图像互动、常识问答、互联网搜索方面，GPT-4o依然更具优势。

另一个问题则是高昂的价格。o1-预览模型的定价是每百万个输入tokens15美元，每百万个输出tokens则要60美元，分别是GPT-4o的3倍和4倍。

而且从OpenAI的限制举措来看，这个推理模型恐怕非常消耗算力。公司对ChatGPT订阅用户、企业版ChatGPT和教育用户的访问及使用都做了相应的限制。

会自己思考问题的AI模型，对于程序员、创意工作者，以及几乎所有的理科相关专业工作者而言无疑是有益的升级。但它的局限性也可能在一定程度上影响其在某些领域的应用。

OpenAI推理大模型的出现是人工智能领域的一次重大突破，但要实现更广泛和深入的应用，还需要不断克服其局限性，降低成本，拓展功能。

OpenAI推理大模型来了，它真的能改变世界吗