AI世界一周风云，你都了解多少？

财云财经阅读：4973 2024-07-22 17:43:00 评论：0

摘要： 本周AI领域大事连连，大模型有表现，新模型已发布，监管在调查，企业获融资，内容丰富。

大模型数学能力受质疑

大模型在面对简单数学问题时竟也会出错。就像“9.11和9.9哪个大”这样的小学生题目，众多知名大模型给出的答案却让人啼笑皆非。其中阿里通义千问、百度文心一言等答对，而ChatGPT-4o等答错。行业人士指出，这反映出生成式语言模型在设计上更倾向于文字思维，而非数字思维。不过，通过针对性语料训练，未来或许能提升其理科答题能力。

大模型厂商的回应

面对大模型数学能力差的问题，多家厂商发表了看法。阿里通义实验室产品经理王晓明称，此类问题是常见测试案例，大模型“答对”或“答错”存在概率性。腾讯混元团队也表示，大模型作为概率模型，要稳定解决数值计算或比较问题颇具难度。大模型尚未精准掌握数字运算和比较规则，人类对其能力的探索还处于早期阶段。

AI世界一周风云，你都了解多少？

OpenAI推出轻量化模型

OpenAI发布新款轻量级大模型GPT-4omini，成本大幅下降。其输入价格为0.15美元/百万tokens，输出价格为0.6美元/百万tokens，比GPT-3.5Turbo便宜60%。相比2022年的text-davinci-003型号，成本更是下降了99%。其他大模型厂商如谷歌、Anthropic今年也在推动模型轻量化，展现出小参数模型的潜力。