AI世界一周风云,你都了解多少?
大模型数学能力受质疑
大模型在面对简单数学问题时竟也会出错。就像“9.11和9.9哪个大”这样的小学生题目,众多知名大模型给出的答案却让人啼笑皆非。其中阿里通义千问、百度文心一言等答对,而ChatGPT-4o等答错。行业人士指出,这反映出生成式语言模型在设计上更倾向于文字思维,而非数字思维。不过,通过针对性语料训练,未来或许能提升其理科答题能力。
大模型厂商的回应
面对大模型数学能力差的问题,多家厂商发表了看法。阿里通义实验室产品经理王晓明称,此类问题是常见测试案例,大模型“答对”或“答错”存在概率性。腾讯混元团队也表示,大模型作为概率模型,要稳定解决数值计算或比较问题颇具难度。大模型尚未精准掌握数字运算和比较规则,人类对其能力的探索还处于早期阶段。
OpenAI推出轻量化模型
OpenAI发布新款轻量级大模型GPT-4omini,成本大幅下降。其输入价格为0.15美元/百万tokens,输出价格为0.6美元/百万tokens,比GPT-3.5Turbo便宜60%。相比2022年的text-davinci-003型号,成本更是下降了99%。其他大模型厂商如谷歌、Anthropic今年也在推动模型轻量化,展现出小参数模型的潜力。
AI参加“高考”成绩不佳
AI在高考全科目测试中的表现不尽人意。文科最好成绩能达一本水平,理科却最多只能上二本。从阅卷老师的评价可知,大模型在逻辑推理和知识灵活应用方面存在明显短板,作答主观题时常答非所问,解数学题时逻辑性差。
欧盟人工智能法案生效
欧盟《人工智能法案》将于8月1日在整个欧盟范围内生效,这是全球最全面的人工智能监管法案。违规企业将面临高额罚款,但这也增加了企业的营运成本。
李飞飞创业成果显著
华裔计算机科学家李飞飞创办的WorldLabs估值超10亿美元,自今年4月成立已进行两轮融资。李飞飞在计算机领域成就斐然,其门下高徒众多。
AI芯片和云厂商巨头投资热潮
今年上半年全球AI初创公司融资增长,英伟达、微软、谷歌等巨头积极布局。基础大模型、自动驾驶、AI数据和人形机器人成为投资热点。
英国对微软交易展开反垄断调查
英国反垄断监管机构对微软-InflectionAI交易进行调查。微软的这一行为被指低价、变相吞并InflectionAI,美国联邦贸易委员会也在审查此交易。
人形机器人公司融资不断
通用人形机器人初创公司逐际动力完成A轮融资,多家人形机器人公司纷纷获得资金支持,下一步关键在于如何实现量产落地。
英伟达联合发布新模型
英伟达联合法国初创公司MistralAI发布大模型Mistral-NeMo,该模型拥有120亿个参数,主要面向企业环境。
相关问答
为什么大模型会在简单数学问题上出错?
因为生成式语言模型在设计上更倾向于文字思维,数字思维能力相对较弱,且目前还没精准掌握数字运算和比较规则。
OpenAI的轻量化模型有何优势?
成本大幅降低,输入输出价格更便宜,能扩大人工智能的应用,让其更实惠。
AI参加高考的表现说明了什么?
说明目前大模型在逻辑推理和知识灵活应用方面存在很大局限性,与人类考生相比还有差距。
欧盟人工智能法案有何影响?
能加强对人工智能的监管,但也增加了企业的运营成本。
李飞飞的创业公司为何受关注?
因为李飞飞在计算机领域成就突出,具有很高的影响力。
巨头们在AI投资上有何特点?
投资风格偏好不同,云厂商对强绑定大模型初创企业的意愿更强烈,基础大模型等是投资热点。