首届AI奥数竞赛方案公布:4支获奖队伍，竟都选择国产模型DeepSeekMath，如何评价深度求索发布的deepseekllm67b?| 办公室助理属于什么部门—

当前位置:

首届AI奥数竞赛方案公布:4支获奖队伍，竟都选择国产模型DeepSeekMath，如何评价深度求索发布的deepseekllm67b?

专业小程序设计开发——助力新电商新零售

电话+V：159999-78052，欢迎咨询DeepSeek崛起引发的AI竞争，[小程序设计与开发]，[小程序投流与推广]，[小程序后台搭建]，[小程序整套源码打包]，[为个体及小微企业助力]，[电商新零售模式]，[小程序运营推广及维护]

一、首届AI奥数竞赛方案公布:4支获奖队伍，竟都选择国产模型DeepSeekMath

全球首届AI数学奥林匹克竞赛（AIMO）结果揭晓，五支团队分获前三名及进步奖。冠军由Numina的团队获得，他们采用的是名为NuminaMath7BTIR的模型，该模型是deepseek-math-7b-base微调而来。

亚军团队运用了两个DeepSeek-Math-7B-RL模型，分别用于策略和奖励两个方面。第三名队伍同样使用DeepSeek-Math-7B-RL，没有进行微调，通过制定的评分规则和多数投票策略选择答案。

第四名队伍使用deepseek-math-7b-rl模型，参数设置包括温度（temperature）为0.9、top_p为1.0、最大生成令牌数（maxtokens）为2048，搭配代码工具，在MATH基准测试中表现优秀。

排名前四的队伍均选择了DeepSeekMath-7B作为基础模型，该模型在数学推理能力上与GPT-4接近，MATH基准榜单上超越了众多30B~70B的开源模型。

二、2024年会不会是ai大模型创业公司的寒冬?

探索2024年AI大模型创业公司的前景

AI大模型创业公司面临着来自巨头的激烈竞争，如百度、阿里、华为、腾讯、字节跳动。尤其在搜索引擎领域，OpenAI与Google的竞争具有风向标意义。近期，幻方将Deepseekv2Moe模型价格降至百万tokens2元，接近免费，随后字节跳动和腾讯也宣布加入价格战，模型公司面临巨大压力。

价格战对大模型公司影响深远，用户关注的不仅是价格，更看重模型的质量。当前，国外模型如OpenAIGPT-4的价格相对较高，而智谱GLM-4的价格则显得较高，与GPT-3.5的性价比相比有明显差距。因此，模型质量成为决定公司生存的关键。

面对竞争，AI大模型公司需在模型创新上有所突破，例如专注于特定领域，如财经、医疗、教育等垂直类应用，以提高竞争力。同时，与数据的有效结合也是重要策略之一。目前，市场上已出现如Cohere、Claude等专注于细分领域的模型，以及面壁智能、Kimi等在小模型和长文本处理上取得良好市场反馈的公司。

三、如何评价深度求索发布的deepseekllm67b?

数学推理对于语言模型提出了重大挑战。DeepSeekMath7B，作为对DeepSeek-Coder-Base-v1.57B的预训练，利用了来自CommonCrawl的1200亿个与数学相关的标记，以及自然语言和代码数据。该模型在没有依赖外部工具包和投票技术的情况下，在竞争级别的MATH基准上取得了51.7%的成绩，接近Gemini-Ultra和GPT-4的表现水平。通过自我一致性处理，DeepSeekMath7B在MATH上的得分提高到了60.9%。其数学推理能力得益于精心设计的资料选择流程，有效利用了公开可用的网络数据潜力，以及引入的群体相对策略优化（GRPO），这是近端策略优化（PPO）的变体，能够同时优化策略模型的记忆使用和数学推理能力。

针对大规模数学预训练和强化学习的探索与分析，DeepSeekMath7B的贡献显著。在强化学习方面，引入了高效且有效的组相对策略优化（GRPO）算法，取代了近端策略优化（PPO）中复杂的价值函数近似步骤，通过对比相同问题的多个输出，实现了更有效的策略优化。在从PPO到GRPO的转换过程中，GRPO通过最大化每个输出的相对奖励，提供了与奖励模型良好对齐的优势计算方法，避免了奖励模型优化的复杂化。

【WINDRISES MINIPROGRAM PROMOTION】尊享直接对接老板

电话+V： 159999-78052

专注于小程序推广配套流程服务方案。为企业及个人客户提供了高性价比的运营方案，解决小微企业和个体拓展客户的问题

发布人:peicuan04 发布时间:2025-01-28