电话+V:159999-78052,欢迎咨询DeepSeek崛起引发的AI竞争,[小程序设计与开发],[小程序投流与推广],[小程序后台搭建],[小程序整套源码打包],[为个体及小微企业助力],[电商新零售模式],[小程序运营推广及维护]
全球首届AI数学奥林匹克竞赛(AIMO)结果揭晓,五支团队分获前三名及进步奖。冠军由Numina的团队获得,他们采用的是名为NuminaMath7BTIR的模型,该模型是deepseek-math-7b-base微调而来。
亚军团队运用了两个DeepSeek-Math-7B-RL模型,分别用于策略和奖励两个方面。第三名队伍同样使用DeepSeek-Math-7B-RL,没有进行微调,通过制定的评分规则和多数投票策略选择答案。
第四名队伍使用deepseek-math-7b-rl模型,参数设置包括温度(temperature)为0.9、top_p为1.0、最大生成令牌数(maxtokens)为2048,搭配代码工具,在MATH基准测试中表现优秀。
排名前四的队伍均选择了DeepSeekMath-7B作为基础模型,该模型在数学推理能力上与GPT-4接近,MATH基准榜单上超越了众多30B~70B的开源模型。
探索2024年AI大模型创业公司的前景
AI大模型创业公司面临着来自巨头的激烈竞争,如百度、阿里、华为、腾讯、字节跳动。尤其在搜索引擎领域,OpenAI与Google的竞争具有风向标意义。近期,幻方将Deepseekv2Moe模型价格降至百万tokens2元,接近免费,随后字节跳动和腾讯也宣布加入价格战,模型公司面临巨大压力。
价格战对大模型公司影响深远,用户关注的不仅是价格,更看重模型的质量。当前,国外模型如OpenAIGPT-4的价格相对较高,而智谱GLM-4的价格则显得较高,与GPT-3.5的性价比相比有明显差距。因此,模型质量成为决定公司生存的关键。
面对竞争,AI大模型公司需在模型创新上有所突破,例如专注于特定领域,如财经、医疗、教育等垂直类应用,以提高竞争力。同时,与数据的有效结合也是重要策略之一。目前,市场上已出现如Cohere、Claude等专注于细分领域的模型,以及面壁智能、Kimi等在小模型和长文本处理上取得良好市场反馈的公司。
数学推理对于语言模型提出了重大挑战。DeepSeekMath7B,作为对DeepSeek-Coder-Base-v1.57B的预训练,利用了来自CommonCrawl的1200亿个与数学相关的标记,以及自然语言和代码数据。该模型在没有依赖外部工具包和投票技术的情况下,在竞争级别的MATH基准上取得了51.7%的成绩,接近Gemini-Ultra和GPT-4的表现水平。通过自我一致性处理,DeepSeekMath7B在MATH上的得分提高到了60.9%。其数学推理能力得益于精心设计的资料选择流程,有效利用了公开可用的网络数据潜力,以及引入的群体相对策略优化(GRPO),这是近端策略优化(PPO)的变体,能够同时优化策略模型的记忆使用和数学推理能力。
针对大规模数学预训练和强化学习的探索与分析,DeepSeekMath7B的贡献显著。在强化学习方面,引入了高效且有效的组相对策略优化(GRPO)算法,取代了近端策略优化(PPO)中复杂的价值函数近似步骤,通过对比相同问题的多个输出,实现了更有效的策略优化。在从PPO到GRPO的转换过程中,GRPO通过最大化每个输出的相对奖励,提供了与奖励模型良好对齐的优势计算方法,避免了奖励模型优化的复杂化。
电话+V: 159999-78052
专注于小程序推广配套流程服务方案。为企业及个人客户提供了高性价比的运营方案,解决小微企业和个体拓展客户的问题