电话+V:159999-78052,欢迎咨询马斯克回应Grok3是否开源,[小程序设计与开发],[小程序投流与推广],[小程序后台搭建],[小程序整套源码打包],[为个体及小微企业助力],[电商新零售模式],[小程序运营推广及维护]
马斯克兑现承诺,开源3140亿参数的巨无霸模型Grok-1,包括其全部权重和架构,使之成为迄今为止最大规模的开源大语言模型。该项目遵循Apache2.0许可证,短短时间内已收获大量关注,GitHub地址为github.com/xai-org/grok...
Grok-1未经特定应用微调,而是从头开始训练,与X平台上微调过的版本性能有所区别。该模型的细节包括:8个专家混合模型,3140亿激活参数,使用旋转嵌入而非固定位置嵌入,tokenizer词汇量巨大,Transformer层众多。运行测试需要强大的GPU内存,例如628GB的机器,可能需要8块H100显卡。
知名学者SebastianRaschka评价Grok-1比其他部分开源的模型更开放,但不及Pythia、Bloom和OLMo,后者提供了训练代码和数据集。DeepMind的AleksaGordié预测Grok-1的能力超越LLaMA-2,但数据纯度仍需评估。用户可通过磁力链接下载权重文件,但部分功能如实时世界理解仅限于付费版本。
1.马斯克旗下的xAI公司宣布即将开源其大型语言模型Grok,这一举措在当前与OpenAI的法律争议背景下显得尤为引人注目。
2.马斯克利用这个机会重申了对开源和非营利性人工智能的承诺,这让他站在了道德的制高点上,并对OpenAI施加了压力。
3.Grok是基于Grok-1的模型,拥有8192的上下文长度,性能与GPT-3.5相当。它以直言不讳和讽刺著称,目前关于其开源的具体细节尚不明确。
4.开源大型模型对于依赖它们的公司和组织来说具有重大意义,它将增加选择的多样性和定制的可能性。然而,关于其商业化的细节还需等待官方的进一步确认。
5.Grok在xAI平台上作为订阅服务推出,其表现超过了部分竞争对手,如Llama-2-70B和GPT-3.5,并且在简化幽默感方面取得了突破。
6.马斯克此举不仅是回应OpenAI的商业化转变,也暗示OpenAI可能背离了其最初的非营利目标。
7.开源的背后,马斯克也看到了商业利益,比如通过开源吸引更多的开发者和客户,类似于Llama和MistralAI的成功案例。
当地时间2月17日,马斯克在直播中被问及Grok3是否会开源,他称在下个版本推出时会开源上个版本,当Grok3变得稳定后,可能要几个月时间,Grok2就会开源。
电话+V: 159999-78052
专注于小程序推广配套流程服务方案。为企业及个人客户提供了高性价比的运营方案,解决小微企业和个体拓展客户的问题