编辑:Andy 发布:2024-10-18 14:16
英伟达日前发布最新AI模型Llama-3.1-Nemotron-70B-Instruct,性能超越业界领先的OpenAI 的GPT-4o 跟Anthropic 的Claude3.5,仅次于OpenAI发布的最新模型o1,此举意味着AI领域竞争格局的重大变化。
Nemotron模型基于META的 Llama3.1 70B,是英伟达为提高LLM生成的响应的帮助程度而定制的大型语言模型。英伟达使用微调结构化数据来控制模型,使其生成更有帮助的响应。该模型仅700亿个参数,但性能远超其重量级。英伟达声称,该模型击败了OpenAI 的 GPT-4o 和 Antrophic 的 Claude 3.5 Sonnet,它们是目前 AI 基准测试中的领导者。
该语言模型使用人类反馈强化学习 (RLHF) 进行训练,具体采用了REINFORCE算法。对Meta的开源Llama 3.1模型进行优化。这种方法使AI能从人类的偏好中学习,可能会带来更加自然和符合语境的回应。
英伟达发表新模型标志着AI系统开发的竞争进入新的阶段,其举动将刺激其他科技公司重新考虑他们的策略,并加速研发进程。
深圳市闪存市场资讯有限公司 客服邮箱:Service@ChinaFlashMarket.com
CFM闪存市场(ChinaFlashMarket) 版权所有 Copyright©2008-2023 粤ICP备08133127号-2