货币:17111
交易所:1297
24H交易量:2540.7亿美元
市场占有率: 比特币 60.46% 以太坊 7.26%
Gas:22.590854327 GWEI
BTC突破历史新高,如您需要购买请前往全球最大的交易所Binance,点击这里即可前往!
  1. 首页
  2. 快讯
  3. 正文

研究人员以不到50美元创建可与OpenAI o1模型相媲美的s1模型

区块之家讯 根据上周五发布的一篇新研究论文,斯坦福大学和华盛顿大学的人工智能研究人员能够以不到 50 美元的云计算积分训练一个人工智能“推理”模型。 在衡量数学和编码能力的测试中,被称为 s1 的模型表现类似于尖端推理模型,例如 OpenAI 的 o1 和 DeepSeek 的 r1。s1 模型以及用于训练它的数据和代码可在 GitHub 上找到。 s1 背后的团队表示,他们通过提炼(distillation)创建了人工智能模型,这是一种通过训练另一个人工智能模型的答案来提取“推理”能力的过程。研究人员表示,s1 是从谷歌的推理模型之一 Gemini 2.0 Flash Thinking Experimental 中提炼出来的。提炼是伯克利研究人员上个月以约 450 美元的价格创建人工智能推理模型所采用的相同方法。 s1 背后的研究人员正在寻找实现强大推理性能和“测试时间扩展”的最简单方法,或者让 AI 模型在回答问题之前进行更多思考。这些是 OpenAI 的 o1 中的一些突破,其他 AI 实验室试图通过各种技术复制这些突破。s1 论文提出,可以使用一种称为监督微调(SFT)的过程,利用相对较小的数据集提炼推理模型,在此过程中,明确指示 AI 模型模仿数据集中的某些行为。SFT 往往比 DeepSeek 用于训练其对 OpenAI 的 o1、R1 的答案的大规模强化学习方法更便宜。 s1 基于阿里巴巴旗下中国 AI 实验室 Qwen 的一个小型现成 AI 模型,可免费下载。为了训练 s1,研究人员创建了一个仅包含 1,000 个精心策划的问题的数据集,并附上这些问题的答案以及 Google 的 Gemini 2.0 Flash Thinking Experimental 中每个答案背后的“思考”过程。 据研究人员称,在使用 16 个 Nvidia H100 GPU 不到 30 分钟的时间内训练 s1 后,s1 在某些 AI 基准测试中取得了强劲的表现。参与该项目的斯坦福大学研究员 Niklas Muennighoff 称,他现在就可以以大约 20 美元的价格租用必要的计算机。(TechCrunch)

本分分类: 快讯

版权声明:本文由入驻区块之家实名用户小乐收集发布,不代表区块之家立场,如有侵权/不实内容请联系本站管理员进行核实处理!本文链接:https://www.btc5577.com/newsflash/12762.html

相关文章