李飞飞团队50美元复刻DeepSeek 基于阿里通义千问-小皮游戏

热门搜索：和平精英王者荣耀我的世界 CF手游

首页游戏大全游戏库游戏合集游戏排行开服表开测表游戏专区

当前位置：首页 > 行业资讯 > 李飞飞团队50美元复刻DeepSeek 基于阿里通义千问

李飞飞团队50美元复刻DeepSeek 基于阿里通义千问

时间： 2025-02-07 09:20 来源：小皮手游网我要评论

感兴趣的小伙伴可以持续关注“小皮游戏网”时刻了解后续相关资讯哦，下面让我们一起来看看吧!

游民星空

《科创板日报》2月6日讯，今日一则关于人工智能领域的新闻引发广泛关注。

游民星空

游民星空

据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科创板日报》记者调查和采访业内人士后发现，s1模型的训练并非从零开始，而是基于阿里云通义千问（Qwen）模型进行监督微调。这意味着，s1模型的神奇“低成本”，是建立在已具备强大能力的开源基础模型之上。根据李飞飞等人的研究论文，s1模型的训练仅使用了1000个样本数据。按照业内共识，这一数据量在AI训练中可谓微乎其微，通常不足以训练出一个具备推理能力的模型。

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者，如果仔细研究斯坦福s1的论文会发现，s1模型的神奇是以通义千问模型为基座进行微调，这1000个样本训练的作用更像是“锦上添花”，而非“从零开始”。 “以通义千问模型作为基座，确实可以用很少的样本数据就达到产生新的推理模型的效果，但如果换成其他基座模型，新模型能力却没有任何的提升。所以，能力真正神奇的是Qwen模型，而不是s1。 ” 谢伟迪说。

以上为本篇文章的全部内容，点击进入“小皮游戏网”，时刻了解最新游戏资讯。

最新资讯

更多+热门资讯

更多+热门专区

游戏排行榜

1英雄联盟手游: 1

英雄联盟手游

竞技对战

2三国志战略版: 2

三国志战略版

角色扮演

3天涯明月刀: 3

天涯明月刀

角色扮演

4梦幻西游: 4

梦幻西游

角色扮演

5少年三国志：零: 5

少年三国志：零

卡牌战略

6万国觉醒: 6

万国觉醒

竞技对战

7街霸：对决: 7

街霸：对决

卡牌战略

8原神: 8

原神

角色扮演

9神武4: 9

神武4

角色扮演

10率土之滨: 10

率土之滨

塔防策略

开服表
开测表

时间 游戏名称 服务器 下载

01-18
上古有灵妖
新服山海44服

01-18
明日边境
新服第46服

01-18
超进化物语
新服半遮群山

01-18
神州风闻录
新服玄武99区

01-18
萌将风云
新服安卓638服

01-18
梦幻模拟战
新服额外祝福

01-18
切菜狂人
新服食神218服

01-18
上古修仙
新服蛮荒317服

01-17
切菜狂人
新服食神217服

01-17
虎符传奇
新服虎符496区