当前位置:首页 > 绿巨人最新热点 > 正文内容

DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型

admin4个月前 (09-18)绿巨人最新热点59

9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。

DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。

DeepSeek还透露,为了防止基准测试数据污染,对DeepSeek-R1的预训练和后训练数据都实施了全面的去污染措施。

开源之后,R1在Hugging Face下载量破1090万次,成为全球最受欢迎的开源推理模型。

DeepSeek首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,从而启发全球AI研究者。DeepSeek R1的核心创新在于采用了“纯强化学习”这一自动化试错方法,R1通过奖励模型达到正确答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。

在补充材料中,DeepSeek团队还首次公开了R1训练成本仅为29.4万美元。这个金额即使加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。

今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本曾引发全球科技股大幅下跌。

作为全球首个通过同行评审的主流大语言模型,《自然》期刊不但将该篇论文作为封面论文,还在评论报道文章中用了“里程碑式论文揭示 DeepSeek AI 模型的秘密”、“创造历史”表达赞赏和肯定,此次论文发表标志着中国在大模型基础研究领域取得重要突破。

在AI行业快速发展中,未经证实的说法和炒作不在少数。《自然》杂志认为,随着AI技术日渐普及,大模型厂商们无法验证的宣传可能对社会带来真实风险。依靠独立研究人员进行的同行评审,是抑制AI行业过度炒作的一种有效方式。而DeepSeek所做的一切,是非常值得欢迎的先例。

8月21日,DeepSeek正式发布了最新大语言模型DeepSeek-V3.1。

据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。

DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

 

相关文章

小红书最高版本下载,解锁海量美妆时尚秘籍

小红书最高版本下载,解锁海量美妆时尚秘籍

你有没有听说最近小红书最高版本下载的事情?没错,就是那个让无数人沉迷其中的社交平台又升级啦!今天,就让我带你一起探索这个新版本,看看它有哪些新鲜玩意儿吧!一、新版本界面大变样首先,咱们得聊聊这个新版本...

娇妻)笔趣阁,浪漫爱情故事,甜蜜温馨相伴

娇妻)笔趣阁,浪漫爱情故事,甜蜜温馨相伴

亲爱的读者们,今天我要给你讲一个特别温馨的故事,关于一位娇妻和她的笔趣阁。想象一个充满书香和爱的角落,那里有她最爱的书籍,有她最温暖的回忆,还有她和你一起度过的美好时光。让我们一起走进这个小小的世界,...

帐中香by金银花露讲什么,金银花露的传奇故事

帐中香by金银花露讲什么,金银花露的传奇故事

你有没有听说过《帐中香》这本书呢?它最近可是引起了不小的热议呢!据说,这本书里藏着许多关于金银花露的神秘故事,让人忍不住想要一探究竟。今天,就让我带你走进《帐中香》的世界,一起揭开金银花露的神秘面纱吧...

中国船舶完成吸收合并中国重工,新增股份9月16日上市

中国船舶完成吸收合并中国重工,新增股份9月16日上市

中国船舶工业股份有限公司(下称中国船舶,600150.SH )和中国船舶重工股份有限公司(下称中国重工,601989.SH)正式完成换股吸收合并,这也标志着A股史上规模最大的吸收合并案正式收官。...

地方新闻精选 | 北京PM2.5来源中区域传输占57% 贵州“挖眼虐猫”事件系AI编造

地方新闻精选 | 北京PM2.5来源中区域传输占57% 贵州“挖眼虐猫”事件系AI编造

【北京】PM2.5区域传输占57%,本地源中机动车排放占一半 据北京日报客户端消息,9月12日上午,在“2025年北京国际大都市清洁空气与气候行动论坛”上,北京市生态环境局发布了新一轮的PM2....

包茂红|拉美的环境自觉——第十二届拉丁美洲和加勒比海地区环境史学会年会管窥

2025年7月22-27日,第十二届拉丁美洲和加勒比海地区环境史学会年会在巴西的里约热内卢召开,来自美洲、欧洲和亚洲的五百多位学者参加了会议,或发表论文,或参与讨论,或展示学术海报,或发布新书,或参加...