商务服务
火遍全球的DeepSeek:科学家是怎么用它的?
2025-02-26 06:11

火遍全球的DeepSeek:科学家是怎么用它的?

原文作者:Elizabeth Gibney

两周前,一家中国公司推出的DeepSeek-R1让美国股市大幅震荡——DeepSeek-R1是一款平价但强大的人工智能(AI)“推理”模型。
经过反复测试,DeepSeek-R1回答数学和科学问题的能力与o1模型不相上下——o1是由加州旧金山OpenAI公司去年9月推出的一款模型,OpenAI的推理模型一直被视为行业顶尖水准。
虽然R1在科研人员想尝试的各种任务上仍力有不逮,但它让全球科学家有机会根据其学科内的问题,量身训练定制款的推理模型。
“基于它的绝佳表现和低成本,我们相信Deepseek-R1能鼓励更多科学家在日常科研工作中使用大语言模型(LLM),同时不同担心成本问题,”俄亥俄州立大学的AI研究员Huan Sun说,“几乎所有从事AI的同事和合作者都在谈论它。”

开放季

对于科研人员来说,R1的平价和开源可能会改变传统:使用它的应用编程接口(API),就能以其专利竞品收取的一小部分费用对这个模型提问;其在线对话机器人DeepThink(深度思考)的使用更是免费。科研人员还能在自己的服务器上下载这个模型,免费运行和拓展模型——这些都是闭源竞品模型o1办不到的。
R1从1月20日推出以来,“大量研究人员”基于R1或以R1为灵感,尝试训练自己的推理模型,加拿大不列颠哥伦比亚大学的AI研究员Cong Lu说道。这从开放科学AI资源库Hugging Face的数据中便可看出——DeepSeek-R1的代码就储存在Hugging Face上。在模型发布后的一周内,Hugging Face上各版本的R1下载量就超过300万次,包括独立用户已经扩展过的模型。

科研任务

一些初步测试让R1执行数据型科研任务——这些任务选自生物信息、计算化学、认知神经科学等领域的真实论文——结果R1的表现与o1不相上下,Sun说。她的团队让这两个AI模型完成他们创建的一系列问题中的20个任务,这个系列被称为ScienceAgentBench。这些任务包括数据分析和可视化。两个模型只能答对其中约1/3的问题。用API运行R1的成本只要o1的1/13,但R1的“思考”时间比o1更长,Sun说。
R1在数学上也开始崭露头角。英国牛津大学的数学家、计算科学家Frieder Simon让这两个模型给出泛函分析这一抽象领域的一个证明,发现R1的证明比o1的更好。但考虑到这类模型通常会犯的错误,如果想要从这些模型中获益,研究人员本身就要具备鉴别证明水平的能力,他说。
R1令人激动的一大原因在于,它以“open-weight”(开放权重)的形式公开,说明其算法不同部分之间习得的关联可以进一步拓展。下载了R1或其“蒸馏”小模型(也由DeepSeek发布)的科学家能通过额外训练提升其能力,这也称为微调。如果有合适的数据集,科研人员或能通过训练,提高该模型在特定科研步骤编写代码的能力。
能在本地系统下载并部署R1也是个加分项 ,Sun说,因为这样科研人员就能掌控他们的数据和研究结果。“对于涉及敏感和隐私数据的学科来说,比如医学研究,这一点尤其重要。”

推理跨越

DeepSeek也搅动了AI科研领域,因为它指出了一条能优化无数其他模型的道路,旧金山AI公司Anthropic的联合创始人Jack Clark说。Clark的模型叫Claude。
DeepSeek通过将它的“推理”能力教授给其他大语言模型(LLM)——如meta的Llama——创建了这个蒸馏模型。DeepSeek在1月22日在arXiv上发布的预印本论文[1]揭示了这背后的方法:用整理好的来自DeepSeek-R1的80万个逐步式“思维链”回答的样本训练这些大语言模型。
“现在网上有了一个开放权重的模型,你能用它让其他足够强大的基础模型变身为一个AI推理器,”Clark在他的简报import AI中写道,“全球的AI能力又向前了一步。”
科研人员还在应用“强化学习”——用来创建DeepSeek-R1的试、错、赏技术——但打磨它在特定任务上的应用,Lu说。Lu去年联合创建了“AI Scientist”,这是一个能完成一整套机器学习科研任务的模型,从扫描文献到创建假说再到撰写论文。通过定义适当的“奖赏信号”,科学家能朝着任何目标训练这个模型,他说。
但DeepSeek-R1还远谈不上完美。对话机器人DeepThink在o1等大语言模型会“碰壁”的简单任务上也失败了,这类问题包括统计名字中含字母W的美国州的数量。Lu说:“也许有的人认为这个模型能把水变成酒,这只是炒作,但对于其实际能力来说,它确实是最棒的。”

原文以Scientists flock to DeepSeek: how they’re using the blockbuster AI model标题发表在2025年1月29日《自然》的新闻版块上

© nature

Doi:10.1038/d41586-025-00275-0

点击阅读原文查看英文原文

    以上就是本篇文章【火遍全球的DeepSeek:科学家是怎么用它的?】的全部内容了,欢迎阅览 ! 文章地址:http://sicmodule.glev.cn/news/20011.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 歌乐夫资讯移动站 http://sicmodule.glev.cn/mobile/ , 查看更多   
最新新闻
美团点评的无边界陷“四面楚歌”?
出 品 | 异观财经作 者 | 炫夜白雪美团无边界拓展业务线的同时,势必会与携程、京东、拼多多等流量巨头狭路相逢,陷入“四面楚歌
预售仅5.7万,五一档票房垫底,古天乐新片卖不动,问题在哪?
今年五一档不出意外的话,算是提前宣告凉凉了。作为一个长达五天的黄金档期,截止4月27号17点,档期预售总票房竟然只有2253万,
从题分邦第三课桌到未来:沉浸式 AI 自习室,让学习效率飙升 30%!
回首学生时代,那场景依旧历历在目:小小的课桌上,堆积如山的课本几乎将视线完全遮挡,像一座座难以逾越的山丘。午后的阳光毫无
待你学AI智习室:专注力升级,自习效果倍增
在信息爆炸的时代,学习已成为一种随时随地可能进行的活动。然而,面对纷繁复杂的干扰,如何保持高效专注,让自习效果倍增,成为
《悬疑风暴席卷而来:四部年度巨制,你的心跳准备好了吗?》
序章:迷雾深处,悬疑剧热潮再起航在这个充满无限可能的时代,影视作品如同璀璨繁星,照亮了我们的视听世界。而其中,悬疑剧以其
悬疑剧《借命而生》官宣演员阵容!秦昊主演,还有三大实力派坐镇
秦昊在悬疑剧这个领域真的可以说是一骑绝尘了!从最开始的《隐秘的角落》,到去年的超级大爆款《漫长的季节》。秦昊可以说不出手
央八开播!12集警匪大剧来袭!秦昊主演,4位实力派助阵,能火
森林中迷雾笼罩,在押犯徐文国(韩庚饰)、姚斌彬(史彭元饰)拼命向森林深处跑。夜色中,杜湘东(秦昊饰)等看守以手电照明,在
“五一”假期出游指南:畅享假期,理性消费
2025年“五一”假期临近,旅游市场热度持续攀升。根据携程发布的《“五一”旅游出行预测报告》显示,今年“五一”旅游消费呈现长
泉城“五一”热门打卡地发布,这个假期来济南!一站式将快乐拉满
  生活不止眼前,这一站来济南。欢迎五湖四海的老师儿们,这个假期来济南,一站式将快乐拉满!
价值观 VS 算法:刘强东与王兴的商业哲学对决
    作者 | 韩勇执行总编,20 年 TOP100 企业高管,战略运营专家。来源  |   管理智慧 AI+咨询合作 | 王老师:13801295388