DeepSeek
(本文系紫金财经原创稿件,转载请注明来源)
2025 年伊始,横空出世的 DeepSeek 上演了一场全球技术风暴,抢走了几乎所有 AI 大模型的风头。
在业内,DeepSeek 的开源路线备受瞩目,甚至让 OpenAI CEO 山姆 · 奥尔特曼自省 OpenAI 站在了 " 历史的错误一边 "。而 DeepSeek 低成本高性能的表现,更是打破了行业遵循 " 大力出奇迹 " 的原则,让大家看到了大模型的更多可能性。
不仅业内将 DeepSeek 视为颠覆者,DeepSeek 更是破圈融入更多领域,不少 AI 行业外的用户也用起了 DeepSeek,算命、聊天、工作,甚至还有人拿 DeepSeek 赚钱 ...... 上线仅仅 20 天,DeepSeek 就突破了 2000 万日活大关,迅速超越 ChatGPT 成为全球增速最快的 AI 应用。
这家起源于中国杭州的科技公司,让人兴奋不已。过去 " 关于中国人工智能距离美国差距多远 " 的这个问题,有乐观者认为只有几个月,也有悲观的声音认为还有十年,两方的认知差距甚远,但 DeepSeek 的出现,似乎让人们看到了更清晰的光,原来中国的人工智能一直在亦步亦趋,择机超越。
DeepSeek 的火热让国内用户更加自信,悲观者们也再次乐观起来。这是条搅动 AI 发展进程的鲶鱼,搅得全球人工智能赛道的选手们都不得不重新评估自身的技术水平及位置。DeepSeek 技术水平如何,DeepSeek 的成功,会是中国人工智能赶超美国的加速点吗?
颠覆全球 AI 行业格局
将时间回溯至两年前,2023 年初,同样是春节,来自大洋彼岸的 ChatGPT 爆火,一场 AI 大模型浪潮轰轰烈烈地拉开了序幕。
彼时,ChatGPT 无疑是这场 AI 浪潮当之无愧的引领者,而被誉为 "ChatGPT 之父 " 的 Open AI CEO 山姆 · 奥尔特曼,被《时代》周刊评为 2023 年度 CEO,也被媒体冠上 " 硅谷的造王者 " 之名。
Open AI 的成功让行业一直跟随其发展路径,遵循 "Scaling Law" 原则,即认为更多的数据和更强的算力能够训练出更优秀的模型,坚信 " 大力出奇迹 "。
此后,为了踏上这艘时代的 AI 大船,不少科技巨头们纷纷在数据和算力上投入巨资,试图买到通往 AI 世界的 " 船票 "。而所有的努力并没有让他们快速胜出,反而成就了显卡霸主英伟达的万亿市值。
但 DeepSeek 的出现,打破了 " 大力出奇迹 " 的大模型原则。
根据公开资料显示,DeepSeek 的 R1 模型训练成本仅为 560 万美元,远远低于科技巨头们此前动辄数亿、数十亿美元的人工智能技术投入费用。
斯坦福大学计算机科学系和电子工程系副教授吴恩达也公开表示,OpenAI - o1 模型每百万输出 token 的成本为 60 美元,而 Deepseek-R1 只需 2.19 美元,成本差距将近 30 倍。
成本的大幅下降源于 DeepSeek 在算法、硬件利用率方面都做了革新。传统大模型遵循 " 预训练 - 监督微调(SFT)- 强化学习(RL)" 的三段式训练流程,其中 SFT 阶段需标注海量数据,成本占比超 40%。DeepSeek-R1 跳过了 SFT 阶段,使用 " 纯强化学习 + 冷启动 " 模式,直接用 RL 训练实现推理能力。
简而言之,SFT 是人类生成数据,机器学习;而 RL 是机器生成数据,机器学习。
除了算法上的优化,DeepSeek 将硬件利用率也推向极致。单 GPU 算力利用率行业平均是 15%,而 DeepSeek 可以达到 23%,不管是 DeepSeek 的 FP8 混合精度训练,还是动态序列长度调整,DualPipe 并行架构优化,都在极大程度上榨干硬件潜能。
因此 DeepSeek 采用性能更低、价格更便宜的次高端芯片就可以训练出性能不输 ChatGPT 的大模型。
低成本之外,DeepSeek 也一反行业闭源路线,采取开源路线。在 DeepSeek 创始人梁文锋看来,先有一个强大的、广泛的技术生态更重要。开源可以吸引更多大厂和技术人才涌入,共建共创一个更强大的人工智能大模型生态。
" 低成本+开源路线 " 的组合拳,大大降低了 AI 应用的门槛,打破了传统 AI 巨头的垄断地位,让 AI 大模型的未来不再属于 " 算力霸权 ",更多的中小企业也可以入局训练自己的 AI,从而提供了更多的发展可能性。
可以说,Deepseek 的出现几乎重塑了全球 AI 市场的竞争格局,催生了一个更开放、更普惠的 AI 生态。
加速中国人工智能赶超
不到一个月时间,大厂们纷纷接入 DeepSeek。在国内市场,华为云、腾讯云、阿里云等头部云服务厂商率先行动。
华为云携手硅基流动,基于昇腾云服务推出了 DeepSeek - R1/V3 推理服务;腾讯云则利用其高性能应用服务 HAI 和 TI 平台,支持 DeepSeek-R1 的快速一键部署,整个流程仅需 3 分钟即可完成,并为用户提供了限时免费体验的机会;阿里云在 PAI Model Gallery 中也加入了对 DeepSeek-V3 和 R1 模型的一键部署支持,极大地简化了从模型训练到推理的全过程,同时采用按需计费模式,进一步降低了企业使用 AI 技术的成本门槛。
除此之外,百度智能云、京东云、火山引擎等平台也也相继跟进,积极拥抱 DeepSeek。
不仅国内大厂迅速接入 DeepSeek,海外科技大厂亦是如此。
微软 Azure 平台已将 DeepSeek-R1 整合至其 Azure AI Foundry 服务中,为企业级用户提供专业的 AI 解决方案;亚马逊则在 Amazon Bedrock 和 SageMaker AI 平台上实现了对 DeepSeek-R1 模型的部署支持,并借助 AWS Trainium 技术为用户提供更具成本效益的部署方案;英伟达通过 NVIDIA NIM 云原生微服务技术上线了 DeepSeek-R1 模型,
海内外的科技大厂们在如此短时间内集体接入 DeepSeek,这是大模型诞生至今的独一份,是大厂们反复权衡后的选择。行业内能够迅速达成一致,认可 DeepSeek,充分说明了其价值。
不过,DeepSeek 收获了多少赞誉,同样也要承受多少质疑。以破局之姿出现,DeepSeek 的影响力超出想象,这让很多国外的大佬们慌了。
马斯克第一时间质疑:" 中国公司一定从美国获得了更高端芯片 "。特朗普公开评论 DeepSeek,称它在 " 给美国产业敲响警钟 ",并呼吁 " 集中精力赢得竞争 "。而在美国参议院外交关系委员会听证会上,智库代表公然提议 " 偷走中国最好的工程师 ",试图引发人才战。
这些质疑声,无疑是另一个侧面证明—— DeepSeek 的出现让美国狠狠地焦虑了。
过去,关于中国人工智能和美国的差距,大家众说纷纭,有乐观的观点认为差距只有几个月,也有悲观者认为有 10 年差距。两方的想法差距甚远,但 DeepSeek 的出现,似乎让人们看到更清晰的光。
一方面,DeepSeek 证明了中国人工智能在成本上的显著优势,依靠成本优势极有可能赶超美国。另一方面,DeepSeek 通过开源路线正在构建自己的 AI 生态,更多开发者的加入,意味着技术的应用和迭代也将大大提速。
DeepSeek 的破局,让中国 AI 企业首次站上技术制高点,这或许是中国人工智能赶超美国的重要加速点。
AGI 之路并非坦途,DeepSeek 也有难题
尽管 AGI 被视为技术革命的终极目标,但其发展路径充满技术、伦理与商业化难题。DeepSeek 虽身披光环,但在推动 AGI 落地的过程中同样面临技术与现实的重重挑战,甚至它也有自己的 " 阴影 "。
首当其冲的仍然是技术方面,模型能力与泛化性的难题。目前 DeepSeek 在文本生成这一单一任务中表现突出,但要想真正实现 AGI,必须拥有跨领域推理和自主决策能力,这一步绝非易事。DeepSeek 需要攻克多模态数据融合、模型泛化性等一系列技术瓶颈,确保 AI 系统能在不同场景下均能保持高精度与稳定性。
不可否认,科技巨头们生态系统更强大,数据积累、算力基础建设更多,也有更大的财力支持,在长远的 AI 竞争之下,DeepSeek 还是得找到自己的 " 小米加步枪 " 式创新路径,以巧取胜。
其次,随着 DeepSeek 扩展到更广泛的企业级应用,也可能带来新的挑战。服务于大型客户、处理复杂实时数据的需求激增,对计算资源的消耗呈现出几何级增长态势,这无疑会加大成本控制与效率优化的难度。如何在保证服务质量的同时,有效控制成本,成为 DeepSeek 亟需解决的现实问题。
事实上,近期随着用户规模的快速扩张,服务器负载过重、响应延迟等问题已经暴露出 DeepSeek 在应对大规模应用时的短板,这要求 DeepSeek 必须在技术架构与服务模式上进行深度革新。
另外,DeepSeek 也面临着激烈的竞争和开源压力。OpenAI、谷歌在 AGI 领域形成技术壁垒不可忽视,尤其是 OpenAI 通过多模态模型 Sora 和智能体 AIAgent 已经构建起应用生态,涵盖智能写作、图像生成、智能交互等多个领域,用户粘性极高。如果 DeepSeek 聚焦单一领域,很可能在这场激烈的竞争中逐渐丧失优势。
并且开源社区的压力会迫使 DeepSeek 权衡技术保密与开放协作,如何在保持竞争力的同时融入全球 AGI 生态,也是 DeepSeek 未来的战略难题之一。
结语
DeepSeek 的横空出世,无疑为全球 AI 领域注入了一股强大的新生力量。它以低成本高性能的创新模式和开源路线,打破了传统 AI 巨头的垄断格局,重塑了全球 AI 市场的竞争生态,也为中国人工智能赶超美国带来了新的希望与可能。
然而,AGI 之路并非一蹴而就,DeepSeek 在追求技术巅峰的同时,也面临着诸多挑战与难题。从模型能力与泛化性的技术瓶颈,到成本控制与效率优化的现实困境,再到竞争压力与开源社区的权衡考量,每一步都充满了未知与变数。
当然这些挑战很多都是行业需要共同面对的命题,DeepSeek 此前的成功已经证明了其创新能力和无限潜力,如何在人工智能赛道上走得更远,需要 DeepSeek 的缔造者们更为成熟的考虑。
不管怎么说,DeepSeek 带来的不仅是技术上的追赶,还有新的信心。信心之下,也许正在孕育孵化更多的可能。
本文地址:http://sicmodule.glev.cn/quote/20901.html 歌乐夫 http://sicmodule.glev.cn/ , 查看更多