商务服务
DeepSeek 的背景介绍
2025-02-26 04:42

在全球人工智能大模型蓬勃发展的浪潮中,DeepSeek 宛如一颗耀眼的新星,迅速崛起并吸引了众多关注的目光。它的出现不仅为人工智能领域注入了新的活力,也在一定程度上改变了行业的竞争格局。

DeepSeek 的背景介绍

DeepSeek,中文名为深度求索,是一家中国人工智能实验室 / 公司,专注于开发开源大语言模型。它于 2023 年 5 月正式成立,总部位于浙江杭州。其创立背后有着独特的契机和雄厚的资金支持。

DeepSeek 由中国对冲基金高毅资产(High-Flyer)全资资助。高毅资产的创始人梁文锋在金融领域有着丰富的经验和卓越的成就。2016 年,梁文锋参与创立高毅资产,在 2007 - 2008 年金融危机期间,还在浙江大学就读的他就开始涉足交易领域。到 2019 年,高毅资产已发展成为一家专注于开发和运用人工智能交易算法的对冲基金,到 2021 年更是完全依靠人工智能进行交易,这使得它与美国著名的对冲基金文艺复兴科技相媲美。

2023 年 4 月,高毅资产宣布将成立一个新的独立机构,专门研究通用人工智能,且该机构不会用于股票交易,与高毅资产的金融业务分开。同年 5 月,DeepSeek 应运而生,其发展资金全部来源于高毅资产。当时,风险投资公司因短期内难以实现退出获利,对投资 DeepSeek 持谨慎态度,这也凸显了高毅资产对 DeepSeek 发展的坚定支持。

(一)模型初发布

2023 年 11 月 2 日,DeepSeek 推出了其首个模型 DeepSeek Coder,该模型对研究人员和商业用户均免费开放,并且代码在 MIT 许可证下开源,同时针对模型本身还有关于 “开放和负责任的下游使用” 的附加许可协议。这一举措使得 DeepSeek Coder 在开源社区中迅速获得关注,为开发者们提供了一个强大的工具,用于构建游戏、测试代码、修复漏洞和分析数据等。

仅仅在 27 天后,即 2023 年 11 月 29 日,DeepSeek 又推出了 DeepSeek LLM,其参数规模达到了 670 亿,旨在与当时市场上的其他大语言模型竞争,性能接近 GPT - 4。同时还发布了该模型的聊天机器人版本 DeepSeek Chat,进一步拓展了模型的应用场景,让用户能够更便捷地与模型进行交互。

(二)持续迭代升级

2024 年 5 月,DeepSeek 推出了 DeepSeek - V2,以其低廉的价格和强劲的性能引起了广泛关注。当时的价格为每百万输出令牌 2 元人民币,在性价比方面极具优势,被称为中国人工智能模型价格战的催化剂,甚至被戏称为 “人工智能界的拼多多”。这一价格策略迫使字节跳动、腾讯、百度和阿里巴巴等其他主要科技巨头纷纷降低其人工智能模型的价格以参与竞争。尽管 DeepSeek 定价较低,但相比那些亏损的竞争对手,它却实现了盈利。

2024 年 12 月,DeepSeek - V3 震撼登场。它拥有 6710 亿个参数,在约 55 天内完成训练,成本为 558 万美元,与同类型模型相比,使用的资源显著减少。它基于 14.8 万亿个令牌的数据集进行训练,基准测试显示,它的性能超过了 Llama 3.1 和 Qwen 2.5,并与 GPT - 4o 和 Claude 3.5 Sonnet 相当。DeepSeek 在有限资源上的优化,凸显了美国对中国人工智能发展制裁的潜在局限性,也让世界看到了中国人工智能技术在资源利用效率上的突破。

DeepSeek 的技术创新在人工智能领域引起了广泛关注,尤其是在硅谷,其技术革新吸引了众多目光。

在注意力机制和混合专家(MoE)技术方面,DeepSeek 提出了革命性的方法,实现了令人瞩目的效率提升。以 DeepSeek - V2 和 DeepSeek Coder - V2 模型为例,后者被广泛认为是最强大的开源代码模型之一。而且,DeepSeek 的小模型常常能超越各种更大的模型,这些创新成果彰显了中国在人工智能领域不断增强的实力,打破了中国在人工智能领域只会模仿而不会创新的偏见,标志着中国正迈向全球人工智能领导地位。

DeepSeek - V3 模型采用了混合专家架构,带有多头潜在注意力变压器,包含 256 个路由专家和 1 个共享专家,每个令牌可激活 370 亿个以上的参数。这种独特的架构设计使得模型在处理复杂任务时能够更加高效地分配计算资源,提升了模型的性能和泛化能力。

DeepSeek 的出现和发展,对人工智能市场产生了多方面的影响。在技术层面,它推动了开源大语言模型的发展,为研究人员和开发者提供了更多可选择的工具和技术路径,促进了技术的交流与创新。在市场竞争方面,其引发的价格战促使其他科技巨头重新审视自身的定价策略和成本控制,推动了整个行业的良性竞争。

    以上就是本篇文章【DeepSeek 的背景介绍】的全部内容了,欢迎阅览 ! 文章地址:http://sicmodule.glev.cn/news/19995.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 歌乐夫资讯移动站 http://sicmodule.glev.cn/mobile/ , 查看更多   
最新新闻
OPPO小布4.0:软件定义硬件,智能定义“助手”
OPPO数智工程事业部总裁刘海锋的数智人亮相小布元空间发布会小布助手4.0公布的5大升级,对行业而言也许有着不一样的排序AI和语音
人工智能是什么
人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用系统的一门新技术科学。
探索AI科技:从绘画到写作,简单AI带来的创作革命
在当今迅速发展的科技时代,人工智能(AI)正在以不可思议的速度革新我们的生活和工作方式。尤其是在创作领域,AI绘画和AI写作工
火遍全球的DeepSeek:科学家是怎么用它的?
原文作者:Elizabeth Gibney两周前,一家中国公司推出的DeepSeek-R1让美国股市大幅震荡——DeepSeek-R1是一款平价但强大的人工智
财务总监上任不足半年辞任!上市公司回复交易所称财务总监离任后无法与其取得联系!
1、函询你公司离任财务总监张国全,并请其补充说明上任后半年内辞职的具体原因,任期内在监控公司资金进出与余额变动、与控股股
ai获客系统多少钱
AI获客系统是一款以人工智能技术为基础,帮助企业获取用户和客户的系统。无论是传统的实体店铺还是线上的电商平台,都需要有一种
回顾老农娶小10岁女大学生,被她踹下床,8年后才知她身份不简单
1971年,陕西一49岁的老农,1分钱没花娶了个小10岁的女大学生,结婚当晚,新娘一脚把他踹下床,他不怒反笑,10年后,他更是乐得
京东做外卖,意不在美团
文 | 新立场Pro一时间,送外卖的在送快递,送快递准备去送外卖,本地生活领域热闹非凡。当美团、饿了么将外卖战场延伸至商超、医
AI才女罗福莉已到新岗位上班,其与DeepSeek创始人有合资企业
据红星新闻报道,2月16日,罗福莉一名亲属告诉记者,罗福莉已到新岗位上班。该亲属还称,罗福莉老公的研究方向与她是同一个领域
深度揭秘:如何全面掌握DeepSeek的诀窍!
在这个数字化迅猛发展的时代,DeepSeek作为一款新锐消费级AI,其独特优势和使用方法让我们不得不关注。本文将对DeepSeek的使用技