DeepSeek新模型“火”到海外引发硅谷恐慌

DeepSeek | 2025-03-19 11:15

　　DeepSeek是一款基于AI技术的智能搜索引擎，结合深度学习与自然语言处理，提供精准、高效的搜索体验。探索DeepSeek，感受未来智能搜索的无限可能！

　　短短一个月内，中国AI初创公司深度求索（DeepSeek）发布了两款大模型：DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉，性能与OpenAI相当，引发了硅谷的震惊，甚至导致Meta内部出现恐慌情绪，工程师们开始连夜尝试复制DeepSeek的成果。

　　Scale AI创始人Alexander Wang在接受采访时表示，DeepSeek在他们的测试中表现最佳，与中国科技界的快速发展有关。他认为，当美国休息时，中国科技界在以更低的成本、更快的速度和更强的实力追赶上来。

　　中国AI的进展引起了国外媒体的广泛关注，被视为对硅谷敲响了警钟。尤其在5000亿美元的“星际之门”计划公布之际，DeepSeek以极低的价格建立了一个突破性的AI模型，且未使用尖端芯片，这引发了人们对巨额资本投入有效性的质疑。

　　一名匿名的Meta员工透露，DeepSeek-V3在基准测试中超越了Llama 4，让Meta进入恐慌模式。工程师们正在争分夺秒地分析DeepSeek的技术，试图复制其成果。管理层也为GenAI研发部门的巨额投入感到担忧，因为一个高管的薪资就超过了训练整个DeepSeek V3的成本。

　　去年12月27日，DeepSeek推出了开源模型DeepSeek-V3，在聊天机器人竞技场排名第七，在开源模型中排名第一，并且是全球前十中性价比最高的模型。不到一个月后，DeepSeek正式开源了R1推理模型，允许所有人在遵循MIT License的情况下蒸馏R1训练其他模型。1月24日，DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三，与顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域，DeepSeek-R1表现出色，位列第一。

　　著名投资公司A16z的创始人马克·安德森称，Deepseek-R1是他见过最令人印象深刻的突破之一，而且还是开源的，是一份给世界的礼物。诺奖得主、“AI教父”杰弗里·辛顿表示，中国的STEM教育比美国更好，拥有更多受过良好教育的人才，为AI的发展提供了坚实基础。

　　DeepSeek上周发布了开源模型DeepSeek-R1，并声称其性能可以与OpenAI的o1正式版相媲美，这一消息在海外AI业界引发了广泛讨论。焦点在于，当开源模型的能力达到甚至超越最新的闭源模型时，可能会改变整个大模型的竞争格局

　　阿里云通义千问超大规模的MoE模型Qwen2.5-Max于1月29日凌晨正式上线。该模型是阿里云通义团队对MoE模型的最新成果，预训练数据超过20万亿tokens

　　近日，一则关于AI的新闻在全球范围内引起了广泛关注。斯坦福大学和华盛顿大学的研究人员发表了一篇论文，展示了他们以不到50美元（约364元）的云计算费用训练出的一款名为S1的推理模型

　　1月28日凌晨，人工智能社区Hugging Face上发布了开源多模态AI模型Janus-Pro。作为Janus的高级版本，Janus-Pro采用了优化的训练策略，扩展了训练数据，并且拥有更大的模型规模

　　北京时间1月28日凌晨，农历新年前夕，中国人工智能初创公司DeepSeek在GitHub和Hugging Face上发布了多模态大模型Janus-Pro，进军文生图领域

　　时尚大牌申请破产，350家门店清仓甩卖！巅峰时年销41亿美元六年两度破产保护

DeepSeek新模型“火”到海外 引发硅谷恐慌

DeepSeek新模型“火”到海外引发硅谷恐慌