DeepSeek新模型“火”到海外 引发硅谷恐慌

  DeepSeek     |      2025-03-19 11:15

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

DeepSeek新模型“火”到海外 引发硅谷恐慌

  短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能与OpenAI相当,引发了硅谷的震惊,甚至导致Meta内部出现恐慌情绪,工程师们开始连夜尝试复制DeepSeek的成果。

  Scale AI创始人Alexander Wang在接受采访时表示,DeepSeek在他们的测试中表现最佳,与中国科技界的快速发展有关。他认为,当美国休息时,中国科技界在以更低的成本、更快的速度和更强的实力追赶上来。

  中国AI的进展引起了国外媒体的广泛关注,被视为对硅谷敲响了警钟。尤其在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,且未使用尖端芯片,这引发了人们对巨额资本投入有效性的质疑。

  一名匿名的Meta员工透露,DeepSeek-V3在基准测试中超越了Llama 4,让Meta进入恐慌模式。工程师们正在争分夺秒地分析DeepSeek的技术,试图复制其成果。管理层也为GenAI研发部门的巨额投入感到担忧,因为一个高管的薪资就超过了训练整个DeepSeek V3的成本。

  去年12月27日,DeepSeek推出了开源模型DeepSeek-V3,在聊天机器人竞技场排名第七,在开源模型中排名第一,并且是全球前十中性价比最高的模型。不到一个月后,DeepSeek正式开源了R1推理模型,允许所有人在遵循MIT License的情况下蒸馏R1训练其他模型。1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1表现出色,位列第一。

  著名投资公司A16z的创始人马克·安德森称,Deepseek-R1是他见过最令人印象深刻的突破之一,而且还是开源的,是一份给世界的礼物。诺奖得主、“AI教父”杰弗里·辛顿表示,中国的STEM教育比美国更好,拥有更多受过良好教育的人才,为AI的发展提供了坚实基础。

  DeepSeek上周发布了开源模型DeepSeek-R1,并声称其性能可以与OpenAI的o1正式版相媲美,这一消息在海外AI业界引发了广泛讨论。焦点在于,当开源模型的能力达到甚至超越最新的闭源模型时,可能会改变整个大模型的竞争格局

  阿里云通义千问超大规模的MoE模型Qwen2.5-Max于1月29日凌晨正式上线。该模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens

  近日,一则关于AI的新闻在全球范围内引起了广泛关注。斯坦福大学和华盛顿大学的研究人员发表了一篇论文,展示了他们以不到50美元(约364元)的云计算费用训练出的一款名为S1的推理模型

  1月28日凌晨,人工智能社区Hugging Face上发布了开源多模态AI模型Janus-Pro。作为Janus的高级版本,Janus-Pro采用了优化的训练策略,扩展了训练数据,并且拥有更大的模型规模

  北京时间1月28日凌晨,农历新年前夕,中国人工智能初创公司DeepSeek在GitHub和Hugging Face上发布了多模态大模型Janus-Pro,进军文生图领域

  时尚大牌申请破产,350家门店清仓甩卖!巅峰时年销41亿美元 六年两度破产保护