DeepSeek 首次考虑筹集外部资金

  DeepSeek     |      2025-02-21 14:16

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

DeepSeek 首次考虑筹集外部资金

  【写在开头】最近微信推荐机制调整了,可能有些朋友会收不到我们的推送,大家别忘了给

  包括阿里巴巴、国有基金在内的多个投资者都表示有兴趣为DeepSeek提供资金。

  针对融资消息,DeepSeek相关人士辟谣,融资消息均为谣言。另外阿里副总裁颜乔表示:“外界流传阿里投资DeepSeek的信息是假消息”。

  DeepSeek此前并未开放融资,其初创资金由幻方量化慷慨提供,且至今未向外界开放融资窗口。

  梁文峰此前在访谈中透露,尽管他曾探索过寻求外部投资的路径,但鉴于个人对科研纯粹的追求与风险投资机构偏重商业化回报的考量之间存在本质差异,他最终搁置了这一想法。

  值得注意的是,DeepSeek内部对于融资存在不同声音,有成员多次向梁文峰提议考虑融资选项。DeepSeek内部对于融资策略的看法或许存在分歧,但最终决策权牢牢掌握在梁文峰手中,他是那把开启未来融资大门的关键钥匙。

  此外,近期梁文峰可能已在小范围内与部分投资人或产业资本进行了初步交流,但维持在一个极小的圈子。

  有投资人称DeepSeek估值可达80亿美元,传阿里给出100亿美元估值,不管是80亿美元,还是100亿美元,DeepSeek的估值目前已远超“大模型六小龙”中最高的一家。

  DeepSeek 突然崛起成为人工智能明星,给这家中国初创公司带来了一个困境:是否要融资。

  DeepSeek 是一家中国量化对冲基金的两岁子公司,迄今为止尚未进行外部融资,部分原因是为了避免投资者对其产品商业化速度过快的压力。但据了解内部讨论的人士透露,自从其人工智能聊天应用几周前走红以来,对更多人工智能芯片和服务器以处理快速增长的使用量和支持模型开发的需求,促使公司考虑进行外部融资。

  近期,据两位了解谈判情况的人士透露,包括阿里巴巴集团和中国政府关联基金在内的许多实力雄厚、资金充裕的投资者,已表示对资助 DeepSeek 下一阶段增长感兴趣。据其中一位人士透露,已联系 DeepSeek 的国家投资者包括中国投资有限责任公司,该公司的主权财富基金,以及国家社会保障基金。

  DeepSeek、阿里巴巴和中国投资有限责任公司未对电子邮件中的评论请求作出回应。拨打国家社会保障基金的电话无人接听。

  除了讨论是否应该筹集资金外,DeepSeek 及其对冲基金母公司 High-Flyer Capital Management 的高管们还在讨论,这家初创公司是否应该从主要关注研究转向建立一家能够产生有意义收入和最终利润的业务,据了解这些讨论的人士透露。这些人还表示,该公司还在考虑使用东南亚的数据中心来获取更多英伟达 AI 芯片。

  DeepSeek 创始人兼首席执行官李文峰——同时也是 High-Flyer 的联合创始人——在筹集外部资金方面仍然保持谨慎。他接下来会走向何方还不明确。

  与梁共事过的人形容他是一个古怪而理想主义的科技工作者。2015 年,他与他人共同创立了 High-Flyer,专注于利用 AI 模型进行股票交易,这在当时的中国还是一个新颖的想法。根据梁为华尔街日报记者撰写的关于西蒙斯的传记中文版所写的序言,梁将已故的纽约量化交易基金 Renaissance Technologies 的创始人吉姆·西蒙斯视为自己的榜样。

  2023 年,在 OpenAI 发布 ChatGPT 引发 AI 革命之后,高飞者成立了 DeepSeek 作为独立子公司,主要专注于高级研究项目。梁的目标是实现通用人工智能,这是 AI 达到人类水平认知能力的一个里程碑。他将 DeepSeek 建立成一个学术实验室,并招募了同样想要追求 AGI 的研究人员。

  DeepSeek 比其他中国 AI 初创公司更有优势:据前员工称,在美国以国家安全为由限制向中国销售这些半导体之前,High-Flyer 已经储备了大约 10,000 个 Nvidia A100 芯片。

  该公司对筹集外部资金没有兴趣。2023 年底和 2024 年初,两家中国风险投资公司的合伙人联系 DeepSeek 探讨可能的投资,他们说DeepSeek 向他们明确表示没有筹集任何外部资本的意图。

  与此同时,梁密切关注着美国的人工智能发展。据两位了解他美国之行的人士透露,在 9 月 OpenAI 推出其 o1 推理模型时,梁飞往美国,会见了他所认识的学者,包括一些 OpenAI 员工,以保持最新动态。

  在去年年底的一次内部员工会议上,梁表示 DeepSeek 落后于 OpenAI。但据一位参加会议的前员工透露,梁也表示 DeepSeek 可以通过降低成本和提高效率来为人工智能行业的进步做出贡献。

  DeepSeek 的早期 AI 模型,通过公司网站向用户开放,去年年底开始在美国的 AI 研究人员中赢得认可。与此同时,DeepSeek 推迟了面向消费者的移动聊天应用发布,尽管美国和中国许多其他科技公司都在匆忙推出此类应用。

  去年下半年,例如,当其他中国公司的 AI 应用,如字节跳动的多宝,迅速获得人气时,梁在一次会议上告诉员工,现在还不是DeepSeek 专注于消费者应用的时候。据两位听到这些评论的前员工说,公司的首要任务始终应该是其研究,以更有效地构建更好的基础模型。

  与此同时,DeepSeek 获得了更多的关注。在 12 月底,DeepSeek 发布了 V3,这是一个它声称仅用 2,048 个 Nvidia 芯片和仅花费550 万美元就训练出来的大型语言模型,这仅仅是美国 AI 公司自己花费的LLMs的一小部分。

  1 月 20 日,梁被邀请参加了由中国总理李强主持的研讨会。几天后,DeepSeek 发布了一个新的推理 AI 模型,DeepSeek-R1。尽管DeepSeek 声称 R1 的开发成本远低于 OpenAI 的类似模型,但该模型凭借与 OpenAI 相似模型相当的性能震惊了硅谷。

  DeepSeek 上个月推出的首款移动应用,突然爆火,不到一个月内在中国的日活跃用户就达到了 3000 万,这是该国历史上增长最快的记录,据研究机构 QuestMobile 表示。

  但它在满足需求方面遇到了困难。在本月第一周的春节期间,当全国大多数地方因年度庆典而停摆时,一些 DeepSeek 员工仍在努力解决基础设施挑战。公司试图通过限制其应用程序的使用来使流量更易于管理,但它可能需要进一步投资基础设施,以更好地容纳现有用户的活动。

  DeepSeek 的冲击也引发了华盛顿的担忧,那里的立法者长期以来一直将中国的人工智能进步视为对美国国家安全的威胁。本月早些时候,他们宣布了一项计划,将引入一项两党法案,禁止 DeepSeek 的应用程序在政府拥有的设备上运行。

  与此同时,该公司的融资计划是一个棘手的问题。从任何主要的中国投资者那里筹集资金,尤其是国有企业,可能会加剧华盛顿的担忧,并消除或限制 DeepSeek 在美国的未来商业机会。上个月,美国商务部将包括多个国有基金在内的中国初创公司智谱 AI 列入出口黑名单,声称其人工智能研究有助于中国的军事进步。

  美国投资者和从美国有限合伙人那里筹集资金的基金可能会因为上个月生效的美国规定,限制对中国人工智能公司的投资,而面临支持DeepSeek 的困难。

  深飞者对冲基金业务近年来面临来自其他中国量化基金的更多竞争,不清楚其能否继续提供 DeepSeek 所需的全部资金。DeepSeek 至今的收入微不足道。其聊天机器人应用程序免费,其 R1 模型的 API 每输入 1 百万个 token 收费 14 美分,每输出 1 百万个 token 略超过 2 美元——这指的是语言模型处理的文本单位。这些价格仅为 OpenAI 的 o1 推理模型的几分之一,后者每输入 1 百万个 token 收费 15 美元,每输出 1 百万个 token 收费 60 美元。

  本月初,中国无处不在的即时通讯和社交网络应用微信开始测试一项功能,允许用户访问 DeepSeek 的 AI 模型。目前尚不清楚这将为DeepSeek 带来多少收入。返回搜狐,查看更多