AI搜索引擎国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE性能和 GPT-4o 不分伯仲

  DeepSeek     |      2025-03-22 20:20

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!IT之家援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数 370 亿,在 14.8 万亿 token 上进行了预训练。

  该模型在知识、长文本、代码、数学和中文等方面均取得显著进步,尤其在算法代码和数学方面表现突出,生成速度提升至 60 TPS,相比 V2.5 提升了 3 倍。

  官方还决定为全新模型设置长达 45 天的优惠价格体验期:即日起至 2025 年 2 月 8 日,DeepSeek-V3 的 API 服务价格仍然会是大家熟悉的每百万输入 tokens 0.1 元(缓存命中)/ 1 元(缓存未命中),每百万输出 tokens 2 元,已经注册的老用户和在此期间内注册的新用户均可享受以上优惠价格。

  广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

  博通“狙击”英伟达,透露自家坐拥三个超大规模客户预计 2027 年打造数百万个 XPU 集群

  OpenAI ChatGPT AI 服务再次“跳闸”,初步推测为微软数据中心电力故障导致

  Anthropic 联合创始人:AI 尚未发展至极限,2025 年将继续高速狂飙

  腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”

  阶跃星辰发布 Step-1X-Medium 模型:AI 图片生成提速 30%、支持图生图垫图玩法、升级中国风创作

  苹果市值逼近 4 万亿美元,分析师称 AI 将推动新 iPhone 超级周期