DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!
在2024年1月27日,深度求索公司的最新应用Deepseek在苹果商店中国和美国地区的免费APP下载排行榜上闪亮登顶,惊艳地超越了OpenAI的ChatGPT。一款来自杭州的人工智能产品,竟然能在国际市场上发光发热,这到底是怎么发生的?
Deepseek的背后是深度求索,作为量化巨头幻方量化旗下的子公司,近期推出了名为DeepSeek-R1的推理大模型。自1月20日发布以来,这款模型凭借“物美价廉”的优势在国际开发者社区中迅速走红,成为热门话题。
它的开源特性让开发者们欣喜不已,R1在数学推理、代码生成和自然语言处理等任务上的表现,已经可以与OpenAI的成熟模型相媲美。更为吸引人的是,R1采用了MIT许可协议,允许用户进行自由商用、修改和衍生开发。
DeepSeek-R1在ChatbotArena上的表现令人瞩目,基准测试排名已攀升至全类别大模型的第三名,与OpenAI的ChatGPT-4o齐名,并在风格控制类模型中并列第一,展现出惊人的实力。
关键数据更是让人咋舌!该模型的预训练成本仅为557.6万美元,用2048块英伟达H800 GPU持续运行55天,训练费用低于OpenAI GPT-4o的十分之一。深度求索不仅分享了R1的训练技术,更蒸馏出了6个小模型,进一步拓宽了开发者的应用场景。
英伟达的高级研究科学家Jim Fan对DeepSeek-R1给予了高度评价,称其可能是“首个展现了强化学习飞轮作用的开源软件项目”,并指出它有能力持续增长和发展。
DeepSeek通过强化学习技术使得R1在几乎没有标注数据的情况下,超越传统依赖监督微调的模型,展现了创新的可能性。Jim Fan提到,“我们正处在一个神奇的时刻,一家非美国公司正在践行OpenAI的初衷,让先进研究真正惠及所有人。”在这场技术的博弈中,Deepseek的表现不仅是国产应用的一次逆袭,更意味着全球人工智能领域竞争正在变得愈发白热化,等待我们揭晓的,或许才是这场 AI 战争的真正起点。返回搜狐,查看更多