苹果平板电脑应用商店
DeepSeek掀起热潮,登顶应用榜单!
1月27日早晨,DeepSeek应用在及地区应用商店免费APP下载排行榜上独占鳌头,甚至超越了当前的热门应用ChatGPT。
就在昨天,网络上纷纷热议,DeepSeek服务器繁忙至崩溃。对此,DeepSeek方面回应称,1月26日下午确实出现了局部服务波动,但这一问题在数分钟内得到了有效解决。据推测,这次事件可能与新模型发布后访问量的激增有关。
那么,究竟是何原因让DeepSeek一夜之间走红?
通过天眼查发现,DeepSeek的开发者为杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”)。该公司成立于2023年7月,由宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋共同持股。深度求索背后的操盘手梁文锋是金融圈知名人士,其创立的幻方量化是国内量化私募巨头之一。
DeepSeek微信公众号消息显示,1月20日,深度求索正式发布了DeepSeek-R1大模型,并同步开源模型权重。该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,提升了模型推理能力。据深度求索介绍,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能,已经比肩OpenAI o1正式版。
《黑神话:悟空》的主创冯骥对DeepSeek给予了高度评价,并列举了其六大优点:推理能力强、成本低、开源、免费、支持联网搜索、由本土团队开发完成。多位人工智能行业意见也对DeepSeek-R1表达了赞赏。微软CEO萨蒂亚·纳德拉甚至公开表示:“他们开发了一款出色的开源模型,拥有极高的超级计算效率。”
值得注意的是,据湛江发布消息,性能与GPT-4相当的DeepSeek-V3的研发费用仅为558万美元,训练成本不到GPT-4的1/20,且仅使用了2048张H100的GPU集群,训练时间也大大缩短至仅53天。相比之下,即使是全球AI领域的头部公司,在同等水平下也需要使用更多的GPU进行训练。
市场普遍认为,DeepSeek R1的成功可能对市场对英伟达AI芯片的需求产生影响。因为DeepSeek似乎以极低的成本构建了一个突破性的人工智能模型。对此,多家券商已发布相关研究报告。财通证券指出,DeepSeek-R1的定价策略极具商业化潜力,其高性价比API定价有助于加速模型的功能迭代。开源证券则认为,DeepSeek-R1基于强化学习再次实现了“低成本+高性能”的大模型可能性,并有望推动模型向开源方向发展。
在资本市场方面,南财快讯记者注意到,已有A股上市公司披露与DeepSeek的合作情况。如昆仑万维与新加坡南洋理工大学合作开发的Q算法,能够显著提升现有大模型的推理能力。每日互动也表示已接入多个国内外通用大模型,结合自身的数据积累和挖掘能力以及对特定行业的深刻洞察,开发出商业营销和公共服务领域的垂直场景类大模型应用。不过也有公司表示尚未与DeepSeek建立业务合作关系。
(声明:本文内容仅供参考,不构成投资建议。投资者据此操作,风险自负。)