1月最后一天,DeepSeek的热度依旧高涨。在美国,无论是AI从业者还是普通民众,都感受到了来自中国AI技术的冲击。Anthropic CEO呼吁美国加强芯片管制,而OpenAI则寻求高达400亿美元的融资。网友们利用宽松的开源许可,制作了使用DeepSeek-R1替代OpenAI Operator的教程,无需200美元订阅,完全免费。
英伟达对DeepSeek赞赏有加,并宣布DeepSeek-R1正式登陆NVIDIA NIM。在单个NVIDIA HGX H200系统上,完整版DeepSeek-R1 671B的处理速度可达3,872 Token/秒。亚马逊也在Amazon Bedrock和SageMaker AI中上线了DeepSeek-R1模型。微软甚至提前将DeepSeek-R1部署在其云服务Azure上。
除了科技巨头,初创公司也抓住机会。Windsurf编辑器集成了DeepSeek-R1和V3模型,在编程智能体中实现了R1的工具调用。Cerebras声称其部署的70B模型不仅比GPU快57倍,还在准确率上超过了GPT-4o和o1-mini。
吴恩达认为,围绕DeepSeek的热议显示了几个重要趋势:中国在生成式AI领域正在赶上美国。尽管ChatGPT推出时美国明显领先,但随着Qwen、Kimi、InternVL和DeepSeek等模型的出现,中国的差距迅速缩小。特别是在视频生成等领域,中国已展现出一些领先优势。