![](https://www.qxwa.com/wp-content/themes/qux/img/post_loading.gif)
一家人工智能公司的首席执行官认为,中国人工智能实验室 DeepSeek 的人工智能模型 R1 本月席卷了整个行业,该公司可以使用数万块 NVIDIA 的 GPU 进行训练。
DeepSeek R1 是世界上最先进的人工智能模型之一,它与 OpenAI 的 o1 和 Meta 的 Llama 等美国领先平台并驾齐驱。NVIDIA 的 Hopper 芯片是其当前一代 GPU,随着该公司加大下一代 Blackwell 芯片的出货量,这些芯片已成为全球使用最广泛的 GPU。
Scale AI 创始人兼首席执行官 Alexandr Wang 本周早些时候在接受 CNBC 采访时分享了最新细节,Wang 补充说,R1 在其公司最具挑战性的人工智能测试中达到或击败了所有表现最佳的人工智能模型。
Scale AI 首席执行官称 DeepSeek R1 与 OpenAI 的 o1 一样好甚至更好
在接受 CNBC 的 Andrew Ross Sorkin 采访时,Wang 首先分享了公司最新 AI 测试的细节。这项测试被称为“人类的最后考试”,采用“数学、物理、生物、化学教授”提供的与最新研究相关的“最难的问题” 。在用这项测试测试了所有最新的 AI 模型后,Wang 的团队发现 DeepSeek 的最新模型“实际上表现最佳,或大致与美国最好的模型相当,而美国最好的模型是 o1… ”
当被问及中美之间的人工智能竞争时,Wang 评论说:“长期以来,美国一直处于领先地位。”然而,他补充说,DeepSeek 的最新模型确实试图改变这种局面。王说,他认为“中国实验室在圣诞节发布一个惊天动地的模型具有象征意义,因为你知道,我们其他人都在庆祝节日。”
随后,讨论转向了 DeepSeek 和中国 AI 参与者可能为其 AI 模型配备的 GPU 数量。NVIDIA 的 GPU 是全球最受追捧的产品之一,由于其潜力巨大,其出口也受到美国政府的监管。该公司目前一代的 Hopper GPU 产品线包括 H100 和 H200 GPU。
两种 GPU 型号之间的主要区别在于它们的内存时钟速度和容量。拜登政府在 2022 年通过一项规则限制了这些 GPU 向中国的销售,该规则禁止 NVIDIA 销售比旧款 A100 GPU 优越得多的芯片。这些限制迫使 NVIDIA 开发名为 H800 和 A800 的替代芯片,而这些芯片也在一年后的 2023 年 10 月被禁止。
Wang 表示,对于中国是否能获得 NVIDIA 的先进 GPU 这个问题,“事实既是肯定的,也是否定的。你知道,中国实验室拥有的 H100 数量比人们想象的要多。”他补充说,据他了解,“DeepSeek 拥有大约五万个 H100。”Wang 总结道,“他们显然不能谈论这个问题,因为这违反了美国实施的出口管制。”他还认为,“他们拥有的芯片数量比其他人预期的要多。”
然而,中国可能很难采购更多芯片。Wang 说:“而且从长远来看,他们也会受到我们现有的芯片控制和出口管制的限制。”
![](https://www.qxwa.com/wp-content/themes/qux/img/post_loading.gif)
一家人工智能公司的首席执行官认为,中国人工智能实验室 DeepSeek 的人工智能模型 R1 本月席卷了整个行业,该公司可以使用数万块 NVIDIA 的 GPU 进行训练。
DeepSeek R1 是世界上最先进的人工智能模型之一,它与 OpenAI 的 o1 和 Meta 的 Llama 等美国领先平台并驾齐驱。NVIDIA 的 Hopper
芯片是其当前一代 GPU,随着该公司加大下一代 Blackwell 芯片的出货量,这些芯片已成为全球使用最广泛的 GPU。
Scale AI 创始人兼首席执行官 Alexandr Wang 本周早些时候在接受 CNBC 采访时分享了最新细节,Wang 补充说,R1 在其公司最具挑战性的人工智能测试中达到或击败了所有表现最佳的人工智能模型。
Scale AI 首席执行官称 DeepSeek R1 与 OpenAI 的 o1 一样好甚至更好
在接受 CNBC 的 Andrew Ross Sorkin 采访时,Wang 首先分享了公司最新 AI 测试的细节。这项测试被称为“人类的最后考试”,采用“数学、物理、生物、化学教授”提供的与最新研究相关的“最难的问题” 。在用这项测试测试了所有最新的 AI 模型后,Wang 的团队发现 DeepSeek 的最新模型“实际上表现最佳,或大致与美国最好的模型相当,而美国最好的模型是 o1… ”
当被问及中美之间的人工智能竞争时,Wang 评论说:“长期以来,美国一直处于领先地位。”然而,他补充说,DeepSeek 的最新模型确实试图改变这种局面。王说,他认为“中国实验室在圣诞节发布一个惊天动地的模型具有象征意义,因为你知道,我们其他人都在庆祝节日。”
随后,讨论转向了 DeepSeek 和中国 AI 参与者可能为其 AI 模型配备的 GPU 数量。NVIDIA 的 GPU 是全球最受追捧的产品之一,由于其潜力巨大,其出口也受到美国政府的监管。该公司目前一代的 Hopper GPU 产品线包括 H100 和 H200 GPU。
两种 GPU 型号之间的主要区别在于它们的内存时钟速度和容量。拜登政府在 2022 年通过一项规则限制了这些 GPU 向中国的销售,该规则禁止 NVIDIA 销售比旧款 A100 GPU 优越得多的芯片。这些限制迫使 NVIDIA 开发名为 H800 和 A800 的替代芯片,而这些芯片也在一年后的 2023 年 10 月被禁止。
Wang 表示,对于中国是否能获得 NVIDIA 的先进 GPU 这个问题,“事实既是肯定的,也是否定的。你知道,中国实验室拥有的 H100 数量比人们想象的要多。”他补充说,据他了解,“DeepSeek 拥有大约五万个 H100。”Wang 总结道,“他们显然不能谈论这个问题,因为这违反了美国实施的出口管制。”他还认为,“他们拥有的芯片数量比其他人预期的要多。”
然而,中国可能很难采购更多芯片。Wang 说:“而且从长远来看,他们也会受到我们现有的芯片控制和出口管制的限制。”
DeepSeek登顶苹果应用商店免费应用排行榜
在发布开源模型 DeepSeek-R1 之后,因其出色的性能和低廉的成本,DeepSeek 引起了广泛关注,其应用“DeepSeek - AI Assistant(或 DeepSeek - AI 助手)”也迅速进入应用商店的排行榜前列。在苹果应用商店的美区和国区,DeepSeek 进入了免费应用排行榜的第一名。
在 Google Play 应用商店,DeepSeek 排在免费生产力应用第二名。DeepSeek-R1 的推理性能接近 OpenAI-o1-1217,该公司研究人员也在预印本平台 arXiv 上发表论文,介绍了通过增强学习大幅提升大模型推理能力的方法。