“中国可能已在人工智能竞赛中超越美国。”面对DeepSeek -R1模型的优异表现,近日发出这样的感慨。
《华尔街日报》则以《DeepSeek 搅乱中美科技战》(DeepSeek Scrambles U.S.-China Tech War)为题,报道了DeepSeek在美国科技界和政界引发的混乱:有人试图进一步推进脱钩政策;有人却不禁反思,“小院高墙”政策已经无法阻挡中国科技崛起。
随着DeepSeek热度持续发酵,越来越多的美国媒体也注意到lehu乐虎,,DeepSeek绝不是唯一一个正在追上OpenAI的中国大模型公司,包括百度、阿里、字节在内的中国军团,有望让中国在 2030 年成为该领域的世界领先者,逐渐超越美国。
回顾从2023到2025的三个春节,科技行业最大新闻的变迁,正在重塑世界格局。
近年来,中国任何一点科技突破都难免被美国拿来炒作恐慌,DeepSeek自然也逃不过。
尽管美国精英曾说DeepSeek的进展是“好事”,但更多人却试图把DeepSeek说成是对OpenAI的抄袭。白宫人工智能顾问大卫·萨克斯(David Sacks)宣称,DeepSeek“有可能”窃取了美国的知识产权才得以崛起。
OpenAI亲自下场发难,表示DeepSeek利用他们的模型进行训练,涉嫌侵犯知识产权。
此前DeepSeek-V3的技术报告中曾经提到,该模型使用数据蒸馏技术生成的高质量数据提升了训练效率,但并未说明具体蒸馏了哪个模型。而OpenAI也并未给出自家模型被蒸馏的证据。
在业内人士看来,模型蒸馏已经是行业内常见做法,是技术普惠的重要途径,其合法性并无统一标准。
另一家美国大模型企业Scale AI 的负责人亚历山大·王 (Alexandr Wang)呼吁美国收紧出口限制,以让该国公司保持技术领先地位。
但自相矛盾的是,美国科技界一边努力打压DeepSeek,一边却还要贬低DeepSeek的成绩。OpenAI的竞争对手Anthropic创始人Amodei发文称,DeepSeek“也就是我们7-10个月前的水准”。
OpenAI创始人奥特曼(Sam Altman)也表示,DeepSeek确实做了一些非常好的事情,但总的来说,这被严重夸大了。
对此,众多美国网友都注意到其中的讽刺意为。一名网友指出:“当你在恳请政府介入阻止其他人发展AI,你就已经承认了自己被打败。”
美国硬件服务商的反应则更加诚实。截至1月31日,英伟达面向开发者服务的NVIDIA NIM平台已经上线了DeepSeek-R1模型。英伟达介绍称,DeepSeek-R1模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色。
亚马逊方面同日也宣布,DeepSeek-R1模型现已正式入驻亚马逊的人工智能模型市场Bedrock及机器学习平台SageMaker Al,供用户广泛使用。
此前,微软已经把DeepSeek-R1抢先部署在了自家的云服务Azure上。
这显示出美国企业界的混乱态度——既担心被中国企业占据主导地位,又不愿错过来自中国的巨大商机。
在DeepSeek连续多日被美国舆论审视之后,越来越多的美国媒体也开始意识到,中国优秀的大模型企业不止是DeepSeek。
《华尔街日报》专门发文指出,“不仅仅是DeepSeek,这些中国大模型公司你也需要知道”。文章提及百度、阿里等企业,指出百度文心一言已经有4.3亿用户。
也盘点了多家“中国领先的人工智能模型”,列举出阿里云通义千问、百度文心一言、字节的豆包和月之暗面的Kimi。
尽管OpenAI和Anthropic两大巨头都不承认中国大模型的能力已经抹平差距,为何普通美国人却对中国产品趋之若鹜?苹果人工智能Apple Intelligence近期的遭遇或许能说明一些问题。
去年发布的iPhone 16系列搭载的AI技术,表现可谓令人失望,其AI总结新闻的功能更是频频犯下低级错误。
例如去年12月,苹果智能在推送一名枪手当街射杀美国联合健康保险公司首席执行官的新闻时,将其错误提取总结成枪手对自己开枪,并以“BBC新闻客户端”的形式展现,引起BBC官方吐槽。
苹果刚刚发布的2024年第四季度财报显示,iPhone业务当季营收同比下降了0.9%,显示出AI功能在市场上遇冷。
1月29日,一架美国客机与美军直升机在华盛顿机场上空相撞引发严重空难。当要求两个模型给出客机载客人数,以及遇难者中包含的运动员数量时,尽管双方都回答正确,但是可以看到,ChatGPT仅仅简单回答了问题,文心一言在数字之外还给出了更加详细的事故信息。
例如,对于提问“2025年中国的法定假日有哪些”,文心一言不仅给出正确答案,还专门提到国庆中秋是连休;ChatGPT则给出了明显错误的回答。
对于春节档电影《哪吒2》中,“藕粉制作过程中出现了哪些让哪吒感觉不适的操作”,ChatGPT也完全没能获取到剧情细节。
文心一言与ChatGPT的差异来源,在于百度更加重视检索增强生成(RAG)技术,并在行业内较早地针对文生图场景开发了iRAG技术lehu乐虎,。
时至今日,大模型虽然能够解决复杂的数学、编程等问题,具备了很多领域的专业知识,但是时而也会出现“幻觉”,给出一些明显错误、令人啼笑皆非的回答。这样的模型能力再强,也无法被广泛应用于实际的生产生活之中。
借助RAG技术,AI能够基于人类提供的素材作为参考来生成结果,而非完全凭空想象。例如,要求大模型生成一张天坛图片,大模型往往会给出四层结构、似是而非的“天坛”,而天坛实际上只有三层。通过引入iRAG技术,大模型以真实的天坛图片为参考,就能够避免类似幻觉的发生。
对RAG的重视,体现了李彦宏对于AI一贯的理解——大模型不光要能力强,更要“有用”。文心一言更强调大模型实时检索最新信息的能力lehu乐虎,,并能够判断信息来源的准确性,从而给用户提供真正有用的信息。
回望2023年春节,刚刚发布不久的ChatGPT-3.5,无疑是当时科技领域最热门的话题。彼时,生成式AI初次带给世界巨大震撼之余,不少中国人也不禁心存疑虑:OpenAI如此强大,中国企业是否已经完全丧失机会?
2024年春节期间,OpenAI又首次展示了视频生成模型Sora,再次强化自身的领先地位。
然而到了2025年春节,距离“ChatGPT时刻”才过去两年多,最大话题却已经换成了来自中国的DeepSeek,颇有翻天覆地之感。
在ChatGPT-5迟迟无法问世,被传遭遇瓶颈的背景下,2025年中国大模型的持续升级,有望进一步抹平双方差距,甚至有望在一些维度完成逆转。
其实在视频生成领域,这样的趋势已经在发生。Sora去年初首秀之后,长时间处于“期货”状态,直到12月才终于正式发布。
而在这一年之中,快手的可灵、抖音的即梦、生数科技的Vidu等中国视频生成模型都在快速迭代,反而比Sora更早面向公众开放。
近日抖音豆包发布的端到端语音生成模型,在中文实时对话能力上也压倒ChatGPT-4o。
2025年,相信不会再有任何人会问出“中国还有没有必要做大模型”的问题,反而是美国人会不断发问:中国AI真的要反超美国了吗?
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。乐虎游戏app,乐虎游戏app,