DeepSeek颠覆AI格局 这只是序幕

今年年初,DeepSeek引发科技界广泛关注。1月底,该公司凭借其R1 AI模型登上新闻头条。公司声称,该模型性能可与OpenAI的o1相媲美,而训练成本却仅为后者的一小部分。与此同时,DeepSeek一度超越ChatGPT,成为苹果应用商店下载量最高的AI应用,推动科技股震荡下跌。
这一突破引发美国科技企业对本国在人工智能竞争中的地位产生质疑,同时也让外界重新审视该领域的巨额投资及其实际成效。在巴黎AI行动峰会上,美国副总统万斯(J.D. Vance)未直接提及DeepSeek或中国,但强调美国在人工智能领域保持领先的重要性。他表示:“美国在人工智能领域处于领先地位,政府将采取措施确保这一优势。”同时,他也强调美国愿与其他国家开展合作。
开放技术加速AI革新
专家指出,DeepSeek R1不仅具备较强的推理能力,还能够通过模拟“思考”提供更高质量的答案。此外,DeepSeek决定公开部分核心技术,这一举措将加速行业创新和技术发展。
近年来,生成式人工智能的崛起极大改变了人们的工作、交流及获取信息的方式。ChatGPT等产品的广泛应用推动AI进入爆发期,也使得英伟达(Nvidia)等芯片企业受到资本市场青睐,甚至影响硅谷科技巨头的发展战略。在此背景下,任何有助于提升AI模型性能、降低训练成本的技术突破都备受关注。
艾伦人工智能研究所前首席执行官埃齐奥尼(Oren Etzioni)表示:“这绝不是炒作。”但他也指出,人工智能技术发展日新月异,“行业竞争格局仍在不断变化”。
DeepSeek的崛起引发全球科技界高度关注。谷歌DeepMind首席执行官哈萨比斯(Demis Hassabis)认为,外界对DeepSeek的热议有些“夸大”,但同时表示:“这是我见过的中国最优秀的人工智能模型之一。”
微软首席执行官纳德拉(Satya Nadella)在1月财报电话会议上表示,DeepSeek确实展现出“真正的创新能力”;苹果首席执行官库克(Tim Cook)则认为,“推动技术效率的创新值得肯定”。
外界对DeepSeek训练成本存疑
与此同时,DeepSeek的成本优势也引发质疑。半导体研究机构SemiAnalysis指出,DeepSeek声称仅用560万美元训练R1模型的说法“值得商榷”。OpenAI向英国《金融时报》表示,该公司发现证据表明DeepSeek可能使用OpenAI的模型进行训练,并对此展开调查。
OpenAI发言人表示:“我们已关注此事,并正在评估DeepSeek是否存在不当使用我们模型的行为。”
此外,美国政府也对DeepSeek的快速崛起保持警惕。据《美联社》和《美国广播公司》报道,两名美国议员呼吁禁止在政府设备上使用DeepSeek应用。此前,热门社交平台TikTok因数据安全问题受到美国政府监管,并被要求出售给美国企业,否则将面临禁令。
DeepSeek:AI界的TikTok
埃齐奥尼表示:“DeepSeek对大型语言模型(LLM)的影响,类似于TikTok在社交媒体领域的影响。”
业内人士认为,DeepSeek的创新将对人工智能行业产生深远影响。
Hugging Face高级研究员邓斯托(Lewis Tunstall)表示:“DeepSeek的研究报告提供了技术解决方案,但仍有部分关键细节未公开。”目前,Hugging Face正在推动R1模型的全面开源。尽管DeepSeek已公布研究论文及模型参数,但其代码和训练数据仍未公开。
微软首席执行官纳德拉透露,Windows Copilot+ PC等支持AI功能的设备将能够运行DeepSeek R1模型的优化版本。移动芯片制造商高通则表示,从DeepSeek R1提炼出的模型可在一周内适配其芯片,并在智能手机和个人电脑上运行。
自我优化与可视化推理
尽管DeepSeek并非首个具备推理能力的开源模型,但其影响力不容忽视。业内专家指出,DeepSeek的独特之处在于,其不仅具备推理能力,还能通过自我学习不断优化,同时让人工智能社区能够直观了解其内部运行机制。使用DeepSeek应用的用户还能观察R1模型在回答问题时的“思考”过程。
高通公司高级副总裁、技术规划与边缘解决方案总经理马拉迪(Durga Malladi)表示:“DeepSeek让我们可以清晰看到AI模型内部的运作方式。”
邓斯托认为,未来或将有更多能够进行深度推理的AI模型出现。“这可能成为行业发展的关键,因为科技巨头们正在竞相打造AI助手。”在硅谷,AI助手被视为聊天机器人的下一阶段发展方向,并有望成为人机交互的核心模式。
社交媒体平台X(原推特)推出的下一代聊天机器人Grok 3也正朝这一方向发展。其所有者马斯克在世界政府峰会的视频演讲中表示,新版本将具备“更强大的推理能力”。
12个月内或迎新突破
目前,全球AI行业仍在探索如何进一步提升人工智能技术能力,而DeepSeek的突破无疑加快了这一进程。
埃齐奥尼预测:“未来12个月内,我们可能会见证新的技术突破,取代现有模型。”但他也强调:“DeepSeek无疑代表了当前AI技术的前沿发展。”