阿里蔡崇信透露: DeepSeek的出圈, 令工程师春节睡办公室搞研发

发布日期：2025-06-25 02:33 点击次数：119

“天哪，怎么我们落后了，明明大家做的是一样的事”

这是阿里巴巴新任董事会主席蔡崇信回忆起DeepSeek强势出圈时发出的惊叹。

DeepSeek想必大家都不陌生了，现在的AI大模型几乎都上了“深度思考”。

它能够把它的推理过程给你展示出来。

DeepSeek官方于2025年1月20日首次公开了R1模型，宣布正式进军通用推理大模型赛道。

次日该大模型便引发了业界众多AI大佬的广泛关注，获得了高度认可。

这是一次国产AI大模型的技术里程碑，是强化学习驱动推理透明化的核心创新。

打破了OpenAI此前的垄断格局，更重要的是R1模型成本低、性能高！

近日蔡崇信在巴黎VivaTech技术大会上坦言，公司曾经一度迷失了方向，阿里巴巴势必要在AI领域押注。

DeepSeek的成功让阿里巴巴的工程师们感到压力很大。

阿里巴巴拥有的资源要远远大于初创时期的DeepSeek，但是产出结果却是反过来。

主管工程师当即取消了所有研发人员的春节假期，所有人都必须全力以赴。

吃在公司，睡在公司，追上落后的AI大模型进度。

经过连日的研发奋战，终于阿里巴巴推出了自己的Qwen（千问）大模型。

当然了“后来者居上”的逆转其实并没有出现。

根据资料显示Qwen3-235B-A22B大模型的推理能力89.3分，代码生成能力92.7分，多轮对话88.9分。

虽然数据上看得过去，但是与国际顶尖模型GPT-4.5、Claude3.7等差距还相差7%左右。

阿里巴巴的QWen大模型还需要进行打磨以及创新。

蔡崇信表示，阿里巴巴并不是为了在技术上与业界对手竞争高下，最终的愿景则是让AI使用普及，实现技术普惠！

技术普惠的同时，阿里巴巴通过海里的推理数据，将电商与核心业务云计算进行整合，产生价值。

蔡崇信表示，未来几年，阿里巴巴将持续投入超3800亿元人民币，用于AI基础设施的建设。

现在的表现依旧不能让蔡崇信满意，其仍然认为当前的环境还是非常艰难。

在这场AI的“角逐”中，不知道谁能够最后活下来！