发布日期:2025-06-25 02:33 点击次数:119
“天哪,怎么我们落后了,明明大家做的是一样的事”
这是阿里巴巴新任董事会主席蔡崇信回忆起DeepSeek强势出圈时发出的惊叹。
DeepSeek想必大家都不陌生了,现在的AI大模型几乎都上了“深度思考”。
它能够把它的推理过程给你展示出来。
DeepSeek官方于2025年1月20日首次公开了R1模型,宣布正式进军通用推理大模型赛道。

次日该大模型便引发了业界众多AI大佬的广泛关注,获得了高度认可。
这是一次国产AI大模型的技术里程碑,是强化学习驱动推理透明化的核心创新。
打破了OpenAI此前的垄断格局,更重要的是R1模型成本低、性能高!
近日蔡崇信在巴黎VivaTech技术大会上坦言,公司曾经一度迷失了方向,阿里巴巴势必要在AI领域押注。
DeepSeek的成功让阿里巴巴的工程师们感到压力很大。
阿里巴巴拥有的资源要远远大于初创时期的DeepSeek,但是产出结果却是反过来。
主管工程师当即取消了所有研发人员的春节假期,所有人都必须全力以赴。
吃在公司,睡在公司,追上落后的AI大模型进度。
经过连日的研发奋战,终于阿里巴巴推出了自己的Qwen(千问)大模型。

当然了“后来者居上”的逆转其实并没有出现。
根据资料显示Qwen3-235B-A22B大模型的推理能力89.3分,代码生成能力92.7分,多轮对话88.9分。
虽然数据上看得过去,但是与国际顶尖模型GPT-4.5、Claude3.7等差距还相差7%左右。
阿里巴巴的QWen大模型还需要进行打磨以及创新。
蔡崇信表示,阿里巴巴并不是为了在技术上与业界对手竞争高下,最终的愿景则是让AI使用普及,实现技术普惠!

技术普惠的同时,阿里巴巴通过海里的推理数据,将电商与核心业务云计算进行整合,产生价值。
蔡崇信表示,未来几年,阿里巴巴将持续投入超3800亿元人民币,用于AI基础设施的建设。
现在的表现依旧不能让蔡崇信满意,其仍然认为当前的环境还是非常艰难。
在这场AI的“角逐”中,不知道谁能够最后活下来!