开云体育app

开云体育APP

开云体育 国产算力「大考」通关: DeepSeek 迁居, 好意思团 LongCat 造房

发布日期:2026-05-10 09:25 来源:未知 作者:admin 浏览次数:

AI 才略的遑急落点,是物理世界。

撰文|蓝洞买卖 于玮琳

本年着手,国外科技圈皆在见原中国的算力问题。

1 月,马斯克在播客中称,中国在 AI 算力上「将远超世界其他地区」。2 月份,OpenAI 首席推行官奥特曼说,中国在东谈主工智能领域的本事进步 「快得惊东谈主」。

2025 年不错说是供给端的鸠合之年。摩尔线程、沐曦股份等国产 GPU 接连登陆老本市集,国产大模子的产业基础进一步加深。2026 年,变化向产业链下流传导,4 月下旬,多款国产大模子发布新版块。

4 月 20 日,月之暗面推出擅长长程代码编写的 Kimi K2.6 模子。4月 24 日,DeepSeek V4 发布,随后好意思团 LongCat-2.0-Preview 通达测试,两者总参数规模均突破万亿,且均援救 1M 超长凹凸文 。

值得一提的是,DeepSeek V4 完成了从英伟达体系向华为昇腾平台的迁徙与适配;而好意思团 LongCat2.0 则是训导推理全程基于国产算力的万亿参数大模子,使用了 5 万至 6 万张国产算力芯片。

永远以来,中国 AI 从业者,广泛策略是搭上已有的纯属决议。咫尺,国内 AI 企业启动尝试铺设我方的轨谈。

在田园修路

你该奈何完成一次辛劳的任务呢?

科幻作者阿瑟·克拉克的谜底是:「独一的倡导是让不成能自身,成为前进的泉源。」

DeepSeek V4 从率先定档到最终发布,发布时期调度了屡次。外部广泛预计,原因之一,便是需要将中枢代码从英伟达的 CUDA 迁徙出来。

CUDA 生态经过十几年的打磨,已是一个功能刚劲、器具完备的诞生平台。迁徙代码的经由,意味着诞生团队需要作念大量底层框架的重构职责。

最终 DeepSeek 作念到了,V4 发布两日后,摩根大通在评释中指出,V4 告捷适配华为昇腾芯片,考据了国产算力在前沿 AI 推理上的可行性;且 DeepSeek 通过羼杂在意力架构等底层本事立异,权贵裁汰了推理成本。

DeepSeek 用本事极客的神色降本增效,通过重写半个大模子的职责量完成硬核迁徙。同日通达测试的好意思团 LongCat-2.0-Preview,则是径直跑在国产算力之上。

国产算力在工程层面,有哪些难点?不妨以 LongCat-2.0-Preview 为例望望。

第一个难点,是物理层面的。国产硬件底座的显存容量和带宽与英伟达芯片有相反,训导部署万亿参数模子时,好意思团团队在工程方面有不小的挑战,需要用更多元气心灵去调试并行策略、优化显存。

第二难点是软件生态的纯属度,针对国产芯片的本性,确保训导全程的精准可复现,团队需要重写和优化核默算子,以及自研全敬佩性的算子。

第三个难点,是万卡集群的厚实性,在动用 5 万- 6 万张国产算力卡的超大规模集群上,硬件故障难以幸免。为此,团队构建了一套齐备的容错与自动归附体系。

终末,针对国产硬件的特质,团队在训导框架和模子结构进行针对性的亲和设想,冲破了通用框架的适配局限,升迁了打算性能。

DeepSeek 的算法优化裁汰了算力的门槛,把模子的价钱打了下来;好意思团的工程实践则解说国产芯片的可行性。这些探索,也给国产芯片生态千里淀出工程才略和教养。

梁文锋曾说:「咱们不是寥落成为一条鲶鱼,开云kaiyun(中国)仅仅不谨防成了一条鲶鱼」,而今「鲶鱼效应」还是流露,DeepSeek 并不独行。

从单点到系统

腾讯云的汤谈生曾有这么一个比方:「大模子是发动机,使用者是驾驶员」。使用者很容易在意到发动机的性能,但优秀的驾驶员,会刚烈到燃料与底盘相似遑急。

中国算力的发展,依赖的是整条产业链的协同进步。各个设施的中枢企业,皆在握续发力。

在制造端,公开数据标明,中国芯片产量节节攀升。中芯国际、华虹半导体等企业正鞭策多重曝光等工艺攻关,试图在物理极限中寻找均衡点。

在算力端,华为昇腾 910C 等居品的实践标明,通过极致的集群线性加快比,也能跑通体量纷乱的模子训导。

「得生态者得寰宇」。英伟达 CUDA 构建的护城河之是以深厚,一个遑急原因是酿成了普适性的软硬件兼容步伐。

行业从业者也刚烈到这少许。比如寒武纪推出基础软件平台,兼容主流框架,裁汰诞生者的迁徙门槛。智源东谈主工智能盘问院牵头的开源系统,构建了斡旋的底层接口,让表层模子不错运行在多种不同的国产芯片上。

国内互联网大厂也有好多看成,百度的双轨策略,字节朝上的千亿插足,皆在为算力底座寻找更优解。

据公开数据梳理,在当年几年中,好意思团至少布局了 21 家阴私半导体/智能硬件和通用大模子领域的关系公司。其中,既包括芯片算力层的摩尔线程、沐曦股份,以及视觉芯片领域的爱芯元智;也包括新材料等细分赛谈的广州众山等多家企业。

在本事恒久保握跟进的同期,产业老本也在作念算力的投资东谈主和共建者,渐渐酿成正向轮回。

从数字世界,到试验任务

「当下东谈主工智能正处于第三次波涛的遑急拐点,大模子正推动其从弱东谈主工智能迈向通用东谈主工智能,更要道的是,推动机器东谈主从 1.0 专用机器东谈主期间进入 2.0 通用具身智能期间。」

北京智源东谈主工智能盘问院院长王仲远的话,点出 AI 才略的遑急落点,是物理世界。

一方面,繁密国产厂商正勤快于让大模子在云霄「读万卷书」,升迁模子的颖悟、逻辑推理的严实性。另一方面,也要让大模子「行万里路」,比如文心大模子被植入到自动驾驶的决策系统中;混元大模子的工业质检决议,已出咫尺多个活水线场景。

好意思团的外卖、到店、酒旅等业务,组成了平淡生存中最复杂的任务推行采集。这里有海量的的简直场景:从商家后厨的出餐速率,到骑手在暴雨中的配送旅途,再到用户深夜的一句「思吃暖锅」。

王兴曾明确忽视,要将好意思团 App 率先升级成「AI-powered App」。这意味着,LongCat 的训导想法不仅是陈述「哪家的小炒肉适口」,更要「找到这家店,选出最好的团购券,然后预定 2 个周五晚上 7 点钟的座位」。

这意味着任务委用的贬抑尤为遑急,也解释了好意思团为何强调要打造物理世界的 AI 底座。

从参数升迁到算力跑通,国产大模子正在完成从「能用」到「好用」的进阶。

这条路莫得捷径。畴昔开云体育,当算法、算力、资金与场景握续产生化学反映,中国 AI 的故事,也将从「单点突破」翻到「系统进化」这一页。

博亚体育中国官网在线入口