手机版最新下载

发布日期：2026-05-07 07:58 点击次数：74

文/不雅察者网吕栋

“由于昇腾910B芯片的硬件假想限度，包括显存容量显耀低于H200芯片（64G Vs 141G），显存带宽差2倍（1.6TB/s Vs 4.8TB/s ）等，（H200是英伟达的中等竖立芯片），这些限度导致在新模子历练过程中遭逢很大的困难。”4月29日在事迹会上，科大讯飞管理层冷漠解说了在昇腾芯片上历练大模子时遭逢的挑战。

在智能体运用爆发确当下，大模子对超长高下文建模、器用调用、风物级代码等复杂智商的条款急剧攀升，而国产算力的显存和带延期度，使得历练这类模子变得难办。当国际主流算法出来后，在英伟达GPU上平直就不错作念，但在国产卡上需要脱落管理算子库效率优化等一系列问题，需要脱落3-6个月的适配周期。

坚合手在华为昇腾上历练，科大讯飞的作念法相对激进，但践诺的选拔也并莫得太多。中好意思科技的博弈合手续深远，多家中国公司被实体清单羁绊，起初进的GPU买不到，国外生态不可靠的现实更不需反复论证。

联袂国产算力历练大模子，是科大讯飞不小的挑战，亦然AI期间独一的解围旅途。“近期有一些媒体报谈DeepSeek V4是昇腾算力上历练的，但践诺只是基于昇腾算力对V4模子作念了推理适配，DS V4的历练仍然是基于英伟达卡进行的。”科大讯飞管理层在事迹会上暗示，现在国内仍然唯独讯飞一家在宇宙产算力上完周全栈模子的历练。

用国产算力推理和历练，难度不同

大模子的竞争，不是一场单纯的营业竞赛。近日，外商投资安全审查责任机制办公室（国度发展改进委）照章依规对外资收购Manus风物作出禁绝投资决定，条款当事东谈主淹没该收购往来。

监管心思的并非往来结构自己，而是工夫箝制权的包摄，包括中枢研发智商、系统架构、数据来源及关节东谈主才是否发生本质性转换。这一事件也开释出一个明治服号：AI中枢钞票并不是不错松驰流动的平凡钞票，东谈主工智能期间的中枢工夫正在被纳入国度安全框架。

英伟达CEO黄仁勋也在近期的访谈中直言，好意思国对中国的出口管制正产生反扫尾，反而加快中国AI产业的里面整合。他警戒，这种“被动”的深度会通，可能催生出一个实足去好意思国化的、垂直整合的AI工夫栈。他反对把中国舍弃在好意思国工夫栈以外，以为这会制造两个生态系统，反而不利于好意思国。更关节的是，出口管制并不成信得过扼制中国鼓励AI。

但国内市集对“算力替代”的解读，同样有些单方面。本年2月，智谱告示GLM-5完成与华为昇腾、摩尔线程、寒武纪等主流国产芯片平台的“深度推理适配”。4月，DeepSeek-V4上线，华为昇腾、摩尔线程等多家国产芯片厂商均告示完成“Day0适配”。

这些线路十分贫寒。智能体爆火之后，一个任务可能不是调用模子一次，而是几十次、上百次地调用模子，合手续进行绸缪、搜索、写代码、读文献、调用器用和反想重试。token调用量越大，推理本钱越敏锐，国产推理适配的营业价值就越大。

但“能推”和“能训”，中间有一条宽阔的鸿沟。历练不是把现成模子搬到芯片上去跑，而是要让模子在国产芯片集群上，完成从数据、架构、并行策略、通讯机制、算子库、容错系统到最终治理的全过程。任何一个要领出问题，历练效率就会断崖式下滑。

随机，由于算子各别和模子散布式策略，会形成历练推理精度一致性对都的难题；随机又会因为一致性对都关联词历练效率很低导致难以历练。举例，在智能体强化学习历练阶段的采样推理操作效率，因为国产算力的通讯机制假想导致显耀低于H200，甚而能收支5倍。

关于国产芯片而言，模子历练的难度远高于推理。但信得过要梗阻卡脖子，又不成只停留在“模子跑在国产芯片上”。因为若是底座模子的下一轮预历练、下一次架构升级、下一代智能体强化学习，仍然依赖国外GPU和国外软件生态，那就无法信得过完毕自主可控。

换句话说，唯独在国产芯片上训出一流大模子，国产算力生态才算完成解围。

华为昇腾芯片

已与昇腾950深度对接，讯飞称历练进程将加快

手脚两家实体清单企业，讯飞很早就运行与华为昇腾联袂。

在公竖立言中，科大讯飞董事长刘庆峰屡次强调自主可控算力平台的贫寒性。他以为，大模子研发开首需要算力维持，但信得过挑战在国产算力生态。

相比浮浅强调“适配国产芯片”，科大讯飞近些年把要点放在了国产算力历练上，鼓励长想维链强化学习、MoE等前沿标的在国产算力上的历练效率优化。

“前年咱们在910B集群上攻克了长想维链强化学习和首个昇腾原生MoE模子全链条历练的效率难题，历练效率从开箱气象下和同规模A800集群效率相比唯独30%，折柳晋升至84%和93%。”科大讯飞管理层在事迹会上暗示，该公司与华为深度合营，发现并管理了好多底层bug，也日益形成了科大讯飞的上风。

财报浮现，2025年，科大讯飞营收271.05亿元，同比增长16.12%；归母净利润8.39亿元，同比增长49.85%；扣非净利润2.64亿元，同比增长40.47%。“夙昔几年咱们蚁合华为作念了特地多的国产化适配和立异责任。恰是这种问题的管理，使得星火大模子在央国企招投标中得到最高市集份额。”科大讯飞管理层暗示。

4月29日，科大讯飞推出基于昇腾910系列算力集群历练的30B中等体量MoE模子讯飞星火X2-Flash。华为称，两边“硬件加算法”协同，蚁合优化DSA等关节算子性能，算子效率晋升进步50%，并吞DSA揣度特质假想亲和的长序列散布式历练策略，攻克了智能体长高下文在昇腾910系列芯片上历练效率偏低的难题。

率直说，信得过的国产化，是在国产算力上把模子训出来、训强、合手续迭代。这一步一朝跨夙昔，国产芯片就不再只是连结推理任务的替代品，而是参加大模子研发主进程。芯片、框架、算子库、通讯库、编译器、集群退换和模子算法会被动一都迭代。国产算力生态不再只是外围兼容，而是成为模子进化的一部分。

恒久以来，受外部环境影响，DeepSeek与华为联手成为深得人心，但DeepSeek-V4发布后，并莫得提到该模子基于昇腾历练。华为也只是暗示，昇腾950通过会通kernel和多流并行工夫镌汰Attention揣度和访存支出，大幅晋升推感性能，并吞多种量化算法，完毕了高隐约、低时延的DeepSeek-V4模子推理部署。

但科大讯飞此次明确暗示，将不绝在昇腾950上历练大模子。

“咱们面前还是与片华为团队针对950芯进行深度对接，在昇腾950平台上蚁合攻坚更高效模子结构、搀杂Attention机制、智能体强化学习等关节工夫，因为950系列相干于910系列的显存、带宽算力等方面都有较大晋升，瞻望咱们面前的算法搬动夙昔之后不错很大加快咱们的历练进程。瞻望在本年1024竖立者节时间，在昇腾950平台上发布中国首个对标业界起初进主流模子的旗舰大模子。”科大讯飞管理层暗示。

巨头环伺，仍要直面市集竞争

自主可控是一块坚实的压舱石，但它并不是护城河的全部。

某种兴味上，国产算力历练的兴味还是卓越了“真贵被卡脖子”的规模。它让科大讯飞面对中国高大的政企客户时，大略提供一种好意思国芯片体系无法相比的信任感：齐备闭环、数据不出境、工夫不依赖国外。从中标获利来看，这种信任正在滚动为简直的市集选拔。

“依托星辰MaaS底座，公司完毕宇宙产算力全链条奇迹，大模子安全测评位居行业前哨，幻觉率低，是央国企招标优选模子。”科大讯飞管理层在事迹会上说谈。

但国产算力生态依然处在完善过程中。除了昇腾生态的闇练度仍在追逐以外，宇宙产化链条中先进制程、HBM、高速互联、先进封装、EDA等要领仍然存在挑战。历练梗阻的计策价值在于，它让国产算力从“可用”走向“中枢可用”，从“局部替代”走向“体系替代”。

与此同期，科大讯飞濒临的市集竞争也辞谢小觑。千问领有阿里巴巴的高大生态和C端流量，在开源模子的社区影响力上依然当先；豆包在字节系的强力扶合手下，面向C端用户的产物体验和运营智商正在快速攀升；智谱则凭借与多家国产芯片的深度适配，在一体机和企业市集快速铺开。当一个市集里有多个参与者都具备充足的工夫实力和资金储备时，“自主可控”这一维度的各别化上风，尚不及以确保一劳久逸的当先。

更值得心思的是，有竞争力的大模子不成只是局限在自主可控的市鸠合，还要走向更广阔的领域，包括国际企业客户、寰球竖立者社区和怒放的工夫竞赛。而这些领域，在很猛进度上仍由英伟达的生态和通用揣度体系主导。国产算力历练作念得充足塌实，仍旧只是总计这个词AI产业河山的一部分。科大讯飞能否在效力国产算力坚固防地的同期，合手续拓展国际影响力和营业畛域，将是改日几年信得过的进修。

能训是硬仗开云体育，能赢是更大的仗。在国产算力上合手续训出强模子，活着界的大舞台上展现竞争力，才是中国大模子梗阻封闭、穿越周期更大的底气。

开云体育历练不是把现成模子搬到芯片上去跑-开yun云体育入口(官方)网站/网页版登录入口/手机版最新下载

热点资讯

相关资讯