《金融时报》:华为问题百出的软件阻碍了中国在AI领域取代NVIDIA的努力
去年 10 月,华盛顿进一步收紧了对高性能硅片的出口管制,中国科技巨头在开发国内替代行业领导者NVIDIA的产品的竞争中拔得头筹。它的 Ascend 系列已成为一系列中国AI技术团体运行推理的一个越来越受欢迎的选择,OpenAI 的 ChatGPT 等应用就是利用这一过程来生成对查询的回复。
但包括一家合作公司的人工智能工程师在内的多位业内人士表示,在早期的模型训练中,这些芯片仍然远远落后于NVIDIA的芯片。他们将此归咎于稳定性问题、较慢的芯片间连接速度以及华为开发的名为 “昇腾异构计算架构CANN”的问题百出的软件。
NVIDIA的软件平台CUDA被誉为公司成功的"秘诀",因为它易于开发人员使用,并能大大加快数据处理速度。华为是众多试图通过开发替代软件来打破 NVIDIA 对人工智能芯片垄断的公司之一。
华为自己的员工也在抱怨 CANN。一位不愿透露姓名的研究人员说,CANN 使 Ascend 产品"难以使用且不稳定",测试工作受到阻碍。"当随机错误发生时,由于文档不完善,很难找出错误的根源。需要有才能的开发人员阅读源代码,才能发现问题所在,这就拖慢了工作进度。编码并不完善,"他们说。
另一位了解百度使用华为处理器情况的中国工程师说,这些芯片经常死机,使人工智能开发工作复杂化。华为的研究人员说,发生崩溃的原因是很难使用硬件。他们说:"由于人们对硬件本身不甚了解,因此很容易出现糟糕的结果。"
据多位熟悉此事的人士透露,为了解决这个问题,华为已经派遣工程师到现场帮助客户将之前在CUDA上编写的培训代码转移到 CANN 上。百度、科大讯飞和腾讯等科技公司都接待了工程师团队。
华为拒绝置评,百度、科大讯飞和腾讯也没有回应置评请求。
一位前百度员工透露说:"华为擅长客户服务,所以他们当然会在大客户那里派驻工程师,帮助他们使用自己的芯片。 "
华为可以利用庞大的员工队伍加速转变。据该公司称,在其 20.7 万名员工中,50% 以上从事研发工作,包括被派遣为客户安装技术的工程师。
"与 NVIDIA相比,华为的优势在于可以与客户密切合作,"咨询公司 Gavekal 的技术分析师 Tilly Zhang 说,"与 NVIDIA不同,华为拥有庞大的工程师团队,可以帮助客户解决问题,并让客户过渡到自己的硬件。"
华为还建立了一个在线门户,供开发人员就如何改进软件提出反馈意见。据熟悉内情的人士称,美国10 月份加强出口管制后,华为将用于培训的芯片 Ascend 910B 的价格提高了 20% 至 30%。华为的客户也对 Ascend 芯片的供应紧张表示担忧,原因可能是中国公司无法从荷兰 ASML 公司购买最先进的芯片制造设备,导致制造困难。
华为的人工智能芯片需求强劲。该公司周四公布的上半年收入增长了 34%,但没有提供不同业务的销售细目。华为执行董事张平安今年 7 月在上海举行的世界人工智能大会上说,在 Ascend 芯片上已经"训练和迭代"了 50 多个基础模型。科大讯飞表示,去年华为派遣了一批工程师到其位于中国东部合肥的总部进行技术整合,其大型语言模型完全是在华为芯片上训练出来的。
当前页面是本站的「Google AMP」版。查看和发表评论请点击:完整版 »