大模型年代，AI芯片“破局”之战

liukang20243个月前 (04-27)166.SU吃瓜808

这一次，我国企业也预备好了。

文 | 晓曦

说起半导体职业面临的难题，人们榜首时刻想到的是什么？是光刻机？是5nm？是一块方方正正的芯片，咱们造不出来？

是，但也不完满是。

人们往往将芯片半导体划分为硬件工业，但事实上，这是一个高度软硬件集成的工业——软件乃至更多时分占了大头。

所以，即使咱们在20年前就研制出了CPU，现在仍会面临如此局势。相同，现在更受人重视的GPU工业也遇到了相同困局，由于咱们面临的真实难题，不是硬件，而是软件。

01. 当咱们说芯片困局时，咱们在说什么？

芯片的硬件指的是运转指令的物理途径，包含处理器、内存、存储设备等等。芯片数据中常呈现的“晶体管数量”、“7nm制程”、“存储”等，往往指的便是硬件参数。

软件则包含固件、驱动程序、操作系统、运用程序、算子、编译器和开发东西、模型优化和布置东西、运用生态等等。这些软件辅导硬件怎么响运用户指令、处理数据和使命，一起经过特定的算法和战略优化硬件资源的运用。芯片数据中常呈现的“x86指令集”、“深度学习算子”、“CUDA途径”等，往往指的便是芯片软件。

没有硬件，软件就无法履行；可没有软件，硬件就仅仅一堆毫无含义的硅片。

以英伟达的CUDA途径为例。

2012年，跟着深度学习+GPU的组合在ImageNet大赛上一炮打响，人工智能一夜之间火遍全球，全球科技界都将目光转向了这一范畴。多年深耕CUDA人工智能核算途径的英伟达股价自然是一路走红，成为了新年代的霸主。

软件，成为了人工智能年代的中心技能壁垒。

为了打破英伟达一家独大的局势，上一任全球芯片老迈英特尔和多年迈对手AMD对标CUDA都别离推出了OneAPI和ROCm，Linux基金会更是联合英特尔、谷歌、高通、ARM、三星等公司联合成立了民间声称“反CUDA联盟”的UXL基金会，以开发全新的开源软件套件，让AI开发者能够在基金会成员的任何芯片上进行编程，企图让其替代CUDA，成为AI开发者的首选开发途径。

反过来，英伟达也在不断深挖CUDA的护城河。

早在2021年，英伟达就曾揭露表明过“制止运用转化层在其他硬件途径上运转根据CUDA的软件”，2024年3月，英伟达更是将其晋级为“CUDA禁令”，直接添加在了CUDA的终究用户答应协议中，已制止用转译层在其他GPU上运转CUDA软件

关于我国用户而言，这一禁令的打击面要更大。

早在2022年，英伟达就已被要求对我国商场断供高端GPU芯片，死死地卡住我国GPU芯片购买途径。

现在连在其他芯片上运转CUDA软件都被英伟达制止了，我国人工智能公司们，怎么办？

02. 国内AI芯片全面兴起

其实，在这条禁令下发之前好久，我国芯片公司们就现已有所预备了。

2015年，国内人工智能工业如火如荼，“AI四小龙”兴起，连带着整个工业步入打开快车道。

在这波由CNN（卷积神经网络）技能引领的人工智能职业热潮之中，就有许多我国企业看到了打造国内AI芯片的重要性。

在此期间，国内连续呈现出了近百家国内AI芯片公司，其间既有如寒武纪、地平线、壁仞科技、后摩智能等的明星创业公司，也有如华为、阿里、百度等的科技巨子，还有传统芯片厂商与矿机厂商。

各家纷繁入局，工业如烈火烹油、鲜花着锦，咱们的一起方针只需一个，打造自主可控的国内AI芯片生态。

国内AI芯片玩家们早早就认识到了软件、东西、生态关于芯片的重要性，因而在不断晋级迭代硬件产品之余，也投入了许多的时刻、精力，企图处理软件生态建造中存在的问题。

CUDA是一个关闭的软件途径，因而，从底层开端打造原创的软件栈是打破CUDA生态壁垒的要害道路。

部分国内AI芯片软件途径信息盘点

我国AI芯片创业公司在云、边、端等范畴百家争鸣，它们在各自的细分范畴都有着杰出的体现。以硬件架构立异和软件架构通用性见长的壁仞科技为例，BIRENSUPA软件途径是一个包含硬件笼统层、编程模型和BRCC编译器、深度学习和通用核算加快库、东西链，支撑干流深度学习结构和自研推理加快引擎，配备有针对不同场景的运用SDK，是国内罕见的具有完好功用架构的AI软件开发途径。

此外，面向云端AI芯片、车载AI芯片的寒武纪曾推出寒武纪根底软件途径；面向存算一体智驾芯片的后摩智能曾推出后摩大路软件途径；面向全功用GPU的摩尔线程曾推出MUSA SDK与AI软件途径；面向GPGPU的天数智芯也曾推出天数智芯软件栈等等，国内玩家可谓百家争鸣。

与我国最早一批白手起家的芯片研究人员不同，今世的国内AI芯片玩家大多都有着资深的芯片职业从业经历，深知CUDA类软件东西生态关于AI开发者而言有多么重要。

因而，在2015～2022年期间，虽然国内芯片玩家不断尽力打造归于自己的AI芯片软硬件生态，但也只能说是追上了世界中上游水平，离英伟达这种全球巨子还有显着距离。

在此期间，英伟达也没闲着，它乘着深度学习的浪潮一跃而起，不断稳固其在AI深度学习范畴的优势位置，终究彻底坐稳了全球芯片老迈哥的宝座。

从CPU到GPU，从x86到CUDA，从英特尔到英伟达，前史历来都是惊人的类似。

但没有人想到，这一次，新一轮时机来得那么快。

2022年11月，命运的齿轮再次滚动——ChatGPT横空出世，一下踢翻了AI芯片的工业天平。

03. 大模型：天赐良机

2022年11月，跟着ChatGPT在全球范围内一炮打响，大言语模型忽然成为全球追捧的技能前沿，其热度远超CNN之上。

这简直是国内AI芯片厂商“换道超车”的天赐良机。

更绝的是，大言语模型的技能基底是Transformer网络，其诞生之初有BERT、T5、GPT三种不同的途径。

可是自从ChatGPT震慑露脸之后，GPT成为了肯定的干流。全球人工智能工业忽然史无前例地达到了一致认知——GPT道路。

在人工智能技能打开的前史上，这几乎是绝无仅有的一致。

CUDA的先发优势，忽然被急剧缩小。

由于人工智能技能途径快速收敛，在大模型年代，国内AI芯片厂商能够快速上手针对这些模型进行调校和适配，让大模型软件研制人员能够快速上手。

更重要的是，此刻，国内AI芯片玩家、与世界顶尖选手，站在了同一起跑线上。

前史经历告知咱们，只需拉平起跑线，论事务的“卷”，国内玩家是不怕的。

当时，英伟达严令制止CUDA运转在其他AI芯片硬件途径之上，再叠加以美国进一步收紧芯片禁令、全球算力紧缺的大布景下，国内大模型软件厂商无法买到最前沿的GPU芯片。

因而，关于大模型公司而言的榜首痛点，便是怎么将现有大模型进行核算途径的搬迁。

鉴于大模型练习对算力集群的火急需求，当时，国内各大AI芯片企业都在致力于加强集群才能的构建。

以GPGPU架构的壁仞科技为例：据客户测验反应，虽然作为草创公司，壁仞的SUPA与老练的CUDA之间依然存在距离，但在软件团队的支撑下，顺利在较短时刻完结实践运用的搬迁，而且针对干流开源大模型展现实践功能也到达可喜的水平。

关于大模型厂商而言，AI芯片厂商如果能供给易用且低成本的搬迁东西、齐备的模型适配才能，以及具有老练的集群布置经历，都关于大模型的快速落含义严峻。

据职业人士泄漏：国内几家公司包含壁仞科技，都现已完结了对国内大部分开源大模型的适配，积累了许多千卡集群布置的经历，适配数据也表明晰国内大模型协作伙伴在进行自研模型适配的时刻有了明显缩短。

36氪也了解到：“除了协助用户敏捷从CUDA搬迁到SUPA生态中外；大模型厂商还能凭仗壁仞科技的架构立异特色和SUPA编程模型共同才能，对CUDA生态进行拓宽，然后进一步提高功能。”

由于从底层指令集开端悉数自研，具有彻底的自主权，能够最大化发挥壁仞产品具有优势的硬件功能，从硬件到终端运用不管产生哪些改变，软件栈都能随时进行优化、迭代和调整。”

在“卡脖子”现象的普遍存在的当下，除了芯片层外，大模型的软件层、算力层、云核算层等，都在活跃进行国产化的推进。

而AI芯片企业作为大模型AI算力生态的最底层修建，则跟需要与模型、结构、集群企业深度协作，完成全体功能的最大化。

比方，壁仞科技不只与PaddlePaddle等国内外多款干流算法结构企业达到协作，满意企业用户与世界干流接轨的开发需求，还特别针对国内环境进行了深度适配，完成了与PaddlePaddle的2级兼容，为国内AI大模型厂商供给了愈加顺利的接入途径。

一起，壁仞科技还与无问芯穹等国内算力优化玩家达到了深度协作，从芯片、算法、算力等层面临国产AI算力软硬件途径进行归纳优化与提高，进一步推进AI算力生态的全面国产化发力。

关于“隐形卡脖子”最为严峻的软件生态范畴，壁仞科技则经过建造算力途径、开源相关东西和库，以及敞开上层模型三个维度推行软件途径；与结构、大模型协作伙伴打开联合适配优化，树立广泛生态协作；与高校、科研安排、终究客户经过产学研用多种手段进行推行落地。面向教育、科研范畴，壁仞科技活跃与高等教育安排协作，致力于培育新一代的软件生态建造者。

软件生态无疑是最难打破的算力软实力壁垒，也是当时各大AI芯片企业的攻关一致。力求经过产、学、研的多方发力，完成破局。以浙江大学的AI教育途径Mo途径为例，该途径采用了壁仞科技的硬件和软件资源作为教育实践的根底，这不只为学生供给了实践时机，也为国产软件生态的久远打开播下了期望的种子。

自2022年末以来，大模型的热火烧遍了全球。2024年更是大模型会集落地的迸发元年，越来越多新式的AI运用会集呈现，改变着人们日子的方方面面。

新一轮工业时机，这才刚刚开端。

咱们现在看到的，是芯片职业下一个二十年的弱小曙光。

结语

毫无疑问，算力，现已成为人工智能年代的全球兵家必争之地。

在当时全球大模型的工业热潮之中，算力严峻紧缺问题现已成为约束各国人工智能技能打开的重要原因之一。

正如OpenAI的CEO Sam Altman在其7万亿美元AI芯片方案中所展露出的野心，他说：“算力将成为未来最名贵的财富之一，会成为未来的’钱银’，人工智能的打开将是一场巨大的权力斗争，公司、安排、国家都可能为了抢夺这份未来的“钱银”而打开竞赛。”

当时，以英伟达为首的GPU硬件，由于其在CUDA软件方面的优势，受到了商场的火热追捧，长时间处于求过于供的状况。而大模型替代深度神经网络成为新一代人工智能技能的领导者，恰恰给予了我国国内AI芯片一个数十年难遇的“换道超车”良机。

在当时的数字经济年代，新式AI算力已成为年代的“新质生产力”，具有高科技、高效能、高质量的特征，与大数据、云核算、人工智能、大言语模型等新技能紧密结合。

前史历来都是螺旋上升的。

回望曩昔近二十年，英伟达之所以能在AI年代全面称王，凭仗的正是在人工智能范畴的先发优势，乘着深度学习的春风，以CUDA软件途径对英特尔完成了全面“换道超车”。

现在大模型技能兴起，又一条簇新的赛道呈现在了一切芯片厂商面前。

仅仅这一次，我国企业也预备好了。

告发/反应

标签: AI 破局芯片之战模型

返回列表

上一篇：被C罗厌弃，可口可乐40亿没了；国足四连胜挺近12强；美国发禁狗令；直播假货判刑……

下一篇：芯片女王：奔向问题，问题实际上发明了时机

黑瓜热心网

大模型年代，AI芯片“破局”之战

01. 当咱们说芯片困局时，咱们在说什么？

02. 国内AI芯片全面兴起

03. 大模型：天赐良机

结语

相关文章

AI主播风头正劲 “真人”主持人大赛还有啥看头？

冠县店子镇举行新农村业校暨AI+电商专项技术训练会助力电商工业新发展

使用AI制造奇葩交通罚单？打乱网络次序该罚！

同声传译、全新AI形式查找！谷歌重磅发布“最强通用AI模型”

「工业互联网周报」美国商务部吊销拜登年代AI分散规则；英伟达将调整对华芯片出口，不再根据Hopper；微软裁人3%，削减中层管理人员

谷歌推出新AI东西Stitch：文字、图片可秒变 UI 规划与前端代码

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.

黑瓜热心网

大模型年代，AI芯片“破局”之战

01. 当咱们说芯片困局时，咱们在说什么？

02. 国内AI芯片全面兴起

03. 大模型：天赐良机

结语

相关文章

AI主播风头正劲 “真人”主持人大赛还有啥看头？

冠县店子镇举行新农村业校暨AI+电商专项技术训练会 助力电商工业新发展

使用AI制造奇葩交通罚单？打乱网络次序该罚！

同声传译、全新AI形式查找！谷歌重磅发布“最强通用AI模型”

「工业互联网周报」美国商务部吊销拜登年代AI分散规则；英伟达将调整对华芯片出口，不再根据Hopper；微软裁人3%，削减中层管理人员

谷歌推出新AI东西Stitch：文字、图片可秒变 UI 规划与前端代码

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.

冠县店子镇举行新农村业校暨AI+电商专项技术训练会助力电商工业新发展