跟着ChatGPT、百度文心一言等一系列大模型密布上线,AI大模型当下现已遍地开花。本周四,谷歌发布AI言语模型PaLM 2与OpenAI旗下GPT-4等体系打开竞赛,国内云从科技、引力传媒等多家A股上市公司亦宣告AI大模型产品最新发展。在“AI百模大战”背面,随之带动的算力需求开端呈“爆破式”增加,一场“算力储备战”已暗潮汹涌,全球算力商场继续炽热。
据悉,AI由数据、算法(即模型)和算力驱动,其间恣意一方的开展会推进其他方面需求的增加。有剖析以为,当下职业界尽管具有更多的数据以及做了更多的AI模型研讨,但算力的扩展速度却没有跟上。本年4月,OpenAI就因需求量过大而中止了ChatGPT Plus的出售。对此,东方证券研报以为,首要系核算资源求过于供。 依据数据猜测,AI年代算力的增加已远远超越了摩尔定律每18个月翻番的速率,估计到2030年全球超算算力将到达0.2ZFLOPS,均匀年增速超越34%。华为更是猜测,未来10年人工智能算力需求将会增加500倍以上。那么,身处“智能革新”起点的当下,什么才是AI算力的最优解?国内“算力军备竞赛”又走到哪一步了? ▌短期堆起的GPU竞赛高地:以量制胜筑起大模型算力门槛 低配版英伟达GPU国内炒至10万元 众所周知,芯片才能直接影响着高算力练习效果和速度,相较于依据CPU芯片的通用算力,AI所需的智能算力则首要依据GPU、GPGPU及AISC等AI芯片所供给算力,用于人工智能的练习和推理。其间,GPU是一种专门用于处理图形、视频、游戏等高功能核算的硬件设备,凭仗相较于其他硬件在算力方面的较大优势锋芒毕露,一起跟着英伟达A100、H100等类型产品的发布,前款产品在AI推理时吞吐量是CPU的249倍。GPU已成为当时AI算力的中心硬件。 中金公司研报表明,多GPU互联才能加强可以进步并行核算才能,因而算力进步对GPU数量的要求日益进步。跟着单GPU的核算才能越来越难以应对深度学习对算力的需求,英伟达现已开端用多个GPU去处理问题。对此,业界剖析以为,高端GPU的数量根本决议了一个厂商可以练多大的模型,后期将成为业界判别企业大模型才能的重要目标。 据TrendForce数据显现,假如以英伟达 A100 显卡的处理才能核算,GPT-3.5大模型需求2万块GPU来处理练习数据。亦有业界公认观点,做好AI大模型的算力门槛是1万枚A100芯片。 现在,全球GPU商场首要由英伟达、英特尔和AMD三家巨子独占,上一年Q4独立GPU比例别离为85%、6%、9%。其间,人工智能、云端核算和独立GPU首要为英伟达主导,A100和H100最高浮点算力别离完成19.5 TFLOPS 和67 TFLOPS。 相较于此,我国国产GPU尚处萌芽期,与世界厂商间隔更大。但跟着高端GPU的出口限令,针对我国商场推出的特供版A800也已涨10万元的高价,国内GPU商场需求急迫。在此景象下国产化火烧眉毛,国产GPU厂商近几年也不断涌现,现在国内自研GPU的领军企业首要是寒武纪、景嘉微、华为昇腾等。其间,景嘉微是国内首家成功研制国产GPU芯片并完成大规模工程使用的企业。职业界专家称,主打产品JH920的功能与英伟达2016年发布的GTX 1050相仿,在中高端范畴及硬核的算力需求仍存在较长的追逐路途。 关于整个算力商场,业界人士以为,现在烧GPU是最为实际的计划,特别从国内GPU厂商的视点来看,国产GPU高端化单薄,只有使更多低端的GPU去追逐和堆叠,经过优化和协调来协同效果,再去组合模仿优化的途径。 ▌下场包围的存算一体:打破“内存墙”极限难题 全球玩家站上同一起跑线 不过,尽管GPU是现在最老练的AI算力计划,但长期来看,在算力贵重和受限的限制下烧GPU并非长久之策。 在冯·诺伊曼结构核算机中核算和存储别离,存和算之间功能失配常常导致访存带宽低、时延伸、功耗高级问题,运算功率被大打折扣,即面临着“内存墙”的限制问题。浅显来看,方正证券在4月30日研报中解说,尽管CPU/GPU并行加快技能可以进步算力,但随摩尔定律迫临极限,存储带宽限制了核算体系的有用带宽,体系算力增加步履维艰。 对此,方正证券以为,存算一体作为一种新的核算架构,其间心是将存储与核算彻底交融,以新的高效运算架构进行二维和三维矩阵核算,具有更大算力(1000TOPS以上)、更高能效(超越10-100TOPS/W)、降本增效三大优势,能有用战胜冯·诺依曼架构瓶颈,完成核算能效的数量级进步。业界普遍以为,其为“AI算力的下一极”,继CPU、GPU之后的算力架构“第三极”。 在存算一体商场中,海外厂商SST,Syntiant、Mythic因布局较早,走在商业化前列。不过,在新的技能范畴比方依据ReRAM存算一体做大算力芯片,各国还处在同一起跑线,国内外很多企业纷繁打开存算一体技能的研制,包含英特尔、SK海力士、IBM、美光、三星、台积电、阿里等巨子,以及九霄睿芯、恒烁股份、亿铸科技、千芯科技、苹芯科技、知存科技、智芯科等很多新式AI和存储企业。 ▌AI算力“神药”量子核算:谷歌、阿里等科技巨子扎堆进入 国内企业或借此赛道弯道超车 值得注意的是,在当时GPU、下一步存算一体的背面,还有着一位AI算力“神药”——量子核算。 据悉,量子核算机是依据量子力学原理构建的核算机,功能间隔呈指数级增加。中金公司研报表明,相较经典核算机,量子核算机算力产生爆发式增加,构成“量子优越性”。业界剖析以为,量子核算有望彻底处理经典核算的算力缺乏问题。而且,未来量子核算机必定可以助力人工智能,跟着AI所需的算力越来越多,2030年算力以及耗电量都或许呈现超高数据级增加,因而关于真实处理AI大规模的算力需求,量子核算机是一个很有潜力的使用方向。 依据中金公司研报显现,谷歌、IBM、微软、亚马逊等全球科技巨子纷繁推出量子云服务渠道。国内阿里、腾讯、百度、华为近年来也先后布局量子核算,比方百度成立了量子核算研讨所;华为推出了“昆仑”量子核算模仿一体机,在摩尔定律渐趋失效下,量子核算为我国供给弯道超车时机。 此外,有商场剖析指出,我国量子核算也在打开融资竞赛赛。近一年来,国内包含量旋科技、图灵量子、华翊量子、未磁科技、根源量子在内的9家量子核算企业取得融资。 不过,安信证券说到,当时量子核算机的开展还面临着如退相干等问题,导致当时量子核算仍首要存在于实验室阶段,间隔商业化较远。对此,有业界人士坦言,量子核算职业现在还未产生一些根本性的改变发展,中短期与其寄希望于其他计划来处理大模型所遇到的算力问题,不如盼望GPU这些经典核算的硬件价格能下来。免责声明:本网站内文章信息来源于网络转载或用户自发供给,网站内一切材料、言辞等仅代表作者个人观点,与本网站态度无关,不确保该信息(包含但不限于文字、数据及图表)悉数或许部分内容的准确性、真实性、完整性、有用性、及时性、原创性等,若有侵权,请第一时间奉告删去。