最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

首頁 > 資訊 > 評論

英偉達沒有“魔法” 但如何打敗它

2023/12/22 10:38      雷鋒網 包永剛


  “根本不可能超越英偉達。”資深芯片投資人思杰斬釘截鐵地說,“就算AMD有比英偉達參數(shù)更強的芯片,也無法撼動英偉達在AI市場的地位。”

  這幾乎是AI芯片從業(yè)者的共識,無論是芯片巨頭,還是有技術大牛的美英初創(chuàng)公司,想要坐上英偉達統(tǒng)治的加速計算的牌桌,和英偉達正面對抗的機會不大。

  但如果商業(yè)競爭受到非商業(yè)力量的影響,就可能出現(xiàn)例外。

  10月17號,美國商務部工業(yè)和安全局(BIS)更新的針對中國的AI芯片出口管制規(guī)定,給了國產高性能AI芯片公司一個趕超英偉達的機會。

  “美國最新的出口管制規(guī)定發(fā)布后,許多客戶來主動聯(lián)系我,其中就有之前態(tài)度冷淡的客戶。”AI芯片公司的銷售安瑞明顯感覺到,“買不到英偉達GPU的時候,客戶考慮的不是誰更好用,而是誰能用。”

  進一步收緊的禁令,給國內高性能AI芯片公司當頭一棒,也限制了英偉達在中國市場的發(fā)展。

  “我們必須放棄一切幻想,做國產替代。”這是美國最新的禁令之后在AI芯片圈常聽到的一句話。

  在芯片領域做國產替代,是一條無比艱難的路,但必須走上這條路的時候,國內AI芯片的從業(yè)者們都在琢磨一條趕超英偉達的路徑。你心中的路徑是什么?歡迎添加作者微信BENSONEIT探討。

  有人認為走一條完全不同的路才有超越的機會。

  有人認為用英偉達的魔法也能打敗英偉達。

  還有人想到了商業(yè)模式創(chuàng)新的超越機會。

  雖各持己見,但他們都非常清楚,要想要活下來,必須卷成本、卷軟件,解決生產問題。

  放棄一切幻想,國產芯片是唯一解

  10月17日美國新的出口管制規(guī)定一發(fā)布,讓本就搶手的英偉達H800 GPU坐上了過山車。

  一卡難求的8卡H800 GPU服務器在禁令更新前價格已經高達210萬元左右,美國禁令發(fā)布當天,價格馬上躍升到了230-250萬元。

  一周之后,美國突然宣布本來在11月才生效的管制規(guī)定立即生效,瞬間將H800GPU服務器的價格推向頂峰,跳漲到350萬元,相比禁令升級前的210萬元,漲幅高達67%。

  如今價格雖然稍微有所下降,但依舊在310-330萬元的高位。

  “10月底和11月,客戶基本都在忙著搶貨。搶不到貨之后,大家都來認真談國產芯片。”熟悉芯片市場的語晨同時看到,“美國的禁令就是一套組合拳,誰也無法忍受美國的朝令夕改,AI芯片公司不得不認真考慮下一代產品的方向,也要考慮國內代工的可能性。”

  雷峰網了解到,10月17日的禁令升級之后,多家AI芯片公司都不得不改芯片設計,以符合美國新規(guī)的要求。

  這次禁令進一步收緊,影響的范圍比以往更大。

  “2019年美國芯片禁令引發(fā)軒然大波的時候我已經在AI芯片行業(yè),那時候還沒有感受到AI芯片對我們來說生死攸關。”芯片軟件工程師浩鑫這一次感受到,“如果我們沒有強大的AI芯片,就可以被別人掐死,這事關民族的命運。”

  在芯片行業(yè)十多年的子蕾同樣感觸頗深,“從美國的限制也可以看出,美國政府已經預判AI代表了真正的生產力,這是兵家必爭之地。”

  “我不知道最后誰能贏,但我知道如果我們輸了會很慘,不僅會失去在科技上的領導力,還可能會被AI替代。”子蕾非常堅定,“不管是為了自己還是為了下一代,我們都必須站起來卷。”

  美國和英國的公司,也和國內AI芯片公司一同被打了當頭一棒。

  英國初創(chuàng)公司Graphcore是少有的在國內有成建制團隊的AI芯片公司,禁令發(fā)布之后,由于其芯片的特點,修改設計將使其產品不具備在中國市場的競爭力,Graphcore的員工的工作幾乎就處于停滯狀態(tài),最后不得不解散中國團隊。

  英偉達同樣被禁令限制,中國市場每年為英偉達的數(shù)據(jù)中心業(yè)務貢獻上百億美元的營收,不能向中國市場銷售利潤可觀的高性能芯片,短期看是英偉達營收的損失,長期看是對中國市場的失控。

  這也是英偉達一直在積極推出符合美國法規(guī)限制芯片的原因。

  “H20性能是H800的1/5左右,但價格不會太便宜,因為占用的是H800的產能,可能價格是H800的1/2或者2/3,這樣的產品對于客戶來說不夠有吸引力,國內公司購買這樣的產品也難以和美國公司競爭。”語晨還說,“預計能在今年底送測的H20,現(xiàn)在也要推遲到明年上半年了,這是國產芯片的機會。”

  最強大的對手也被限制,AI又是不容落后的產業(yè),國內的AI公司已經沒有其它選擇,必須放棄一切幻想,把國產芯片做起來。

  禁令利空所有人,除了華為

  就像中國的AI芯片公司是追趕英偉達的唯一機會是個例外,華為也是這次禁令限制下的例外。

  2019年開始,華為就被美國限制,從那時開始,華為就開始了國產化,比這一次受影響的國內AI芯片公司早4年開始做國產替代,讓其昇騰AI芯片也成為了這一次被爭相購買的對象。

  科大訊飛在2023第三季度業(yè)績說明會上公開表示,華為昇騰910B已經基本做到可對標英偉達A100。

  “這說明華為在某些地方做的確實不錯。”芯片算法工程師奕森直言,“對于使用DSA(領域專用)架構的華為來說,芯片的范化性是一個問題。”

  DSA可以視作為某一類模型專門設計的芯片,“其范化性體現(xiàn)在局部上,如果專為某一類模型設計的DSA芯片在這類模型的范化性還不夠好,那就說明軟件工作還沒做到位。”奕森認為。

  這就涉及到軟件成熟度以及生態(tài)的問題,也就是英偉達的護城河所在。對于華為能否基于其自研架構,構建起像英偉達一樣強大的軟件生態(tài),浩鑫和語晨有不同的看法。

  “在2017年Caffe是主流AI框架的時候,英特爾花了大量的精力去做OpenCL版本的Caffe,目的就是希望讓更多開發(fā)者使用,以搶占AI市場。”浩鑫說,“但因為只有英特爾去維護這套東西,最終還是沒有撼動英偉達的地位。所以即便華為花大量的人力和資源去做算法和應用的適配,也很難構建起強大的生態(tài)。”

  語晨認為昇騰至少能在國內的政企市場成功。

  “考慮到國內的特殊情況,政企市場在必須考慮國產替代的背景下,華為至少可以在這個市場大量投入,讓其昇騰芯片用起來。”語晨也說,“至于在商業(yè)化市場能否成功,現(xiàn)在還不好做出判斷。”

  從芯片的設計、公司所擁有的資源等因素綜合考慮,華為是目前AI訓練市場最有機會的中國公司。

  非常熟悉AI芯片領域的云碩做出了樂觀預測,“未來國內AI訓練市場屬于華為,非中國市場屬于英偉達。”

  但這有個前提,華為要順利解決芯片制造的問題。

  按照思杰的樂觀估計,國內要擴產14nm芯片產線最快也要到2025年之后。國內14nm還不成熟,并且涉及到半導體材料和設備的出口管制,需要時間。

  “良率也非常關鍵,直接影響著最終的成本,這是在商業(yè)市場競爭的基礎。”思杰態(tài)度明確,“不過每年國內半導體材料和設備的公司都能給我一些驚喜,所以雖然短期悲觀,但我長期依舊看好。”

  華為取得的成果,讓那些想要通過創(chuàng)新趕超英偉達的人和公司有了信心。

  英偉達沒有魔法,用架構創(chuàng)新追趕

  “ChatGPT對GPU的利用率只有個位數(shù),對計算是巨大的浪費。”云碩指出,“不合理的存算比不利于生成式AI的普及。”

  幾十年沒變的計算機系統(tǒng)結構迫切需要改變,這也是追趕英偉達的機會。

  “大模型對于算力的需求呈現(xiàn)指數(shù)型增長,但GPU又貴功耗又高,GPU集群的線性度也隨規(guī)模增大而下降,探索非馮諾依曼架構已經非;馃。”奕森早已體會到。

  存算一體就是一種解決AI計算存算比不合理的思路,有一家國內頭部互聯(lián)網公司就在積極引入存算一體解決算力成本的問題。

  “存算的架構就適合大模型計算,因為存算一體的架構計算密度低,存儲密度高。”奕森看到了存算一體架構在大模型時代的優(yōu)勢。

  但這只是理論,“存算的大規(guī)模落地還要解決很多生產制造方面的問題。”奕森也看到了存算面臨的挑戰(zhàn)。

  如果將存算一體視作一種特殊的DSA,和華為的昇騰一樣,同樣面臨著范化性和生態(tài)的挑戰(zhàn)。

  AI訓練一定需要一個范化能力很強的系統(tǒng),但到底要達到什么程度的范化性,有所爭論。浩鑫堅持認為必須是英偉達GPGPU的生態(tài),奕森則認為只要有足夠范化性就可以。

  許多人和奕森的觀點相似,于是就產生了CPU+DSA這種兼顧通用性和高性能,超越英偉達的思路。

  “Pytorch原生就支持x86 CPU,英特爾本來有最好的機會通過CPU+DSA的路徑趕超英偉達,不知道為什么英特爾沒做成。”云碩有些不解。

  子蕾也認為x86 CPU有很好的機會,“一般來說,一個模型調試階段都是用CPU,用CPU上的精度作為在GPU上運行的精度要求,x86 CPU的生態(tài)非常好,結合加速器做加速很有機會,英特爾確實也有推出產品,只是可能之前沒有押注大模型。”

  CPU除了x86,還有Arm和RISC-V,RISC-V CPU是國內公司探索CPU+DSA路徑的最佳選擇。

  由于RISC-V開源的特性,能夠更積極響應市場需求。“看起來是RISC-V的CPU核心,實際上是AI核心,已經有公司使用RISC-V開始了探索。”子蕾觀察到。

  即便CPU+DSA的路徑可以兼顧通用性和高性能,但英偉達最難以超越的還是CUDA生態(tài),這是擺在想要走這條路線公司面前最難解決的問題。

  子蕾對此并不悲觀,“英偉達也沒有什么魔法,CUDA生態(tài)也是英偉達一個個項目的實際經驗,和模型適配積累出來的,硬件每兩年就迭代一代,能復用的經驗有限,軟件的經驗可以不斷積累。如果我們認定國內一定要做出非GPU的生態(tài),長期看,我相信我們能做出來。

  相較之下,浩鑫就有些悲觀,“英偉達的CUDA生態(tài)做了十幾年,而且是在全球客戶的需求之下一點點建立起的生態(tài),就算有中國的客戶需求,有決心和耐心,也很難建立起和英偉達CUDA生態(tài)相當?shù)纳鷳B(tài)。”

  浩鑫也不是完全悲觀,“國內公司也可以聯(lián)合起來做一套相對開放的類CUDA生態(tài)。”雷峰網了解到,有人在嘗試拉攏國內的DSA路線的公司共建生態(tài)。

  殘酷的現(xiàn)實是,有的走DSA路線的公司,在一次次實際落地項目中遷移難度大的困難之下,已經開始想辦法兼容英偉達CUDA生態(tài)。更多細節(jié)可以添加作者微信BENSONEIT互通有無。

  用英偉達的「魔法」,趕超英偉達?

  對于走英偉達CUDA兼容的路線,有一種觀點,沿著英偉達的路永遠不可能超越英偉達,當然這種觀點大都來自走DSA路線的人。

  “如果連追趕都做不到,何談超越?”浩鑫堅持,“我不認為做CUDA兼容就不能超越英偉達。”

  追趕和超越的機會來自英偉達面臨的難題。

  沒有人會否認英偉達已經在AI領域有顯著的優(yōu)勢,并且沒有絲毫松懈的狀態(tài),是一個非常難以挑戰(zhàn)的對手。

  但自英偉達2017年發(fā)布Volta架構GPU,增加了專用加速核心Tensor Core之后,英偉達此后每一代GPU的性能提升主要來自專用計算單元的部分。

  “英偉達算力的增長也在放緩,其解決的辦法不是在通用計算單元上發(fā)力,而是在專用計算單元上。”浩鑫發(fā)現(xiàn),“即便是英偉達,開發(fā)者也很難用起其專用加速單元,英偉達也推出專門的加速庫。”

  順著這個思路,把英偉達的CUDA生態(tài)看作兩大部分,一個是基于通用計算單元CUDA Core的生態(tài),另一個是以Tensor Core為代表的專用加速生態(tài)。

  “我們做CUDA兼容可以只兼容CUDA Core的部分,Tensor Core的生態(tài)可以不做兼容。”浩鑫解釋,“做英偉達CUDA Core生態(tài)兼容,可以降低客戶的遷移難度。專用加速計算單元就是追趕和超越的機會。”對于這個觀點的討論,可以加作者微信BENSONEIT。

  這個思路和用DSA超越的思路有相似之處,都是從專用加速方面切入,設計出比英偉達專用加速單元更好的架構。

  “GPU也是特定時期設計出的產品,一定有它的局限性。”奕森也說。

  語晨也認為做CUDA兼容有超越英偉達的機會,不過他是從推理性價比的角度。

  “AI推理需求可能是訓練需求的3-5倍,通過CUDA兼容,完全可以針對常用的大模型進行推理優(yōu)化,實現(xiàn)相比英偉達幾倍的推理性價比。”語晨說,“在商業(yè)競爭中,同等條件下比的就是性價比,CUDA兼容是很重要的條件。”

  “一旦國內公司用上了國產GPU,就很難再切換回去。”浩鑫的想法是,“兼容CUDA是為了讓用戶更方便遷移,后續(xù)的特性演進完全可以和英偉達不一樣,并且用戶會跟隨硬件供應商。”

  這也解釋了一個疑問,國產AI芯片公司兼容CUDA生態(tài)是不是在幫英偉達建生態(tài)?

  這就像是WPS兼容Word,不兼容Word沒人會用,但WPS兼容Word的初衷并沒有幫Word建生態(tài)的想法,即便會有這樣的效果,但這種貢獻對Word的生態(tài)微不足道。

  “CUDA兼容如果有1%沒做好,就會有沒法補上的漏洞。并且,兼容CUDA永遠會比英偉達慢很多拍,處于被動地位。”奕森說不能忽視CUDA兼容的問題,“國家搞自主可控,CUDA兼容屬于自主可控嗎?”

  看起來,通用+專用的AI計算架構已經成為行業(yè)共識,彼此都在相互滲透和影響,很難判斷哪條路徑更優(yōu)。

  無論哪條路徑,都要共同面對一個問題——英偉達沒有制造問題,也有比所有國內AI芯片公司多的資源,有全球頂尖的人才,在什么樣的情況下有追趕和超越的機會?

  不學英偉達賣整機,尋找商業(yè)模式創(chuàng)新的機會

  理論上優(yōu)秀的技術并不意味著最終會成功,歷史已經無數(shù)次驗證,商業(yè)和競爭影響成敗。

  “我們不應該學英偉達。”云碩解釋,“國內的AI芯片公司幾乎都在學英偉達做整機,這確實有高校和政企客戶的需求,芯片公司也能做高營收。英偉達可以做整機賺更高利潤,但我們不應該這么做。”

  英特爾能夠在IBM統(tǒng)治的大型機時代成功,是因為英特爾只做了最難做的CPU,橫向整合,和微軟、戴爾、Oracle等公司一起搶占了IBM的市場。Arm更極致,只做了核心的芯片的IP,和谷歌安卓、不同芯片公司和OEM一起,成為了手機時代的王者。

  “英偉達的GPU不單賣,必須是一個主板加8張GPU卡一起賣。或者直接賣一個DGX整機,DGX的高毛利意味著整機中的機箱、風扇等也毛利豐厚,幫英偉達提升整體毛利。”云碩認為,“這就是國產AI芯片公司的機會,國產芯片公司如果能夠專注在打磨芯片性能和SDK上,聯(lián)合上下游產業(yè)鏈一起去做產品,從商業(yè)的角度找機會超越英偉達。

  “單賣芯片可能連自己都養(yǎng)不活。而且要做一顆能適配各種系統(tǒng)的芯片,對芯片團隊的要求特別高。”子蕾對于Arm的成功這樣看,“Arm成功并不是因為他們做了IP,關鍵在于智能手機時代在一眾操作系統(tǒng)的激烈競爭之后,最終成功的安卓和iOS,都選擇了Arm芯片,一旦系統(tǒng)和芯片深度適配之后,就很難改變,這幫助了Arm走向成功。”

  “英偉達就是AI領域的Arm+安卓,我不認為這種思路能成功。”語晨這樣認為。

  奕森倒是有更開放的態(tài)度,雖然不見得是英特爾或者Arm帶來顛覆的思路,但商業(yè)模式創(chuàng)新一定是一種超越的思路。

  就像對商業(yè)模式創(chuàng)新是否是超越英偉達路徑的討論一樣,禁令之后,國內的AI芯片從業(yè)者更加意識到自己所從事的行業(yè)和工作的重要價值,對于國內高性能AI芯片公司更加樂觀,這種樂觀也有對生成式AI發(fā)展對算力需求的樂觀。

  這種背景之下,所有人都被限制,琢磨出一條超越英偉達的策略很重要,更現(xiàn)實的問題是要卷軟件、卷成本、解決制造問題。

  當然,對于所有AI芯片公司都需要先活下去,再談追趕和超越。國產高性能AI芯片一直都是討論的焦點,關于這個話題更多的交流請?zhí)砑幼髡呶⑿臖ENSONEIT。

  文中思杰、安瑞、語晨、浩鑫、子蕾、奕森、云碩均為化名

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞