最新四色米奇影视777在线看_暴躁少女csgo视频一_中文字幕乱码中文乱码_有什么好看的小说推荐_亚洲一卡2卡三卡4卡高清_国产成人精品无码免费看_成人免费120分钟啪啪_两性午夜刺激爽爽视频_国产成人av在线免播放app

首頁 > 資訊 > 數(shù)字化

算力重器DPU,火得猝不及防

2024/04/28 09:00      微信公眾號:半導體產業(yè)縱橫 豐寧


  自計算機問世以來,一直采用的馮·諾依曼架構,該架構以計算和存儲為核心。其中CPU作為處理器單元,負責執(zhí)行各種算術和邏輯計算。RAM和硬盤則負責存儲數(shù)據,與CPU進行交互。

  再后來圖形、3D設計等多媒體軟件的高速發(fā)展,要處理的工作量越來越大,也越來越復雜。為了幫CPU分擔壓力,專門進行圖像和圖形處理工作的GPU應運而生。

  如今,隨著數(shù)字經濟的蓬勃發(fā)展,特別是生成式人工智能、大數(shù)據分析、自動駕駛、元宇宙等應用的迅速普及與實施,全球各行各業(yè)對大規(guī)模算力的渴求呈現(xiàn)出急劇增長的態(tài)勢。這時候,DPU(數(shù)據處理單元)憑借其*的性能和獨特優(yōu)勢,逐步嶄露頭角,成為推動算力提升的關鍵技術之一。

  英偉達首席執(zhí)行官黃仁勛曾在演講中表示:“ DPU 將成為未來計算的三大支柱之一,未來的數(shù)據中心標配是‘ CPU + DPU + GPU ’。CPU 用于通用計算, GPU 用于加速計算, DPU 則進行數(shù)據處理。”

  那么DPU的主要作用為何?相比CPU、GPU有哪些優(yōu)勢?

  DPU與CPU、GPU的主要區(qū)別

  DPU的出現(xiàn)并非偶然,而是對日益增長的數(shù)據處理需求的有力回應。

  從功能上看,CPU、GPU和DPU雖都屬于計算處理器,但各自長于不同功能。CPU負責計算機系統(tǒng)的整體運行,是計算機的"大腦”,適用于各種廣泛的應用,但在處理大規(guī)模數(shù)據和特定計算任務時性能相對有限。

  GPU是用于圖形計算任務的專用處理器,例如3D圖像渲染或視頻處理等。對于大規(guī)模并行計算任務(如深度學習訓練)有一定優(yōu)勢,但在一些特定任務上可能并不是*選擇。

  而DPU專門設計用于數(shù)據處理任務,具有高度優(yōu)化的硬件結構,適用于特定領域的計算需求。其靈活性和高性能使其成為未來計算的重要組成部分。

  從架構上看,CPU由幾個功能強大的處理核心組成,這些核心針對串行處理進行了優(yōu)化,優(yōu)勢在于按順序逐個執(zhí)行任務。GPU包含大量更簡單的核心,針對并行處理進行了優(yōu)化,優(yōu)勢在于同時處理大量任務。DPU則由處理核心、硬件加速器元件和高性能網絡接口組合而成,便于其處理以數(shù)據為中心的大規(guī)模任務。

  再看應用領域,CPU幾乎存在于一切計算設備當中,包括智能手機、計算機、服務器等。GPU常被用于游戲PC設備。

  DPU則主要用于數(shù)據中心。FPGA是DPU的核心技術之一,它具有在硬件級別上重新配置的能力,使其適用于多種計算任務。DPU利用FPGA的靈活性,通過重新配置硬件來實現(xiàn)高效的數(shù)據處理。異構計算是DPU的另一個關鍵技術,它通過同時利用不同類型的處理單元來執(zhí)行任務,以提高整體性能。異構計算中的處理單元可以包括CPU、GPU、FPGA等,它們共同協(xié)作完成計算任務。在兩大技術的加持下,DPU能夠充分發(fā)揮其性能優(yōu)勢,為數(shù)據中心提供強大的計算能力支持。

  事實上,DPU已經不是*個為彌補CPU能力不足而備受關注的產品,多年前GPU的大熱也是為了彌補CPU在圖形處理能力方面的短板。換句話說,從CPU、GPU再到今天的DPU,技術變革背后體現(xiàn)的其實是時代的變化、用戶需求的變化。

  DPU的應用正在走向多場景化

  DPU 分擔的工作可以歸納為四個關鍵詞,分別是虛擬化、網絡、存儲以及安全。

  DPU通過將控制平面下放,從而實現(xiàn)主機業(yè)務與控制平面的完全隔離,從而提升了虛擬環(huán)境的安全性。DPU的高效數(shù)據處理能力加速了虛擬機間的通信,提高了虛擬化性能。

  此外,存儲行業(yè)的革新算法和實現(xiàn),也可以在 DPU 架構中,獨立于服務器操作系統(tǒng)進行部署。 DPU 技術幫助存儲廠商實現(xiàn)真正的 “算存分離”。

  在網絡與安全方面,隨著數(shù)據泄露和隱私泄露的事件頻發(fā),數(shù)據安全和隱私保護已經成為一個備受關注的問題。DPU可以利用可編程硬件卸載和加速內聯(lián)安全服務,提供強大的零信任保護,有效隔離主機業(yè)務和控制平面,確保數(shù)據安全性。

  具體到各個場景的應用中,上文提到的數(shù)據中心只是DPU主要的應用領域之一。

  除了數(shù)據中心,DPU同樣能夠“駕馭”眾多應用。在HPC和AI場景,DPU可提供超高帶寬、無損網絡和高速存儲訪問能力,可為HPC和AI提供業(yè)務所需的超高性能網絡。網絡、存儲與安全是DPU的主要應用。

  在風起云涌的邊緣計算領域,DPU的引入大有裨益。隨著業(yè)務增多,邊緣算力和帶寬需求大幅增加,但邊緣設施的規(guī)模和能力受限,CPU主要滿足核心業(yè)務的算力需求,對本不擅長的網絡、存儲、安全等相關處理無暇顧及。引入DPU可大大降低此類DPU對CPU的消耗,同時使用專用硬件提升處理性能,從而大幅提升邊緣計算的處理能力。

  在智算場景下DPU也擁有廣闊的市場空間,DPU通過高性能網絡及領域功能硬件卸載,為智算中心提供了大帶寬、高吞吐、低時延的基礎設施能力,從而消除了數(shù)據IO瓶頸,釋放了算力。這使得DPU成為智算中心基礎設施的必選項,大幅提升了計算集群的算效比。

  多元化的應用場景為DPU帶來了豐富的商業(yè)機遇,未來DPU有望進一步拓展至自動駕駛、人工智能和元宇宙等領域。

  DPU戰(zhàn)場百家爭鳴

  隨著 DPU 技術方案更加成熟、數(shù)據中心在全球范圍內加速落地,英偉達、英特爾等廠商數(shù)據處理類芯片DPU/IPU大規(guī)模量產,全球 DPU 市場將在未來幾年迎來爆發(fā)式增長。

  DPU 行業(yè)市場集中度較高。根據頭豹研究院數(shù)據,近年來國內 DPU 市場中,國際三大巨頭英偉達、博通、英特爾的份額分別達到 55%、36%、9%。Xilinx、Marvell、Pensando、Fungible、Amazon、Microsoft 等多家廠商在近 2-5 年內也均有 DPU 或相似架構產品生產,較國內相對較早。

  英偉達的數(shù)據中心“野心”

  在上表列出的諸多公司中,英偉達具有先發(fā)優(yōu)勢。2019年3月,英偉達花費69億美元收購了以色列芯片公司 Mellanox 。英偉達將 Mellanox 的 ConnectX 系列高速網卡技術與自己的已有技術相結合,于2020年正式推出了兩款 DPU 產品BlueField-2 DPU 和 BlueField-2X DPU,正式拉開 DPU 發(fā)展的序幕。

  如今,英偉達的BlueField 系列芯片已到達第三代,英偉達 BlueField-3 DPU 是一款支持 400Gb/s 速度的基礎設施計算平臺,能夠線速處理軟件定義網絡、存儲和網絡安全任務。BlueField-3 將強大的計算能力、高速網絡和廣泛的可編程性集于一身,可為要求苛刻的工作負載提供軟件定義的硬件加速解決方案。從加速 AI 到混合云和高性能計算,再到 5G 無線網絡,BlueField-3 重新定義了各種可能性。

  英偉達的DPU主要作用是數(shù)據安全、網絡安全與存儲卸載等。在英偉達對DPU的布局中也足以看到,它在數(shù)據中心這一應用領域的野心,也有人稱,英偉達正“試圖利用DPU再一次復制此前GPU替代顯示加速卡成為通用顯示芯片的路徑”

  英特爾推出IPU迎戰(zhàn)數(shù)據中心

  英特爾在2021年6月新發(fā)布的IPU產品(可以被視為Intel版本的DPU),將FPGA與Xeon D系列處理器集成,成為了DPU賽道有力的競爭者。IPU是具有強化的加速器和以太網連接的高級網絡設備,它使用緊密耦合、專用的可編程內核加速和管理基礎架構功能。2022 年的 Vision 全球用戶大會期間,英特爾又公布了 IPU 發(fā)展藍圖,呈現(xiàn)近三年及未來即將問世的產品與平臺。

  在發(fā)展藍圖中,英特爾揭露 3 款 IPU 產品,分別對應 ASIC、IPU 平臺、SmartNIC,此外英特爾還揭露了兩條發(fā)展路線,一個是基于專屬 ASIC 芯片的 IPU,代號為 Mount Evans;另一個則是基于 FPGA 架構的兩種加速解決方案,代號為 Oak Springs Canyon 的 IPU 平臺。

  針對兩種 IPU 應用特性的差異,英特爾也在此做出最新的詮釋。若是基于 FPGA 架構而成的 IPU,能更快供應市場需求,支持持續(xù)演化的網絡標準,透過能重復進行的可編程化特性,以及安全的資料傳輸路徑,能夠彈性處理多種特定工作負載;如果是基于 ASIC 架構而成的 IPU,可提供*效能與功耗的搭配,能用于確保網絡與存儲等任務領域的安全性。

  發(fā)展藍圖顯示,英特爾的第二代IPU已于2022年推出,包括Mount Evans(英特爾*ASIC IPU)和Oak Springs Canyon(英特爾第二代FPGA IPU),目前正在向谷歌及其它服務提供商出貨。第三代IPU代號為Mount Morgan和Hot Springs Canyon的400 GB IPU預計2023/2024年開始向客戶及合作伙伴出貨。下一代800GB IPU預計2025/2026年開始向客戶及合作伙伴出貨。

  此外,賽靈思已經推出DPU處理器——Alveo SmartNIC產品組合。DPU可以用作獨立的嵌入式處理器,但通常是被集成到SmartNIC里。博通旗下有Stingray,Marvell則擁有OCTEON和ARMADA產品系列。

  相比于CPU和GPU賽道,DPU毫無疑問是一個嶄新的競技場。隨著網絡流量指數(shù)上漲,DPU市場前景廣闊。在國際巨頭加緊布局DPU業(yè)務的同時,國內芯片市場也頻傳好消息。

  國內廠商各展所長

  近年來,國家不斷推動數(shù)字經濟的快速發(fā)展。算力基礎設施是數(shù)字經濟發(fā)展的重要基礎,而算力和高性能網絡已成為算力基礎設施的核心能力,尤其是在人工智能和邊緣計算等需求的推動下,高性能網絡和DPU已愈發(fā)重要。

  工業(yè)和信息化部、中央網信辦、教育部、國家衛(wèi)生健康委、中國人民銀行、國務院國資委等六部門近日聯(lián)合印發(fā)《算力基礎設施高質量發(fā)展行動計劃》。該計劃具體規(guī)定了到2025年,算力基礎設施發(fā)展的主要目標、重點任務和保障措施等,并重點提出針對智能計算、超級計算和邊緣計算等場景,開展DPU等技術升級與試點應用,實現(xiàn)算力中心網絡高性能傳輸。這是國家層面的文件首次對未來3年的DPU發(fā)展指明了方向。

  隨著 DPU 產業(yè)的快速發(fā)展,國內也涌現(xiàn)出了一大批 DPU 公司。

  中科馭數(shù)

  中科馭數(shù)基于自研敏捷異構 KPU 芯片架構以及 DPU 軟件開發(fā)平臺 HADOS,公司自主研發(fā)了業(yè)界首顆融合高性能網絡與數(shù)據庫一體化加速功能的 DPU芯片和標準加速卡系列產品,可廣泛應用于超低延遲網絡、大數(shù)據處理、5G 邊緣計算、高速存儲等場景,助力算力成為數(shù)字時代的新生產力。

  在 DPU 產品的研發(fā)迭代方面,中科馭數(shù)于 2019 年流片了*代 DPU 芯片K1,第二代 DPU 芯片 K2 也于 2022 年初成功投片,目前已開始第三代 DPU 芯片 K2 Pro 的研發(fā)工作。針對數(shù)據中心關鍵性能瓶頸與業(yè)務需求,中科馭數(shù)也基于自研DPU芯片推出了RDMA加速卡、云原生網絡加速卡等系列產品,支持超大規(guī)模組網算力互連,以支撐算力底座建設所必須的100G+超高帶寬和低時延,使更多的CPU/GPU算力真正服務于業(yè)務,為智算中心建設提供全套的性能更高和算力更好的解決方案。

  國產化建設浪潮之下,中科馭數(shù)也正全面擁抱國產化生態(tài),積極與國內產業(yè)鏈上下游廠商開展產品兼容性認證。目前,中科馭數(shù)已與國內6大CPU芯片、12家主流操作系統(tǒng)、9家主流數(shù)據庫廠商、8家頭部云/云原生廠商、17家TOP級服務器廠商完成兼容性適配。

  芯啟源

  芯啟源具有完全自主知識產權的 DPU 芯片。芯啟源 DPU 較傳統(tǒng)智能網卡提供了更大的處理能力、更強的靈活性、可編程數(shù)據包處理、可擴展 Chiplet結構等特性。采用 NP-SoC 模式進行芯片設計,通用 ARM 架構結合高度優(yōu)化面向數(shù)據包的 NP 芯片(RISC-V 內核)、多線程的處理模式,使其可以達到 ASIC 固化芯片的數(shù)據處理能力,同時考慮到了全量可編程、靈活可擴展的屬性,用以支持400Gbps 及以上的性能目標、低功率且具有成本效益等。

  芯啟源從2019年開始研發(fā)*代FPGA智能網卡,2020年開始推出第二代基于NP-SoC架構的產品,逐步推向市場。如今,芯啟源推出了基于SoC-NP架構的DPU芯片智能網卡,具有可編程性、可擴展性和高性能三個重要特點,已成熟量產出貨,商業(yè)落地,能夠適應于廣泛的應用場景,成為了真正意義上國內最早一批進入DPU領域的芯片公司。

  據悉,芯啟源正在研發(fā)的新一代NFP-7000 DPU芯片,將對標Nvdia的BlueField-3,并用“通用型芯片+定制化軟件”的模式推動行業(yè)的網卡國產化。從設計目標來看,該款芯片的性能與功能,完全不亞于英偉達的BlueField-3,同時,該芯片未來會根據不同場景需求來設定其能力范圍,這樣將大大降低芯片的成本,更符合國內芯片的多場景需求。

  云豹智能

  目前云豹智能領跑國內數(shù)據中心場景的國產DPU芯片方案。云豹智能 DPU SoC 是國內*顆通用可編程 DPU 芯片,具備豐富的可編程性和完備的 DPU 功能,支持不同云計算場景和資源統(tǒng)一管理,優(yōu)化數(shù)據中心計算資源利用率。

  云豹DPU通過對各種高速網絡、彈性存儲、安全服務及可靠運維和管控進行卸載、加速及隔離,為云端、數(shù)據中心、人工智能及邊緣計算等提供新一代計算平臺。

  目前云豹智能已與頭部云計算大廠、電信運營商和央企等開展深度合作,共同推進DPU產業(yè)落地。

  大禹智芯

  大禹智芯也擁有DPU設計與研發(fā)及DPU大型商業(yè)化部署的成功經驗。大禹智芯Paratus系列DPU產品采用三條產品線并行的方式逐步面向廣泛商用市場推出易用并好用的DPU產品:

  Paratus 1.0作為大禹智芯DPU的*條產品線產品,采用ARM SoC作為主處理單元,提供多個10Gbps/25Gbps的業(yè)務網絡接口,同時為了方便用戶管理,單獨設置了RJ45管理口。

  Paratus 2.0作為大禹智芯DPU的第二條產品線產品,采用ARM SoC + FPGA的硬件架構,在Paratus 1.0產品基礎上,利用FPGA對可固化邏輯的數(shù)據包實現(xiàn)高性能轉發(fā),提供多個10G/25G、100G的業(yè)務網絡接口。

  Paratus 3.0作為第三條產品線產品,將采用大禹智芯自研DPU芯片。該芯片將結合公司對DPU相關技術及未來應用場景的理解,和前兩條產品線(Paratus 1.0和Paratus 2.0)在實際場景部署中獲得的寶貴客戶反饋意見和經驗積累,形成高度集成化的DPU產品。

  阿里云 CIPU

  2022 年阿里云峰會上,阿里云正式發(fā)布了云基礎設施處理器 CIPU,CIPU 的前身是MoC 卡 (Micro Server on a Card),MoC 卡是神龍架構的靈魂所在。MoC 卡擁有獨立的I/O、存儲和處理單元,承擔了網絡、存儲和設備虛擬化的工作。

  *代和第二代 MoC 卡解決了狹義上的計算虛擬化零開銷的問題,網絡和存儲部分的虛擬化仍由軟件實現(xiàn)。第三代MoC 卡實現(xiàn)了部分網絡轉發(fā)功能硬化,網絡性能大幅提升。第四代 MoC 卡實現(xiàn)了網絡、存儲全硬件卸載,還支持了 RDMA 能力。

  除了上文列舉的幾家公司外,星云智聯(lián)、銳文科技等多家優(yōu)秀的國產廠商,均憑借技術創(chuàng)新與產品定義方面的優(yōu)勢,沿著差異化路線搶灘市場。不過,值得注意的是,目前國內DPU仍處于發(fā)展早期階段。對于國內DPU企業(yè)來說,眼下最重要的事還是要先把實際產品做出來,并在應用場景中進行檢驗,畢竟DPU作為一個新興的技術領域,其產品的開發(fā)難度較高,且市場對其性能、穩(wěn)定性和安全性等方面都有極高的要求。

  DPU進入爆發(fā)期

  根據賽迪顧問數(shù)據顯示,從2023年開始全球DPU市場規(guī)模將突破百億美元,并進入年增長率超50%的快車道。而中國DPU市場規(guī)模在2023年也將超300億元人民幣,呈現(xiàn)跳躍式增長,2025年國內市場規(guī)模將達到565.9億元,五年復合增速達170.60%。

  目前,包括亞馬遜、阿里云、華為在內的云計算龍頭都在發(fā)展符合自身要求的DPU產品線。

  除數(shù)據中心以外,智能駕駛、數(shù)據通信、網絡安全等也是DPU的下游應用領域。

  此外,DPU與DOCA對于大模型和生成式AI而言,意義重大。根據Gartner,預計在 2026 年,超過80%的企業(yè)將使用生成式AI應用程序編程接口(API)或模型,或者在相關生產環(huán)境中部署支持生成式AI的應用程序。據統(tǒng)計,這一比例在2023年還不到5%,這意味著在短短三年內,采用或創(chuàng)建生成式AI模型的企業(yè)數(shù)量預計將會增長16倍。

  也就是說,未來3年是生成式AI爆發(fā)的窗口期,也是普及BlueField DPU和DOCA的機遇期。

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復制
標題鏈接已成功復制

最新新聞

熱門新聞