在AI大潮的推動(dòng)下,基礎(chǔ)設(shè)施市場(chǎng)正在復(fù)蘇。戴爾科技近期發(fā)布了截止于2月3日的2024財(cái)年第四季度財(cái)報(bào),第四財(cái)季營(yíng)收為 93 億美元,環(huán)比增長(zhǎng) 10%。戴爾科技業(yè)績(jī)回升主要得益于AI優(yōu)化的服務(wù)器業(yè)務(wù)的增長(zhǎng),本季度AI服務(wù)器訂單增長(zhǎng)了40%,積壓訂單近乎翻倍達(dá)到29億美元,而前一季度僅為16億美元。
戴爾科技的AI服務(wù)器業(yè)務(wù)增長(zhǎng)是整個(gè)基礎(chǔ)設(shè)施市場(chǎng)變化的一個(gè)縮影。去年以來(lái)企業(yè)對(duì)人工智能應(yīng)用的熱情不斷高漲,ChatGPT、Sora的先后爆火更是為人工智能熱火上加油,帶動(dòng)了對(duì)AI基礎(chǔ)設(shè)施的強(qiáng)勁需求。為了滿足這些需求,戴爾科技推出了不少創(chuàng)新的產(chǎn)品和技術(shù)來(lái)幫助企業(yè)擁抱AI。
AI應(yīng)用普及
推動(dòng)基礎(chǔ)設(shè)施升級(jí)
在過(guò)去的幾年里,AI應(yīng)用場(chǎng)景越來(lái)越豐富,智能化水平不斷提升。一個(gè)明顯的變化是,從過(guò)去集中在以圖像識(shí)別、視頻分析為主的感知智能逐漸擴(kuò)展到以ChatGPT為代表的認(rèn)知智能,文檔檢索、文檔生成成為了新的主流應(yīng)用場(chǎng)景,同時(shí),以Sora為代表的多模態(tài)AI技術(shù)也開(kāi)始方興未艾。
蓬勃發(fā)展的AI應(yīng)用背后離不開(kāi)底層基礎(chǔ)設(shè)施的支持。以大模型的訓(xùn)練和推理為例,大模型的參數(shù)量已經(jīng)從數(shù)十億增加到幾百億、幾萬(wàn)億甚至更高,更大的模型帶來(lái)了更大的AI算力需求。有數(shù)據(jù)顯示,AI所消耗的算力平均每3至4個(gè)月就會(huì)增長(zhǎng)一倍,而這部分增長(zhǎng)的算力需求大部分將由GPU承擔(dān),直接帶動(dòng)了異構(gòu)計(jì)算的普及。
另一方面,計(jì)算規(guī)模越來(lái)越大,越來(lái)越多地通過(guò)集群來(lái)承載,萬(wàn)卡、十萬(wàn)卡GPU規(guī)模的數(shù)據(jù)中心也不鮮見(jiàn)。與計(jì)算規(guī)模擴(kuò)大同時(shí)增加的還有網(wǎng)絡(luò)通訊需求,讓高帶寬、低延遲網(wǎng)絡(luò)交換設(shè)施成為AI系統(tǒng)的必要組成部分。
與此同時(shí),新興的AI應(yīng)用對(duì)存儲(chǔ)系統(tǒng)的要求也被提高了。功能更強(qiáng)、規(guī)模更大的算法模型需要搭配數(shù)量更多、質(zhì)量更高、更加多元化的訓(xùn)練數(shù)據(jù)才可能達(dá)到預(yù)期效果,否則很容易因訓(xùn)練數(shù)據(jù)不足造成模型欠擬合,而這意味著存儲(chǔ)系統(tǒng)性能更高、更穩(wěn)定,同時(shí)成本更低。
市場(chǎng)的需求基礎(chǔ)設(shè)施廠商都看到了,以戴爾科技為代表的很多基礎(chǔ)設(shè)施廠商也推出了大量創(chuàng)新的產(chǎn)品和技術(shù)。
多元化AI計(jì)算平臺(tái)
加速智能躍遷
眾所周知,傳統(tǒng)數(shù)據(jù)中心的典型架構(gòu)是以CPU為中心,而今天在大模型訓(xùn)練和推理需求的推動(dòng)下,CPU+GPU為代表的異構(gòu)計(jì)算正在成為主流,GPU成為越來(lái)越多服務(wù)器的標(biāo)準(zhǔn)配置。
順應(yīng)市場(chǎng)的需求,戴爾科技推出了多款PowerEdge服務(wù)器,它們專門(mén)針對(duì)GPU計(jì)算設(shè)計(jì)和優(yōu)化,能支持英特爾等不同品牌的GPU加速卡,可滿足不同應(yīng)用場(chǎng)景的需求。
“圍繞AI 應(yīng)用的GPU加速,戴爾科技能提供像GPU池化、GPU分布式訓(xùn)練、GPU集群管理和資源調(diào)度、邊緣AI計(jì)算等GPU加速計(jì)算解決方案。”戴爾科技集團(tuán)信息基礎(chǔ)架構(gòu)解決方案事業(yè)部企業(yè)技術(shù)架構(gòu)師、全球CTO大使吳躍表示。
他表示,PowerEdge 服務(wù)器設(shè)計(jì)中有很多針對(duì)GPU的專門(mén)設(shè)計(jì)。比如,多矢量散熱技術(shù)的應(yīng)用可以保證均勻冷卻服務(wù)器各部件;電源增強(qiáng)設(shè)計(jì)(即瞬時(shí)功率)可以達(dá)到電源標(biāo)稱功率的1.4到1.7倍,以應(yīng)對(duì)GPU開(kāi)機(jī)過(guò)程中的啟動(dòng)風(fēng)暴。這些設(shè)計(jì)都是為了確保GPU在服務(wù)器內(nèi)達(dá)到運(yùn)行狀態(tài)。
在AI的公開(kāi)基準(zhǔn)測(cè)試中戴爾PowerEdge表現(xiàn)優(yōu)異。MLPerf是當(dāng)前AI領(lǐng)域關(guān)注度和參與度的計(jì)算性能基準(zhǔn)測(cè)試,在去年9月份發(fā)布的MLPerf Inference V3.1的推理基準(zhǔn)測(cè)試中,共有26個(gè)廠商提交了超過(guò)13500條的測(cè)試記錄。在20個(gè)數(shù)據(jù)中心項(xiàng)目賽道中戴爾科技取得了7個(gè)項(xiàng)目的第一名,另外4個(gè)項(xiàng)目的第二名。在所有參與評(píng)測(cè)的GPU服務(wù)器產(chǎn)品中取得的綜合成績(jī)。
除了多款GPU服務(wù)器外,戴爾推出的搭載英特爾Xeon Max處理器的PowerEdge服務(wù)器也值得一提。目前戴爾科技有三款服務(wù)器可以支持Xeon Max處理器,包括2U 兩路的計(jì)算平臺(tái)PowerEdge R760、1U 兩路的計(jì)算平臺(tái)PowerEdge R660以及2U 4節(jié)點(diǎn)PowerEdge C6620。
Xeon Max處理器是英特爾推出的業(yè)內(nèi)集成HBM的x86 CPU,其中集成了64GB的HBM,內(nèi)存帶寬可達(dá)到1TB/s,無(wú)需GPU加速卡就可實(shí)現(xiàn)內(nèi)存帶寬密集型應(yīng)用的加速,如模型推理與模型微調(diào)等。
相關(guān)測(cè)試表明,單個(gè)Xeon Max處理器即可完成60億、130億規(guī)模的大語(yǔ)言模型的加載和應(yīng)用;對(duì)于對(duì)話式AI的場(chǎng)景,會(huì)話token生成延遲小于3秒鐘,下一個(gè)token生成延遲小于100毫秒。而且,由于所有主流AI框架與加速庫(kù)都支持x86計(jì)算,在CPU上運(yùn)行AI模型可以減少代碼改動(dòng)量,大大簡(jiǎn)化了AI應(yīng)用的開(kāi)發(fā)和部署。
吳躍表示,為了持續(xù)引領(lǐng)AI基礎(chǔ)設(shè)施技術(shù)創(chuàng)新,加速AI應(yīng)用的落地,戴爾科技還成立了AI HPC創(chuàng)新實(shí)驗(yàn)室,專門(mén)從事AI計(jì)算、并行計(jì)算的前沿技術(shù)研究、效能的基準(zhǔn)測(cè)試等相關(guān)工作。超級(jí)計(jì)算機(jī)Ratter就是戴爾AI&HPC創(chuàng)新實(shí)驗(yàn)室打造的GPU超算集群。戴爾很多AI以及使用GPU加速的HPC解決方案(如CAE、分子動(dòng)力學(xué)、生命科學(xué)等)也是在Ratter集群上首先進(jìn)行測(cè)試和優(yōu)化的。
從邊到端
讓AI算力無(wú)處不在
實(shí)際上,基礎(chǔ)設(shè)施相關(guān)的技術(shù)創(chuàng)新不只是發(fā)生在計(jì)算領(lǐng)域,也發(fā)生在存儲(chǔ)和網(wǎng)絡(luò)領(lǐng)域,同時(shí),也不只是在云端和數(shù)據(jù)中心,還發(fā)生在端側(cè),并正在醞釀一場(chǎng)從云到端、全面的升級(jí)。
比如,為了減少數(shù)據(jù)傳輸?shù)难舆t,戴爾PowerScale今年新增了Multipath Client driver(多通道客戶端驅(qū)動(dòng)程序),借此單個(gè)客戶端就可以能實(shí)現(xiàn)40GB/s的峰值帶寬,可為高密度的GPU算力服務(wù)器提供充沛的后端存儲(chǔ)性能。
OneFS是戴爾科技自研的文件系統(tǒng),全閃PowerScale搭配OneFS 9.7文件系統(tǒng),存儲(chǔ)的流式讀性能是上一代平臺(tái)的兩倍,流式的寫(xiě)性能是上一代平臺(tái)的2.2倍,可以有效提高GPU在模型預(yù)訓(xùn)練和微調(diào)階段的工作效率。
當(dāng)然,在端側(cè)的創(chuàng)新同樣不少。從去年9月份英特爾推出AI PC概念以來(lái),AI PC迅速被市場(chǎng)接受。IDC的預(yù)測(cè),今年新增PC中一半以上將是AI PC;2027 年將進(jìn)一步提升至 84.6%。戴爾科技也全面擁抱AI PC,今年新發(fā)布的AI工作站Precision 7960單臺(tái)將支持4塊雙寬的GPU,配置4TB的內(nèi)存和152TB的本地存儲(chǔ),為AI落地工作站提供強(qiáng)力支持。
談到AI在邊緣端的落地,英特爾不可不提。除了發(fā)力AI PC之外,英特爾還在其他方面持續(xù)優(yōu)化CPU面向AI應(yīng)用的性能,也為戴爾科技豐富自己的產(chǎn)品線提供更多選擇。比如,英特爾從第四代至強(qiáng)可擴(kuò)展處理器開(kāi)始新增AMX加速器,無(wú)需GPU就可顯著提升AI推理和訓(xùn)練的性能。根據(jù)英特爾的資料,AMX對(duì)于INT8精度有8倍的性能提升,對(duì)BF16精度有16倍的性能提升。而且由于AMX內(nèi)置于CPU中,因而無(wú)需專門(mén)構(gòu)建解決方案。
另一方面,英特爾也聯(lián)手合作伙伴推出面向邊緣的AI解決方案參考設(shè)計(jì)。英特爾Edge AI Box 就是其中之一,AI-BOX在搭載英特爾酷睿處理器的單一計(jì)算盒內(nèi)集成了視頻解碼和分析功能,既可作為連接到 IP 攝像頭或網(wǎng)絡(luò)錄像機(jī) (NVR) 等視頻源的獨(dú)立設(shè)備,實(shí)時(shí)進(jìn)行邊緣視頻分析,也可以連接到網(wǎng)絡(luò)并充當(dāng)網(wǎng)絡(luò)上的獨(dú)立 AI 服務(wù),按需運(yùn)行離線深度學(xué)習(xí)分析,部署非常方便。
英特爾中國(guó)解決方案部AI架構(gòu)師俞巍表示:“圍繞邊緣AI的落地和部署,英特爾聯(lián)合戴爾科技等合作伙伴共同打造了很多基于英特爾軟硬件棧的邊緣AI解決方案,以支持無(wú)處不在的AI應(yīng)用。”
實(shí)際上,除了英特爾外,戴爾科技還與很多廠商有合作,其中與ISV合作研發(fā)面向細(xì)分領(lǐng)域的解決方案就是一種重要的合作方式。
當(dāng)下,向量數(shù)據(jù)庫(kù)+大模型的RAG(檢索增強(qiáng)生成)非常熱門(mén)。因?yàn)镽AG既可以發(fā)揮大模型的語(yǔ)言生成能力,又可以借助向量數(shù)據(jù)庫(kù)解決大模型的幻覺(jué)問(wèn)題,被認(rèn)為是一種非常有應(yīng)用前景的AI落地形式。達(dá)觀數(shù)據(jù)是一家專注于智能文本處理技術(shù)的專精特新“小巨人”企業(yè),其智能知識(shí)管理系統(tǒng)在行業(yè)內(nèi)擁有不少用戶,現(xiàn)在戴爾科技就在和達(dá)觀數(shù)據(jù)合作,共同探索RAG技術(shù)與智能知識(shí)管理的融合解決方案。
另外,戴爾科技推出的經(jīng)過(guò)驗(yàn)證的各種參考設(shè)計(jì) (AI Validated Design Solution) 以及配套的技術(shù)白皮書(shū)和效能的驗(yàn)證,其中就離不開(kāi)各種合作伙伴的支持。
“隨著AI技術(shù)的迭代,AI場(chǎng)景與AI模型規(guī)模越發(fā)復(fù)雜,對(duì)AI算力與AI訓(xùn)練數(shù)據(jù)的需求也會(huì)更加地旺盛,AI基礎(chǔ)設(shè)施未來(lái)幾年將會(huì)持續(xù)成為全球IT投資的熱點(diǎn)之一。”吳躍表示,作為的基礎(chǔ)設(shè)施供應(yīng)商,戴爾科技會(huì)和合作伙伴一起積極擁抱AI,通過(guò)技術(shù)創(chuàng)新推動(dòng)基礎(chǔ)設(shè)施的升級(jí),加速AI應(yīng)用的普及。
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與每日科技網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
本網(wǎng)站有部分內(nèi)容均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),若因作品內(nèi)容、知識(shí)產(chǎn)權(quán)、版權(quán)和其他問(wèn)題,請(qǐng)及時(shí)提供相關(guān)證明等材料并與我們聯(lián)系,本網(wǎng)站將在規(guī)定時(shí)間內(nèi)給予刪除等相關(guān)處理.
精彩推薦
-
采購(gòu)拿回扣問(wèn)題,教你一個(gè)小妙招,看看怎么做!
2017-09-18 11:09 廣告 閱讀
-
苦逼的老板,教你一個(gè)小妙招,怎么防采購(gòu)拿回扣!
2017-09-18 11:09 廣告 閱讀
-
傳播易是如何破局廣告營(yíng)銷和廣告投放的
2021-05-14 16:33:30 更新 閱讀
-
尖貨爆料!速來(lái)【數(shù)碼預(yù)爆臺(tái)】領(lǐng)取618福利和AI新
2024-06-21 18:33:22 更新 閱讀
-
喜獲國(guó)際設(shè)計(jì)大獎(jiǎng)丨十字勛章減重大師Pro商務(wù)背包
2024-06-12 14:04:28 更新 閱讀
-
Baseus倍思音頻品鑒會(huì):一場(chǎng)產(chǎn)品與技術(shù)的對(duì)話
2024-05-29 11:13:32 更新 閱讀
-
212攜手極致軍工品質(zhì),煥新出發(fā)
2024-05-22 21:16:00 更新 閱讀
-
第四屆全球應(yīng)用算法BPAA大賽再度升級(jí),增添三大
2024-05-17 17:55:36 更新 閱讀
-
三維天地助力實(shí)驗(yàn)室質(zhì)量管理工作無(wú)紙化、流程化
2024-05-09 15:35:04 更新 閱讀