堅持不用GPU!Meta又要All in自研AI芯片?
激石Pepperstone(http://hskilr.com/)報道:
就在整個硅谷都在以自家公司拿到多少塊英偉達(dá)的AI芯片(A100 GPU)為傲?xí)r,有這么一家倔強(qiáng)的公司,堅持不用英偉達(dá)的GPU,決定自研AI芯片。
這家公司就是Facebook的母公司Meta。
5月18日本周四,Meta披露了旗下數(shù)據(jù)中心項目支持AI工作的細(xì)節(jié),提到已經(jīng)打造一款定制芯片,簡稱MTIA,用于加快生成式AI模型的訓(xùn)練。這是Meta首次推出AI定制芯片。Meta稱,MTIA是加快AI訓(xùn)練和推理工作負(fù)載的芯片“家族”的一分子。
MTIA全稱為Meta訓(xùn)練和推理加速器。MTIA是一種ASIC,也就是將不同電路集成在一塊板上的芯片,可以將它進(jìn)行編程,執(zhí)行一項或多項任務(wù)??雌饋砗虶PU的功能類似,對不對?
和現(xiàn)在全球都在搶著用的英偉達(dá)A100 GPU相比,Meta自稱這款芯片也有優(yōu)勢。Meta稱,MTIA采用開源芯片架構(gòu)RISC-V,它的功耗僅有25瓦,遠(yuǎn)低于英偉達(dá)等主流芯片廠商的產(chǎn)品功耗。
而且,為了凸顯自己在AI領(lǐng)域早有布局,Meta稱,第一代MTIA芯片在2020年就已經(jīng)設(shè)計完成,采用的是7納米工藝。Meta說,打造第一代MTIA芯片的目的是提高內(nèi)容推薦模型的效率,以便更精準(zhǔn)地為用戶推薦廣告等內(nèi)容。此外,第一代MTIA可以將內(nèi)部128MB的內(nèi)存擴(kuò)展到高達(dá)128GB。在Meta設(shè)計的基準(zhǔn)測試中,它處理了低等和中等復(fù)雜度的AI模型,效率高于GPU。
對于投資者關(guān)于Meta為什么不直接采用GPU的質(zhì)疑,Meta的軟件工程師Joel Cohurn特別介紹稱,Meta并非不是沒有嘗試過GPU,而是在最初使用GPU執(zhí)行推理任務(wù)時,發(fā)現(xiàn)GPU不太適合這種工作。用GPU固然可以大幅優(yōu)化軟件,但對真實模型的效率很低,現(xiàn)實配置時難度大、成本高。所以Meta認(rèn)為,靠人不如靠己,需要搞個MTIA。
不過,Meta也承認(rèn),盡管在處理中低復(fù)雜程度模型時效率更高,但MTIA芯片在處理高復(fù)雜度AI模型時卻問題多多。
Meta間接承認(rèn),要想讓MTIA達(dá)到英偉達(dá)A100的水平,尚有差距。Meta表示,這款芯片在內(nèi)存和網(wǎng)絡(luò)領(lǐng)域的工作還未完成,隨著AI模型發(fā)展,這些工作會出現(xiàn)瓶頸。目前,MTIA 的重點放在Meta應(yīng)用家族的推理方面,而不是訓(xùn)練。不過Meta強(qiáng)調(diào),MTIA“大大”提高了單位瓦特的推薦負(fù)載運(yùn)行效率,讓公司能運(yùn)行加強(qiáng)版的、更尖端的AI工作負(fù)載。
Meta本周四并未披露配置新芯片的時間表,也未說明具體有什么計劃開發(fā)可能訓(xùn)練模型的芯片。
Meta在AI領(lǐng)域已經(jīng)落后同行
去年底ChatGPT大火之后,AI成為全球科技界最熱門的話題。AI芯片的主流制造商英偉達(dá)賺得盆滿缽滿,一度被視為已經(jīng)落伍的微軟借著投資OpenAI成功逆襲,向來宣稱在AI領(lǐng)域投資諸多的谷歌倉促發(fā)布Bard應(yīng)戰(zhàn),以及一眾互聯(lián)網(wǎng)大廠面對英偉達(dá)的“霸權(quán)”紛紛宣布要自研AI芯片……
這中間,獨(dú)獨(dú)沒有Meta的蹤影。
上個月,有媒體爆出一個大瓜,Meta如今居然還在用CPU來跑AI!
這不僅僅是因為英偉達(dá)的A100定價頗高,更是因為Meta之前All in元宇宙留下的后遺癥。扎克伯格決定把全部身家賭在元宇宙上這一戰(zhàn)略,直接榨干了Meta的算力。不管是AI的部署,還是對競爭對手威脅的應(yīng)對上,Meta的潛力都遭到了極大的削弱。
更不要說去年以來,Meta連續(xù)不斷的裁員,讓整個公司人心惶惶,絲毫沒有戰(zhàn)斗力應(yīng)對突如其來的AI大潮。
這些失誤,引起了前Meta董事會成員Peter Thiel的注意,隨后,他于2022年初辭職。據(jù)內(nèi)部人士透露,在離開前的一次董事會會議上,Thiel告訴扎克伯格和其他高管們,他們對Meta的社交媒體業(yè)務(wù)太自滿,并且過分關(guān)注元宇宙了,這讓公司很容易被競爭對手撼動。
在去年夏末,扎克伯格曾召集高管們,花了五個小時,對Meta的計算能力進(jìn)行分析。他們需要知道,在開發(fā)尖端的AI方面,Meta有多大的能力?
出來的結(jié)果,讓所有人倒吸一口涼氣。
根據(jù)去年9月20日的公司備忘錄顯示,盡管Meta對AI研究進(jìn)行了大筆高調(diào)的投資,然而主要業(yè)務(wù)需要的AI友好型硬件和軟件系統(tǒng)都非常昂貴,在這些方面公司的進(jìn)展相當(dāng)緩慢。緩慢到,已經(jīng)阻礙了Meta跟上大規(guī)模創(chuàng)新的步伐。
哪怕是Meta All in的元宇宙,要想維持增長,也必須越來越多地依靠AI。
Meta基礎(chǔ)設(shè)施負(fù)責(zé)人Santosh Janardhan強(qiáng)調(diào),無論是開發(fā)AI的工具,還是工作流程,Meta都已經(jīng)遠(yuǎn)遠(yuǎn)落后于其他對手。
要想追上英偉達(dá)有多難?
想要搞AI自研芯片的科技大廠不止Meta一家,但是想要做到英偉達(dá)這么成功、達(dá)到與之比肩的地位,還有很多路要走。
目前AI領(lǐng)域最常見的芯片是英偉達(dá)的A100。根據(jù)New Street Research的數(shù)據(jù),英偉達(dá)占據(jù)了可用于機(jī)器學(xué)習(xí)的圖形處理器市場的95%。
A100非常適合支持ChatGPT、Bing AI或Stable Diffusion等工具的機(jī)器學(xué)習(xí)模型,它能夠同時執(zhí)行許多簡單的計算,這對于訓(xùn)練和使用神經(jīng)網(wǎng)絡(luò)模型非常重要。
A100背后的技術(shù)最初用于在游戲中渲染復(fù)雜的3D圖形,它通常被稱為圖形處理器(GPU),但如今A100配置和目標(biāo)是機(jī)器學(xué)習(xí)任務(wù),并在數(shù)據(jù)中心運(yùn)行,而不是在個人電腦中運(yùn)行。
市場對A100的需求可謂巨大。對AI公司來說,一塊A100是難以支撐起他們的AI夢想的。許多數(shù)據(jù)中心使用一個包含八個A100的協(xié)同工作系統(tǒng)。該系統(tǒng)是英偉達(dá)的DGX A100,建議售價接近 20萬美元。
New Street Research的一項估計認(rèn)為,Bing搜索和ChatGPT的模型可能需要8個A100 GPU才能在不到一秒的時間內(nèi)響應(yīng)用戶問題。這意味著,微軟將需要超過2萬個DGX系統(tǒng),這意味著微軟在AI基礎(chǔ)設(shè)施建設(shè)上的支出就可能高達(dá)40億美元的基礎(chǔ)設(shè)施支出。如果谷歌想實現(xiàn)同樣的AI轉(zhuǎn)型,那么將在DGX上花費(fèi)800億美元。
更讓硅谷其他公司不敢有所懈怠的是,英偉達(dá)并不因為A100的巨大成功而自滿。
當(dāng)前,英偉達(dá)已經(jīng)開始開始量產(chǎn)下一代AI芯片H100。A100在2020年推出,H100則在2022年開始量產(chǎn),當(dāng)然,價格也高于A100。英偉達(dá)表示,H100是其第一款針對變壓器進(jìn)行優(yōu)化的數(shù)據(jù)中心GPU,這是許多最新和頂級人工智能應(yīng)用程序使用的一項越來越重要的技術(shù)。
面對當(dāng)前英偉達(dá)在AI芯片領(lǐng)域一家獨(dú)大的局面,當(dāng)前在自研AI芯片領(lǐng)域步子邁得最大的是微軟。
本月早些時候,微軟正在提供財務(wù)支持以加強(qiáng)AMD研發(fā)AI芯片的努力,并與之合作開發(fā)代號為Athena的自研AI芯片,這是微軟在自研AI芯片方面多管齊下、多重下注的一部分。
有分析認(rèn)為,此舉反映了微軟對芯片行業(yè)的介入持續(xù)深化。在過去幾年里,該公司一直在英特爾前高管Rani Borkar的領(lǐng)導(dǎo)下建立一個芯片部門,該部門目前擁有近1000名員工。據(jù)其中一位知情人士稱,其中數(shù)百名員工正在從事Athena項目,微軟已在該項目上投入了約20億美元。
但這并不預(yù)示著微軟和英偉達(dá)的分裂。微軟打算與英偉達(dá)保持密切合作,該公司的芯片是訓(xùn)練和運(yùn)行AI系統(tǒng)的主力軍。微軟還試圖獲得更多英偉達(dá)芯片,這進(jìn)一步凸顯了微軟和其他公司面臨的AI芯片的緊迫短缺。
4月中旬,據(jù)媒體援引兩位知情人士的話說,微軟早在2019年就開始開發(fā)內(nèi)部代號為Athena的AI芯片。其中一位知情人士稱,一些微軟和OpenAI的員工已經(jīng)開始測試并使用這些芯片。微軟希望該芯片的性能優(yōu)于目前從其他供應(yīng)商處購買的芯片,從而節(jié)省其在昂貴的AI業(yè)務(wù)上的時間和成本。
如此看來,Meta想要趕上英偉達(dá),甚至趕上其他硅谷同行的步伐,還有很長的路要走。?????????
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請注明出處。