| 寒武紀(jì)首顆7nm訓(xùn)練芯片思元290及玄思1000加速器正式亮相 |
| 2021/2/8 13:40:34 |
|
|
|
|
| |
|
|
 【產(chǎn)通社,2月8日訊】中科寒武紀(jì)科技股份有限公司(cambricon;股票代碼:688256)官網(wǎng)消息,其思元290智能芯片及加速卡、玄思1000智能加速器量產(chǎn)落地后首次正式亮相,標(biāo)志著寒武紀(jì)已建立“云邊端一體、軟硬件協(xié)同、訓(xùn)練推理融合”的新生態(tài)。 產(chǎn)品特點(diǎn) 思元290智能芯片是寒武紀(jì)的首顆訓(xùn)練芯片,采用臺(tái)積電7nm先進(jìn)制程工藝,集成460億個(gè)晶體管,支持MLUv02擴(kuò)展架構(gòu),全面支持AI訓(xùn)練、推理或混合型人工智能計(jì)算加速任務(wù)。 MLU290-M5智能加速卡搭載思元290智能芯片,采用開(kāi)放加速模塊OAM設(shè)計(jì),具備64個(gè)MLU Core,1.23TB/s內(nèi)存帶寬以及全新MLU-Link多芯互聯(lián)技術(shù),在350W的最大散熱功耗下提供AI算力高達(dá)1024 TOPS(INT4)。 玄思1000智能加速器,在2U機(jī)箱內(nèi)集成4顆思元290智能芯片,高速本地閃存、Mellanox InfiniBand網(wǎng)絡(luò),對(duì)外提供高速M(fèi)LU-Link接口,打破智能芯片、服務(wù)器、POD與集群的傳統(tǒng)數(shù)據(jù)中心橫向擴(kuò)展架構(gòu),實(shí)現(xiàn)AI算力在計(jì)算中心級(jí)縱向擴(kuò)展,是AI算力的高集成度平臺(tái)。 (1)思元290采用MLUv02擴(kuò)展架構(gòu) MLUv02架構(gòu)為寒武紀(jì)MLU200全產(chǎn)品線共享,滿足云、邊、端三個(gè)場(chǎng)景的算力需求。云端訓(xùn)練對(duì)AI算力的要求更為苛刻,因此寒武紀(jì)對(duì)思元290的MLUv02架構(gòu)進(jìn)行了多項(xiàng)擴(kuò)展,包括業(yè)內(nèi)領(lǐng)先的MLU-Link多芯互聯(lián)技術(shù)、高帶寬HBM2內(nèi)存、高速片上總線NOC以及新一代PCIe 4.0接口。相比寒武紀(jì)思元270芯片,思元290芯片實(shí)現(xiàn)峰值算力提升4倍、內(nèi)存帶寬提高12倍、芯片間通訊帶寬提高19倍。新架構(gòu)結(jié)合7nm制程,思元290可提供更優(yōu)性能功耗比,以及多MLU系統(tǒng)的擴(kuò)展能力。 (2)寒武紀(jì)MLU-Link多芯互聯(lián)技術(shù) 近年來(lái),AI算法模型的復(fù)雜程度高速增長(zhǎng),對(duì)算力和訓(xùn)練速度提出了更高的要求。為了構(gòu)建更強(qiáng)大的計(jì)算平臺(tái),多芯片間的互聯(lián)技術(shù)已成為市場(chǎng)剛需。 寒武紀(jì)推出MLU-Link多芯互聯(lián)技術(shù),并首次搭載于寒武紀(jì)思元290芯片,每顆思元290的多芯互聯(lián)總帶寬高達(dá)600GB/s。MLU-Link具備豐富的互聯(lián)特性,突破PCIe帶寬和互聯(lián)的瓶頸,相比思元270芯片通過(guò)PCIe并行的通訊方式,帶寬提高19倍。MLU-Link多芯互聯(lián)技術(shù)支持多顆思元芯片無(wú)縫互聯(lián),支持跨系統(tǒng)互聯(lián),將縱向擴(kuò)展能力整合到整個(gè)人工智能計(jì)算中心(AIDC),可以端到端加速大型AI模型訓(xùn)練。 思元290采用MLU-Link多芯互聯(lián)技術(shù)進(jìn)行互聯(lián),帶寬、靈活性全面優(yōu)于PCIe 3.0。   (3)寒武紀(jì)vMLU解決方案 不同場(chǎng)景下的AI訓(xùn)練對(duì)計(jì)算和存儲(chǔ)的要求千差萬(wàn)別,如何提供更靈活也更穩(wěn)定的服務(wù),但同時(shí)讓算力得到充分地利用,是AIDC面臨的持續(xù)挑戰(zhàn)。寒武紀(jì)虛擬化技術(shù)vMLU,支持在思元290上實(shí)現(xiàn)4個(gè)相互隔離的AI計(jì)算實(shí)例,每個(gè)實(shí)例獨(dú)占計(jì)算、內(nèi)存和編解碼資源。實(shí)例之間的硬件資源互不干擾,即使在虛擬化環(huán)境下仍可保持90%以上的極高效率,幫助客戶充分利用硬件資源。 vMLU還可以幫助思元290芯片提供更好的靈活性。通過(guò)熱遷移技術(shù),云管理員可將正在運(yùn)行的AI負(fù)載及其應(yīng)用程序移動(dòng)到另外一臺(tái)主機(jī)上,從而平衡整個(gè)AIDC的負(fù)載,并實(shí)現(xiàn)更好的容災(zāi)功能。 (4)寒武紀(jì)首款A(yù)I訓(xùn)練智能加速卡MLU290-M5 寒武紀(jì)MLU290-M5智能加速卡搭載了思元290智能芯片,采用開(kāi)放加速模塊OAM設(shè)計(jì),具備64個(gè)MLU Core,1.23TB/s內(nèi)存帶寬以及全新MLU-Link多芯互聯(lián)技術(shù),在350W的最大散熱功耗下提供AI算力高達(dá)1024 TOPS (INT4)。 (5)寒武紀(jì)首款智能加速器玄思1000 寒武紀(jì)首款智能加速器玄思1000包含4片思元290智能加速卡,最大AI算力超過(guò)4100萬(wàn)億次每秒(4.1 PetaOPS INT4),一臺(tái)玄思1000計(jì)算單元就足以替代一個(gè)小型傳統(tǒng)超級(jí)計(jì)算中心。 玄思1000內(nèi)置高帶寬低延時(shí)的MLU-Link多芯互聯(lián)技術(shù),實(shí)現(xiàn)內(nèi)部4顆思元290進(jìn)行高速互聯(lián),同時(shí)打破服務(wù)器、緊耦合微集群(POD)與集群的傳統(tǒng)數(shù)據(jù)中心橫向擴(kuò)展架構(gòu),將AIDC構(gòu)建為節(jié)點(diǎn)、POD乃至超大規(guī);旌蠑U(kuò)展架構(gòu)(Hybrid Scale-out),實(shí)現(xiàn)AI算力計(jì)算中心級(jí)縱向擴(kuò)展,滿足高性能、高擴(kuò)展性、靈活性、高魯棒性的要求。 供貨與報(bào)價(jià) 寒武紀(jì)思元290芯片及加速卡已與部分硬件合作伙伴完成適配,并已實(shí)現(xiàn)規(guī)模化出貨。查詢進(jìn)一步信息,請(qǐng)?jiān)L問(wèn)官方網(wǎng) http://www.cambricon.com。(張怡,產(chǎn)通發(fā)布) (完)
|
|
| → 『關(guān)閉窗口』 |
|
| |
|
|
|
|
|
|