| 芯片先驅(qū)在RISC-V人工智能芯片領(lǐng)域一決雌雄 |
| 2022年11月26日 |
|
|
|
|
| |
|
|
 【產(chǎn)通社,11月27日訊】20世紀(jì)80年代的一些芯片先驅(qū)正在利用人工智能和開源RISC-V架構(gòu)提供的新機(jī)遇,提高現(xiàn)代芯片設(shè)計(jì)的賭注。 由模擬和混合信號芯片先驅(qū)Martin Snelgrove共同創(chuàng)立的Untether AI發(fā)布了一款名為Boqueria的新人工智能推理芯片,該芯片擁有超過1400個(gè)優(yōu)化的RISC-V處理器。該芯片將與Esperanto ET-SoC-1人工智能推理芯片競爭,后者擁有超過1088個(gè)內(nèi)核,并于今年早些時(shí)候開始供樣。 Esperanto聯(lián)合創(chuàng)始人Dave Ditzel因在RISC芯片方面的開創(chuàng)性工作而聞名,包括開發(fā)Sun公司的SPARC處理器。 Tenstorrent公司在首席技術(shù)官Jim Keller的指導(dǎo)下,也在為人工智能開發(fā)RISC-V芯片,Jim Keller因在蘋果、AMD和英特爾工作期間在移動和PC芯片方面的突破而聞名。 這些公司是許多專注于人工智能的芯片創(chuàng)業(yè)公司之一。RISC-V指令集架構(gòu)可以自由許可和定制,為包括人工智能在內(nèi)的許多新應(yīng)用帶來了低成本芯片開發(fā)機(jī)會。 Untether在Hot Chips 2022大會上公布了Boqueria芯片。該公司聲稱在人工智能推理性能方面獲得了性能冠軍,在FP8數(shù)據(jù)類型上的性能為2 petaflops。該芯片的性能也達(dá)到了每瓦30萬億次浮點(diǎn)運(yùn)算。 這是該公司前身人工智能芯片RunAI的整體改進(jìn)。RunAI于2020年發(fā)布,性能為500萬億次,效率為每瓦8萬億次。 產(chǎn)品和硬件工程副總裁Robert Beachler在Hot Chips的一次演講中表示:“從推論上來說,您希望確保盡可能高效地工作,并使用正確的數(shù)據(jù)類型來確保必要的準(zhǔn)確性,但同時(shí)提供能源效率! 該公司表示,其性能和性能功耗比基準(zhǔn)優(yōu)于MLPerf上的可比芯片,ml perf正在成為行業(yè)標(biāo)準(zhǔn)的人工智能基準(zhǔn)。但該公司尚未向MLPerf開放其基準(zhǔn),并計(jì)劃在有可用資源時(shí)這樣做。 Untether AI采用了一種新的設(shè)計(jì)方法,通過將更多的計(jì)算資源放在數(shù)據(jù)存在的地方來確保數(shù)據(jù)移動的效率。例如,計(jì)算元件直接連接到存儲單元。 “當(dāng)我們坐下來設(shè)計(jì)人工智能推理加速時(shí),我們首先看到的是,進(jìn)行神經(jīng)網(wǎng)絡(luò)計(jì)算的90%的能量都在移動數(shù)據(jù),無論是來自外部存儲器還是內(nèi)部緩存。而且只有10%是真正在計(jì)算機(jī)中完成的,”Beachler說。 該芯片有729個(gè)內(nèi)存條,每個(gè)內(nèi)存條有兩個(gè)1.3GHz的RISC-V CPU內(nèi)核。Beachler說,“因?yàn)樘幚碓凶约旱膶S脙?nèi)存,所以我們有巨大的內(nèi)存帶寬,大約是1pb的內(nèi)存帶寬。” Boqueria支持PCI-Express互連。該公司可以在單個(gè)PCI-Express卡中插入多達(dá)6個(gè)芯片,以運(yùn)行大型自然語言處理網(wǎng)絡(luò)。六芯片PCI卡將消耗400瓦的功率,但典型的工作負(fù)載將在200到300瓦的范圍內(nèi)運(yùn)行。 對于不運(yùn)行大規(guī)模推理應(yīng)用程序的客戶來說,Boqueria也可以縮減到更少的內(nèi)存組。人工智能家族將從低于1瓦一直擴(kuò)展到Hot Chips中描述的新芯片。 Beachler說,“這使我們能夠解決多個(gè)不同的性價(jià)比點(diǎn)和形狀因素”,其中包括小芯片的集成,以及與片上系統(tǒng)封裝中其他芯片的直接管芯到管芯互連。 該芯片支持從INT4到FP16的多種數(shù)據(jù)類型,精度更高。該公司研究了不同的數(shù)據(jù)類型,并得出結(jié)論,16位數(shù)據(jù)類型,如BF16,提供了與FP32一樣的準(zhǔn)確性,但使用更少的功率和計(jì)算資源。 “我們還發(fā)現(xiàn),我們開發(fā)了一種新的FP8數(shù)據(jù)類型,效率是BF16的四倍,但同時(shí)保持了當(dāng)今人工智能工作負(fù)載所需的準(zhǔn)確性,”Beachler說。 Boqueria中的RISC-V CPU是一種標(biāo)準(zhǔn)架構(gòu),有二十多條定制指令來利用設(shè)計(jì)和推理工作負(fù)載。查詢進(jìn)一步信息,請?jiān)L問官方網(wǎng)站 http://www.hpcwire.com/2022/08/25/chip-pioneers-to-battle-it-out-in-modern-risc-v-ai-chips/。(編譯:Donna Zhang,張底剪報(bào))
|
|
| → 『關(guān)閉窗口』 |
|
| |
|
|
|
|
|
|