加入收藏
免費注冊
用戶登陸
首頁
展示
供求
職場
技術(shù)
智造
職業(yè)
活動
視點
品牌
鐠社區(qū)
今天是:2026年3月17日 星期二 您現(xiàn)在位于:
首頁
→
智造
→ 辦公電子(應(yīng)用指南)
Graphcore PopRT實現(xiàn)零代碼模型推理部署
日期:2023/4/16 12:01:28 作者:
當(dāng)你和ChatGPT聊天時,你有沒有想過,在那個閃爍的光標(biāo)背后,正在發(fā)生什么?
ChatGPT在收到你的輸入指令后,到生產(chǎn)出答案的過程就是推理。AI推理是將用戶輸入的數(shù)據(jù),通過訓(xùn)練好的模型產(chǎn)生有價值信息的過程。在LLM類模型應(yīng)用、自動駕駛、量化交易、搜索、推薦等很多場景中,對于AI推理效率的要求非常高。為進一步幫助克服AI應(yīng)用部署的時延痛點,Graphcore搭配C600推出了高性能推理SDK——PopRT,幫助開發(fā)者實現(xiàn)零代碼推理部署已經(jīng)訓(xùn)好的模型,同時帶來低時延和高吞吐量,極大縮短AI業(yè)務(wù)商業(yè)變現(xiàn)時間窗口,為企業(yè)用戶贏得市場先機。
PopRT構(gòu)成
PopRT包括轉(zhuǎn)換器、編譯器和運行時:
    轉(zhuǎn)換器
        提供對op-fusion、constant-folding等廣泛使用的優(yōu)化方法內(nèi)置支持
        提供對FP16和FP8訓(xùn)練后量化的內(nèi)置支持,這種訓(xùn)練后量化可以實現(xiàn)更低的時延和更高的吞吐量,并且精度損失很小
        支持將多個模型融合為一個
    編譯器
        支持模型切分和流水線
        為運行時導(dǎo)出PopEF(Poplar可執(zhí)行格式)
    運行時
        支持自動批處理
        支持移除填充以減少對自然語言處理(NLP)模型的無用計算(或通過移除填充對自然語言處理模型進行更有效的推理)
        支持針對CV(計算機視覺)模型的多模型推理
部署和運行
Graphcore始終堅持降低IPU的使用門檻,廣泛支持各類主流的機器學(xué)習(xí)框架,讓開發(fā)者能夠在自己熟悉的環(huán)境中工作,專注創(chuàng)新。
PopRT優(yōu)化模型可與英偉達Triton和TF-Serving一起部署,并可以通過PopRT運行時API很容易地與第三方框架和服務(wù)平臺集成。
優(yōu)化推理性能
搭配Grapchore C600高端推訓(xùn)一體加速卡,PopRT使得開發(fā)者可以“一鍵”零代碼部署已經(jīng)訓(xùn)練好的AI應(yīng)用,可以大幅加速計算機視覺、自動語音識別、自然語言處理(BERT、GPT類)、多模態(tài)和推薦系統(tǒng)的AI應(yīng)用的部署速度,加速整個數(shù)據(jù)中心的各項工作負(fù)載,縮短研發(fā)到商用的時間。
欲了解各類模型在C600的優(yōu)異性能,請聯(lián)系info_china@graphcore.ai
在C600上使用PopRT
C600是擬未為云和數(shù)據(jù)中心打造的高端推訓(xùn)一體加速卡,主打推理,兼做訓(xùn)練,可以支持各種主流的AI應(yīng)用,在搜索和推薦等業(yè)務(wù)上別具優(yōu)勢。為了使得C600在推理場景發(fā)揮更大效能,PopRT在C600的基礎(chǔ)上進一步針對推理進行了優(yōu)化,低時延和高吞吐使得用戶可以高效地進行推理,一鍵部署已經(jīng)訓(xùn)好的模型。
現(xiàn)在,15億參數(shù)量的GPT2-XL已經(jīng)在C600上成功部署(詳情請見本次推送首條)。在PopRT的加持下,GPT2-XL的推理延時在C600上已經(jīng)達到1 ms/token的水平。這意味著在實際應(yīng)用場景中,模型可以快速響應(yīng)用戶的請求,極大提高用戶體驗。
查詢進一步信息,請訪問官方網(wǎng)站
http://www.graphcore.cn/0-code-deploy-graphcore-poprt/
,
http://docs.graphcore.ai/projects/poprt-user-guide/zh_CN/latest/
,
http://github.com/graphcore/PopRT
。(Donna Zhang,張底剪報)
→
『關(guān)閉窗口』
發(fā)布人:
-----
[
→ 我要發(fā)表
]
上篇文章:
1700V SiC MOSFET無需考慮功率轉(zhuǎn)換中的權(quán)衡問題
下篇文章:
MIPI提高新一代圖像數(shù)據(jù)的傳輸性能
→ 主題所屬分類:
辦公電子
→
應(yīng)用指南
熱門文章
中航光電(158廠)電連接器產(chǎn)品選型指南
(
64375
)
國巨(Yageo)片式電阻電容產(chǎn)品規(guī)格書
(
57637
)
下一代前傳網(wǎng)絡(luò)接口(NGFI)白皮書
(
49839
)
2013年移動經(jīng)濟(The Mobile Economy 2013…
(
48115
)
鐳射二極管
(
46552
)
使用NFC進行藍(lán)牙配對(Using NFC for Bluet…
(
45343
)
為濾波電路選擇合適的運算放大器
(
42189
)
mirasol顯示器與競爭性顯示技術(shù)的比較 - Qualco…
(
41850
)
CodeWarrior Development Studio
(
41014
)
u-blox產(chǎn)品目錄(Product Catalog 16…
(
40722
)
最近更新
風(fēng)華高科中高壓MLCC解決方案多領(lǐng)域全場景滲透
(8月29日)
用樹莓派Pico W和Lora Hat構(gòu)建網(wǎng)格節(jié)點
(5月8日)
用Pulsus PLD系統(tǒng)實現(xiàn)突破性piezoMEMS器件
(1月21日)
復(fù)旦芯片實現(xiàn)感存算一體化:像人眼一樣智能
(9月29日)
增強型人工智能為Meteor Lake處理器的設(shè)計提速
(5月15日)
教育行業(yè)數(shù)字化自主創(chuàng)新飛騰生態(tài)解決方案白皮書
(4月2日)
人形機器人設(shè)計原則及人類智能和內(nèi)部身體系統(tǒng)仿真
(2月2日)
用傳感器讓中央空調(diào)更節(jié)能環(huán)保,精確測量溫濕度、…
(1月30日)
不干膠標(biāo)簽印刷UL認(rèn)證
(11月22日)
基于廣芯微UM3242F-RET6主控芯片的DC-AC逆…
(11月9日)
文章搜索
搜索選項:
文章標(biāo)題
發(fā)布人
請選擇文章的類別
白皮書店
消費電子
辦公電子
汽車電子
通信電子
固態(tài)照明
安全電子
工業(yè)電子
醫(yī)療電子
家庭電子
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
移動電子
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
辦公電子
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
通信網(wǎng)絡(luò)
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
汽車電子
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
工業(yè)電子
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
固態(tài)照明
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
安全電子
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
醫(yī)療電子
參考設(shè)計
應(yīng)用指南
數(shù)據(jù)手冊
產(chǎn)品透視
產(chǎn)品目錄
電子元件
半導(dǎo)體器件
顯示器材
綠色能源
電子材料
電子測量
電子制造
通用資源
設(shè)計技巧
常用數(shù)據(jù)
開發(fā)工具
IC代換
→
評論內(nèi)容
(點擊查看)
(沒有相關(guān)評論)
您是否還沒有
注冊
或還沒有
登陸
本站?!
關(guān)于我們
┋
免責(zé)聲明
┋
產(chǎn)品與服務(wù)
┋
聯(lián)系我們
┋
About 365PR
┋
Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產(chǎn)通互聯(lián)網(wǎng)有限公司 版權(quán)所有
E-mail:postmaster@365pr.net
不良信息舉報
備案號:
粵ICP備06070889號