|
 【產(chǎn)通社,12月31日訊】華東理工大學(xué)(East China University of Science and Technology)官網(wǎng)消息,IEEE International Conference on Bioinformatics and Biomedicine(IEEE BIBM 2016)近日在深圳舉行,其計算機系自然語言處理與大數(shù)據(jù)挖掘?qū)嶒炇业膶W(xué)生孫健、王婷受邀到現(xiàn)場作學(xué)術(shù)報告,分享研究成果。 孫健、王婷作為研究團隊代表,介紹了其開發(fā)出的中文癥狀知識庫的整體情況。該庫以RDF三元組的形式存儲,共包含135,485個實體和617,499條事實三元組。與會學(xué)者對此研究產(chǎn)生了濃厚的興趣,相關(guān)詢問接連不斷,孫健一一用英文作了解答。 華理自然語言處理與大數(shù)據(jù)挖掘?qū)嶒炇抑魅稳钔淌陬I(lǐng)銜的研究團隊,基于目前并無公開可用的中文癥狀術(shù)語集的情況,聯(lián)合上海中醫(yī)藥大學(xué)附屬曙光醫(yī)院的專家學(xué)者,花費近一年時間,人工定義中文癥狀知識庫模式圖,并以醫(yī)療垂直網(wǎng)站和百科站點為數(shù)據(jù)源,利用啟發(fā)式規(guī)則與機器學(xué)習(xí)相結(jié)合的方法,從中抽取半結(jié)構(gòu)化信息進行知識融合,構(gòu)建了包括癥狀、疾病、科室、檢查、藥品等眾多信息在內(nèi)的醫(yī)療知識圖譜,開發(fā)出了目前唯一一個完整包含中西醫(yī)癥狀及其相關(guān)實體的中文醫(yī)療知識庫。 查詢進一步信息,請訪問官方網(wǎng)站 http://www.ecust.edu.cn。  (完)
|