4月17日上午,全球首個億量級草藥基因編碼天然多樣性成分庫(Gene-encoded Natural Diverse Components Repository, GNDC)在四川省成都市舉行的第三屆“千種本草基因組計劃”會議上發(fā)布。
全球首個億量級草藥基因編碼天然多樣性成分庫發(fā)布儀式。人民網(wǎng)記者 劉海天攝
據(jù)悉,GNDC基于全球八大權威藥典收錄的1037個藥用物種的核基因組、細胞器基因組等多維數(shù)據(jù),通過自主開發(fā)的基因組遍歷算法結合轉錄組、小RNA測序、肽質譜等多組學技術實現(xiàn)了對天然多樣性成分的挖掘與驗證,并創(chuàng)新性整合自然語言處理、對抗生成網(wǎng)絡、圖卷積網(wǎng)絡等人工智能算法實現(xiàn)成分的識別、分類與功能注釋。GNDC收錄了超過2.34億個基因直接或間接編碼的天然多樣性成分,包括232萬個次生代謝產(chǎn)物、22977萬條多肽、238萬個小RNA和26萬個碳水化合物。GNDC實現(xiàn)了基因組信息、成分信息與功能信息的整合,彌補了現(xiàn)有天然產(chǎn)物數(shù)據(jù)庫在數(shù)據(jù)類型與功能解析方面的不足。作為目前全球規(guī)模最大的藥用天然成分庫,GNDC將為藥物發(fā)現(xiàn)提供廣闊的“化學空間”,加速“大數(shù)據(jù)驅動”模式下的藥物發(fā)現(xiàn)進程。
中醫(yī)藥人工智能聯(lián)合實驗室揭牌儀式。人民網(wǎng)記者 劉海天攝
據(jù)介紹,GNDC由成都中醫(yī)藥大學本草基因組學團隊聯(lián)合現(xiàn)代中醫(yī)藥海河實驗室、中國醫(yī)學科學院藥用植物研究所、東北林業(yè)大學、湖北時珍實驗室等單位共同完成。
項目總負責人中國工程院院士、成都中醫(yī)藥大學首席教授陳士林指出:“GNDC實現(xiàn)了基因組數(shù)據(jù)與人工智能算法的深度融合,標志著天然成分研究進入智能化和精準化的新階段。通過創(chuàng)新性整合多組學技術與人工智能方法,GNDC在天然多樣性成分的識別、分類與功能注釋方面展現(xiàn)出了突破性優(yōu)勢,將成為驅動天然藥物研發(fā)范式變革、加速中藥現(xiàn)代化進程的核心技術支撐?!保ㄓ浾邉⒑L欤?/p>