中科院+北大,推出基因挖掘大模型
摘要: 4月16日消息,中國科學院深圳先進技術研究院與北京大學合作團隊近日在《Science Advances》發(fā)表研究成果,推出全球首個面向合成生物學元件挖掘的大語言模
4月16日消息,中國科學院深圳先進技術研究院與北京大學合作團隊近日在《Science Advances》發(fā)表研究成果,推出全球首個面向合成生物學元件挖掘的大語言模型SYMPLEX。該模型通過融合領域大語言模型訓練、專家知識庫對齊及生物信息分析,實現(xiàn)了從海量文獻中自動化挖掘高價值功能基因,并精準評估其工程化應用潛力。
該模型能夠自動高效地從海量生物文獻中發(fā)現(xiàn)具有目標功能的關鍵基因,并進行精準篩選和功能驗證,為后續(xù)的蛋白質功能設計、生物制劑開發(fā)以及生物制造的應用提供科學依據(jù)。
研究團隊以mRNA疫苗關鍵酶——加帽酶為驗證案例,成功挖掘出催化效率超國際商業(yè)產(chǎn)品2倍以上的新型酶。SYMPLEX平臺采用模塊化設計,具備文獻智能提取、基因功能標注及知識中樞三大核心功能,現(xiàn)已開放免費使用。
根據(jù)介紹,SYMPLEX突破性在于通過結構化知識庫規(guī)避大模型幻覺,同時生成細粒度基因功能知識樹,為合成生物學研究提供新范式。
相關推薦