英國《自然·機器智能》雜志15日發(fā)表一項計算生物學突破,包括加拿大英屬哥倫比亞大學在內(nèi)的研究團隊研發(fā)了一種自動化、生成式的機器學習方法,可以僅利用質(zhì)譜就確定未知的新型精神藥物(又稱人造毒品)的化學結(jié)構(gòu),了解這些結(jié)構(gòu)能幫助法醫(yī)實驗室更快識別出疑似的人造毒品。
每年有大量新型精神藥物出現(xiàn)在非法市場上,這些藥物會造成與已知非法藥物相近的精神效果,但其合成方式使其在化學上與已知非法藥物有所不同,這些藥物規(guī)避了現(xiàn)有的毒品法規(guī),甚至難以被偵測。法醫(yī)實驗室使用質(zhì)譜分析法在查封藥片或粉末中識別已知人造毒品。但是,要弄清一種全新人造毒品的結(jié)構(gòu),通常需要化學專家工作數(shù)周或數(shù)月,并且需要用到多種實驗技術(shù)。
加拿大英屬哥倫比亞大學研究人員邁克爾·斯金奈德及其同事,此次使用全球各地法醫(yī)實驗室眾包的保密數(shù)據(jù),訓練了一個機器學習模型。他們所使用的算法也被稱為深度神經(jīng)網(wǎng)絡,其靈感來自于人腦的結(jié)構(gòu)和功能。機器學習產(chǎn)生了結(jié)構(gòu)和性質(zhì)都類似于近期人造毒品的分子。該模型隨后產(chǎn)生了一個數(shù)據(jù)庫,包含十億種潛在新型精神藥物的結(jié)構(gòu)。用模型訓練結(jié)束后新收集的數(shù)據(jù)測試該模型,發(fā)現(xiàn)這一方法可以僅用質(zhì)譜就確定未知人造毒品。在準確結(jié)構(gòu)難以精準確定的實例中,該模型建議的結(jié)構(gòu),與未知人造毒品非常相似。
研究人員發(fā)現(xiàn),該模型還可幫助人們了解到哪些分子更有可能出現(xiàn)在市場上,哪些不太可能。研究人員總結(jié)說,用其他數(shù)據(jù)集訓練的類似的生成方法,也可以幫助識別其他特定領(lǐng)域未知分子的結(jié)構(gòu),例如識別新型興奮劑或者環(huán)境污染物。
研究資深作者、阿爾伯塔大學計算科學專業(yè)教授戴維·維斯哈特表示,這一模型意義有點類似2002年的科幻電影《少數(shù)派報告》,其可以對即將發(fā)生的犯罪活動有所預知,從而幫助顯著減少犯罪,“從本質(zhì)上講,這一新成果為執(zhí)法機構(gòu)和公共衛(wèi)生計劃提供了一個所謂‘先機’,讓他們知道需注意什么。”
斯金奈德表示,該模型僅僅通過精確的質(zhì)譜測量就闡明整個化學結(jié)構(gòu),而將數(shù)十億個結(jié)構(gòu)的列表縮小到10個候選結(jié)構(gòu),大大加快了化學家識別新藥物的速度。