網(wǎng)絡(luò)消費(fèi)網(wǎng) >  科技 > > 正文
全球今頭條!生物版ChatGPT來(lái)了!可“一鍵生成”蛋白質(zhì) 應(yīng)用多以開(kāi)源為主
時(shí)間:2023-03-07 18:12:39

《科創(chuàng)板日?qǐng)?bào)》3月7日訊(記者 金小莫)在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱(chēng)性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。


(資料圖)

這是記者在天壤XLab看到的相關(guān)應(yīng)用。

2022年10月,天壤XLab上線了蛋白質(zhì)自由設(shè)計(jì)平臺(tái)xCREATOR,面向高校師生免費(fèi)開(kāi)放,不足半年,該平臺(tái)已累積有五六百用戶(hù)。日前,《科創(chuàng)板日?qǐng)?bào)》記者從天壤XLab處進(jìn)一步了解到,今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也已正式上線。

支撐這些平臺(tái)的技術(shù)就是蛋白質(zhì)結(jié)構(gòu)的自動(dòng)生成技術(shù),后者也是ChatGPT的核心技術(shù)之一。另有跡象表明,自動(dòng)生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用正在逐漸增多

今年2月,科創(chuàng)板合成生物學(xué)上市公司凱賽生物宣布領(lǐng)投AI蛋白質(zhì)設(shè)計(jì)平臺(tái)公司分子之心的新一輪戰(zhàn)略投資;同在2月,初創(chuàng)企業(yè)賽得康宣布完成了數(shù)千萬(wàn)元的種子輪融資,AI設(shè)計(jì)+蛋白模塊是企業(yè)的關(guān)鍵詞。

“其實(shí),ChatGPT所依托的AI生成技術(shù)并非新技術(shù),很多公司都已經(jīng)有所積累并陸續(xù)開(kāi)始應(yīng)用了。之前有個(gè)語(yǔ)言模型BERT就被用于蛋白質(zhì)生成了,取得了不錯(cuò)的成果?!币患倚袠I(yè)企業(yè)對(duì)記者表示,只不過(guò),當(dāng)ChatGPT走熱之后,AI生成技術(shù)在生命科學(xué)領(lǐng)域的應(yīng)用也逐漸走進(jìn)了公眾的視野。

記者注意到,當(dāng)互聯(lián)網(wǎng)科技向AI迭代升級(jí)后,很快,AI的應(yīng)用就從TMT涌向了生物醫(yī)藥,AI+藥物發(fā)現(xiàn)一度成為一級(jí)市場(chǎng)的投資熱詞;類(lèi)似的情況,會(huì)不會(huì)也發(fā)生在ChatGPT+藥物發(fā)現(xiàn)上呢?

▌氨基酸恰類(lèi)似于大數(shù)據(jù)

記者了解到,自動(dòng)生成技術(shù)之所以可應(yīng)用到蛋白質(zhì)的發(fā)現(xiàn)上,有這樣的科學(xué)邏輯支撐:

蛋白質(zhì)是由氨基酸通過(guò)不同的排列組合聚合而成,每個(gè)蛋白質(zhì)的三維結(jié)構(gòu)又決定了它的功能作用。在算法人的眼中,氨基酸就類(lèi)似于數(shù)據(jù)、蛋白質(zhì)的三維結(jié)構(gòu)類(lèi)似于圖像,通過(guò)數(shù)據(jù)及圖像的不同排列組合訓(xùn)練,AI就能實(shí)現(xiàn)自生成。

在業(yè)內(nèi),這一邏輯也被稱(chēng)為AIGP,即AI Generated Protein(AI生成蛋白質(zhì))。

在天壤XLab,記者看到了相關(guān)應(yīng)用:

在需求欄中輸入對(duì)目標(biāo)蛋白質(zhì)的描述參數(shù),比如序列長(zhǎng)度、結(jié)構(gòu)對(duì)稱(chēng)性、目標(biāo)功能、結(jié)合配體結(jié)構(gòu)、化學(xué)計(jì)量等;點(diǎn)擊“運(yùn)行任務(wù)”鍵;很快,電腦屏幕上就顯示出了符合參數(shù)要求的蛋白質(zhì)三維結(jié)構(gòu)。

去年10月,具備該功能的xCREATOR工作臺(tái)正式上線,面向高校師生免費(fèi)開(kāi)放;今年2月下旬,團(tuán)隊(duì)自主研發(fā)的蛋白質(zhì)擴(kuò)散模型也正式上線。

“我們還附加了一系列設(shè)計(jì)蛋白質(zhì)的分析功能,可以對(duì)各類(lèi)由算法自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)進(jìn)行打分,分?jǐn)?shù)越高表示該自動(dòng)生成的蛋白質(zhì)結(jié)構(gòu)的可實(shí)現(xiàn)性越高?!碧烊繶Lab實(shí)驗(yàn)室負(fù)責(zé)人苗洪江博士介紹稱(chēng)。

在ChatGPT中,需要人工對(duì)數(shù)據(jù)進(jìn)行標(biāo)注、打分,以此來(lái)訓(xùn)練算法更會(huì)聊天;AIGP也是類(lèi)似的邏輯,但不同的是,如果科研人員要想知道某一由算法自動(dòng)生成的蛋白質(zhì),其可實(shí)現(xiàn)性到底高不高,還需要通過(guò)進(jìn)一步的濕實(shí)驗(yàn)來(lái)驗(yàn)證,因此,AIGP的技術(shù)壁壘也就更高。

為了降低這一技術(shù)門(mén)檻,引入打分模型算法是很多企業(yè)的選擇。

前述行業(yè)企業(yè)對(duì)《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步解釋了生成算法與打分算法的工作邏輯:首先,由生成模型算法生成蛋白質(zhì);其次,由人工對(duì)經(jīng)打分模型篩選出的、得分較高的蛋白質(zhì),再進(jìn)行實(shí)驗(yàn)驗(yàn)證,并反饋給打分模型算法?!岸呔拖窭项B童的左右兩手互搏,通過(guò)不斷增強(qiáng)學(xué)習(xí),來(lái)提高算法的質(zhì)量?!?/p>

▌探索大分子宇宙

有了AIGP,對(duì)于科研人員來(lái)說(shuō),最大的獲益無(wú)疑是加速了研發(fā)的進(jìn)展。

“以100個(gè)氨基酸長(zhǎng)度的蛋白質(zhì)為例,其序列的排列組合有高達(dá)20^100=1.3×10^130種可能!相比之下,人類(lèi)可觀測(cè)宇宙總原子數(shù)量?jī)H有10^82,以人力來(lái)測(cè)試、構(gòu)想這樣龐大的蛋白質(zhì)空間可以說(shuō)是不可能完成的任務(wù)?!泵绾榻Q(chēng),如今AI模型能夠精準(zhǔn)定位到符合要求的蛋白質(zhì)再由研發(fā)人員進(jìn)行實(shí)驗(yàn)檢驗(yàn),蛋白質(zhì)設(shè)計(jì)效率前所未有的提升使其終于可以走進(jìn)產(chǎn)業(yè)應(yīng)用中去。

更重要的是,過(guò)去基于偶然性的開(kāi)發(fā)工作也極大限制了人類(lèi)對(duì)于蛋白質(zhì)的開(kāi)發(fā),人類(lèi)已知的天然蛋白質(zhì)數(shù)量為10^15,而潛在的從頭設(shè)計(jì)蛋白質(zhì)數(shù)量遠(yuǎn)超于已知天然蛋白質(zhì)。

以人體內(nèi)的蛋白質(zhì)來(lái)說(shuō),“目前大多數(shù)人類(lèi)蛋白質(zhì)功能研究都聚焦于約5000種研究較多的人類(lèi)蛋白質(zhì),而人體內(nèi)還存在著一個(gè)巨大的蛋白質(zhì)世界。事實(shí)上,這些功能未知的蛋白質(zhì)可能掌握著打開(kāi)解決人類(lèi)重大疾病的鑰匙,如癌癥、阿爾茲海默癥以及多種罕見(jiàn)病?!泵绮┦拷忉尫Q(chēng)。

除生命科學(xué)外,新材料、新能源和食品等領(lǐng)域?qū)δ艿鞍踪|(zhì)也存有巨大的需求。“整個(gè)蛋白質(zhì)世界還擁有巨大的潛在探索空間,蘊(yùn)藏著無(wú)窮無(wú)盡的資源,具有極大應(yīng)用價(jià)值!”天壤CEO薛貴榮博士表示,蛋白質(zhì)領(lǐng)域的ChatGPT會(huì)成為像水、電、煤一樣成為工業(yè)發(fā)展支撐,開(kāi)辟出全新的科學(xué)時(shí)代。

《科創(chuàng)板日?qǐng)?bào)》記者進(jìn)一步了解到,如何獲取行業(yè)數(shù)據(jù)、如何通過(guò)實(shí)驗(yàn)驗(yàn)證來(lái)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注進(jìn)而得到高質(zhì)量的反饋數(shù)據(jù)仍然是限制AIGP大爆發(fā)的主要攔路虎?;诖?,開(kāi)源共享仍是目前行業(yè)企業(yè)們的主要選擇。

關(guān)鍵詞:

版權(quán)聲明:
    凡注明來(lái)網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來(lái)源:網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來(lái)源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考并自行核實(shí)。
熱文

網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
 

中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書(shū)面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號(hào):京ICP備2022016840號(hào)-15

營(yíng)業(yè)執(zhí)照公示信息