中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

鄭偉|向未來“折疊”

2026-01-14 10:10
來源:澎湃新聞·澎湃號·政務
字號

不夸張地說,沒有蛋白質,生命就無法存在。蛋白質由20種標準氨基酸組合而成,它們通過不同的排列組合方式折疊成獨特的三維結構,并在細胞內發(fā)揮特定的功能,從而支撐人體的基本生命活動。這些蛋白質結構是如何形成的呢?過去幾十年,科學家一直致力于破解其中的折疊密碼。尤其當以德米斯·哈薩和約翰·江珀為代表的深度思維(DeepMind)團隊將人工智能技術應用于解決蛋白質折疊問題后,他們推出的阿爾法折疊(AlphaFold)算法驚艷亮相,AlphaFold2更是以近乎實驗手段解析的精度實現對蛋白質三維結構的精準預測。

▲鄭偉

“這是能獲得2024年諾貝爾化學獎的算法?!蹦祥_大學統(tǒng)計與數據科學學院教授鄭偉說。早在2020年,他就見證過AlphaFold2的一戰(zhàn)成名。那年,當AlphaFold2在第十四屆世界蛋白質三級結構預測大賽(CASP14)人工組一舉奪魁時,“隔壁”的自動服務器組,美國密西根大學張陽教授團隊也榮登榜首。彼時,鄭偉正在張陽團隊做博士后研究,是參賽算法的主要開發(fā)者之一。

“那年,AlphaFold2的算法精度出現了一個巨大的飛躍,給我們帶來極大的震撼,也讓蛋白質結構預測從一個相對小眾的研究領域變得越來越受重視。但它不是這個領域的終結者,相反,我們仍有許多問題要解決?!编崅フf。自那之后,他在基于深度學習及統(tǒng)計能量函數的生物分子及其互作的結構預測研究上日益精進。在他看來,蛋白質折疊里蘊藏著關于生命的奧秘,唯有不斷探索與創(chuàng)新,才能為人類健康與福祉貢獻力量。

探索“折疊”人生

南開大學是鄭偉的母校。

“高中時我特別喜歡數學,也因為敬佩陳省身先生,對南開大學十分向往?!编崅フf。2007年,他考入南開大學數學科學學院。根據專業(yè)培養(yǎng)范式,經過兩年系統(tǒng)學習后將進行學科方向細分,而鄭偉選擇了信息與計算方向。此前,時任信息與數據科學系系主任阮吉壽教授曾多次談到過生物信息學的相關進展,鄭偉發(fā)現,這是一門前沿交叉學科,可以將計算機、數學、生物、物理等多個方向融會貫通,挑戰(zhàn)性很強,但也極具生命力。鄭偉并不畏難,高中階段他就是個理科高手,曾多次參加數學、物理、化學、生物競賽,如果能在交叉融合間挖掘出新的“寶藏”,他樂在其中。

最早接觸蛋白質結構預測工具時,鄭偉正在追隨胡剛教授攻讀碩士學位?!拔耶敃r主要基于蛋白質結構的一些計算問題展開研究。”計算就需要工具,最初,鄭偉對統(tǒng)計工具、傳統(tǒng)算法、機器學習等進行了廣泛涉獵,他也是在當時讀到了張陽教授所研發(fā)的基于穿線法的蛋白質結構預測方法I-TASSER。這是一種綜合算法,比傳統(tǒng)單一算法的魯棒性和精度更高,能夠預測蛋白質結構并提供關于蛋白質功能的預測,經過不斷迭代更新,逐漸成為主流算法之一。自從2006年起,張陽團隊的I-TASSER算法系列就連續(xù)在CASP自動服務器組位居榜首,這也在鄭偉心中留下了深刻的烙印。

2014年,鄭偉碩士畢業(yè)后繼續(xù)在南開大學讀博,師從阮吉壽教授。第二年,團隊引入一位青年教師楊建益?!皸罾蠋熢诘鞍踪|結構預測方向頗有建樹,與他合作,我算是介入了這一領域。在他的推薦下,我得以加入密西根大學張陽教授團隊,開始系統(tǒng)學習蛋白質結構預測的基礎問題?!?/p>

“蛋白質主要由20種氨基酸組成,通常由英文字母來表示,而氨基酸分子里也含有很多原子。因此,蛋白質結構預測問題可以概括為:輸入一個由這些字母組成的氨基酸字符串,使用計算算法去預測蛋白質序列中每個氨基酸中的每個原子的三維空間坐標(x,y,z)?!编崅ソ榻B道。由于蛋白質只有在折疊成特定的空間構象后才能具備相應的活性和生物學功能,因此結構預測對于理解蛋白質功能、揭示疾病機制及進行藥物設計具有重要意義。傳統(tǒng)的結構解析依賴于X射線晶體學、核磁共振等實驗技術,不僅耗時長、成本高,還對實驗條件要求苛刻。而隨著計算機信息技術的發(fā)展,蛋白質結構預測進入新的階段,讓高精度、快速、低成本預測成為可能。

經過幾年學習后,當鄭偉踏上CASP賽程時,已經是團隊骨干成員了。在2018年舉行的CASP13中,他們將深度學習接觸圖預測引入“久經沙場”的I-TASSER,從而開發(fā)出C-I-TASSER算法,拿到服務器組第一名;兩年后的CASP14中,他們在蒙特卡洛模擬中引入深度學習預測的距離和氫鍵的約束,進一步開發(fā)出D-I-TASSER,再次在服務器組奪魁。

“其實,當時還只是這兩項算法的初版?!编崅フf。話雖如此,他卻已經折服于蛋白質結構預測所呈現出的力量,尤其當自己的一些工作可以成為新算法的基石,并在世界級比賽中拿到好成績,他產生了強烈的成就感。但緊接著,新的挑戰(zhàn)來了。

2021年年底,鄭偉得知一個消息:張陽教授即將離開密西根大學,課題組也將隨之解散。霎時間,“何去何從”成了鄭偉不得不面對的問題。更重要的是,要如何參加第二年舉行的CASP15呢?鄭偉的壓力很大。

“CASP14對整個學術界影響非常大,AlphaFold2的橫空出世讓人欣喜,又有點頹廢。欣喜是因為蛋白質結構預測真的能把精度做這么高,而且有人成功了;頹廢是總有人懷疑會不會以后在這個領域就沒有什么可做的余地了。”鄭偉說。在這種情況下,要應對CASP15本來就是個巨大的挑戰(zhàn),鄭偉也為此做了很多準備工作,可一旦課題組解散,他就不得不獨立參賽?!癈ASP比賽是這樣的,它會將新近通過實驗確定的蛋白質結構不斷‘釋放’出來作為團隊測試其結構預測方法的對象,每次測試任務都要在規(guī)定時間內完成,這個時間甚至可能只有3天。而整個賽程中,可能會‘刷’出幾十次任務?!?/p>

時間太緊張了,鄭偉沒有太多時間去猶豫。認真考慮后,他與密西根大學莉迪亞·弗雷多利諾副教授達成一致意見,進入她的實驗室?!袄虻蟻喞蠋熍c張陽老師有過不少的前期合作,對我的工作比較熟悉,很爽快地接納了我,并提供相應的研究經費?!本瓦@樣,在莉迪亞副教授的支持下,鄭偉與妻子烏云其其格合力迎戰(zhàn)CASP15。蛋白質結構預測非常繁瑣,要耗費大量算力,兩個人輪班的狀態(tài)下,他們每天只有五六個小時的休息時間,而這種狀態(tài)持續(xù)了4個月?!霸诜掌鹘M,按照高精度全局距離檢驗分值(GDT-HA)排名,我們又拿到了冠軍;而按照全局距離檢驗—總合分值(GDT-TS)排名,楊建益老師團隊排名更高?!编崅ソ榻B道。不僅如此,他在多結構域蛋白質結構預測和蛋白質復合體結構預測中也名列榜首。也是在這場比賽中,他發(fā)現,AlphaFold2似乎也不再是不可逾越的大山了,這令他愈發(fā)堅信蛋白質結構預測領域還有更多問題尚待發(fā)掘。他也帶著昂揚的斗志走向了CASP16,這一次,他成了真正的帶隊者。

“當預測精度在某些領域上難以精進,大家就會轉向其他新問題的研究?!编崅ケ硎荆贑ASP16中,他和團隊參加了多個賽道,并針對不同賽道構建了專門的算法來應對比賽。其中,他們在生物分子多構象預測、蛋白質核酸復合物預測、復合物整體折疊精度估計等算法上排名第一。值得關注的是,CASP16開賽一周后,AlphaFold 3服務器上線,當即有參賽團隊開始嘗試用其代替自己的算法,而鄭偉團隊是當時預測排名榜上唯一沒有使用AlphaFold 3的隊伍。

“這也是我回國之前最后一次參加CASP?!编崅フf。從張陽教授離開密西根大學,鄭偉就在考慮回國了,“但是找教職需要時間,我也有未完成的工作”。他與妻子都是從南開大學走出的學子,有著濃郁的母校情結,尤其當遠在國內的導師也詢問他要不要考慮回來時,南開大學就成了他們的首選。就這樣,在經過深度溝通與準備后,2024年年底,他重新站在了南開大學的校園里。

共建理想團隊

鄭偉所在的南開大學統(tǒng)計與數據科學學院(以下簡稱“學院”),正式設立于2018年,以“學科立院、人才強院、交叉互融”為辦學理念。近年來,學院依托傳染病溯源預警與智能決策全國重點實驗室、天津市醫(yī)藥數據分析與統(tǒng)計研究重點實驗室,成立了生物醫(yī)學平臺,致力于將統(tǒng)計和人工智能方法深入應用到生物醫(yī)學數據分析中。整個平臺包括生物統(tǒng)計學、生物信息學、計算機視覺與影像分析等5個研究團隊,鄭偉就是生物信息學團隊中的重要一員。他很欣喜地發(fā)現,可以在這一平臺上與不同領域的研究者開展深度合作,并向生命科學、臨床醫(yī)學、藥物研發(fā)、公共衛(wèi)生等領域進行應用探索。

▲鄭偉(前排左一)團隊合影

剛入職不到一周,鄭偉就收到了參加藥物化學生物學全國重點實驗室郭宇老師主持的學術沙龍的邀請。學術沙龍涵蓋了來自統(tǒng)計與數據科學學院、生命科學學院、醫(yī)學院、藥學院、化學學院的學者,可以通過講座、研討等形式交流。“我們互相探討在科研中遇到的問題,期望能碰撞出熱烈的火花。”鄭偉很喜歡這種學科互融的氛圍,并在其中找到了不少志同道合的合作者,他認為這樣的開端,對于他開展后續(xù)工作大有裨益。

“當我以青年教師視角來看母校時,感覺與學生時代有點不太一樣。但沒過多久,適應了節(jié)奏之后,熟悉的感覺又回來了?!编崅ズ芟矚g這種親切感。出國這些年,他與南開大學之間的連接并未中斷。在他帶隊迎戰(zhàn)CASP16期間,南開大學也是他重要的合作團隊之一,而他的碩士導師、數據科學系系主任胡剛也推薦了一些學生到他的團隊中學習交流?!暗@種指導與系統(tǒng)培養(yǎng)學生并不相同,回來之后,一切都要從頭開始。”

作為一位新晉博導,鄭偉入職時已經錯過了第一批博士生招生。到第二批招生啟動時,他的申請報告遞交后,第一時間就得到了研究生院及前沿交叉學科研究院的批復。對于獲得的支持,鄭偉很是感激。如此一來,加上在他名下聯合培養(yǎng)的碩士和博士生,他也初步形成了一個將近10人的團隊。

“做科研有時候可能有點辛苦,有點枯燥,心態(tài)不好特別容易鉆牛角尖。真正熱愛科研,由衷地會因做科研而開心,才是長久的動力?!编崅ハM軌虼蛟煲粋€朝氣蓬勃的團隊,期望團隊成員能夠樂觀積極、不受桎梏地去自由探索。“學術態(tài)度要嚴謹,但學術風氣盡量自由?!?/p>

暑假之前,除了定期去給本科生上課,鄭偉每周都要組織大組討論會,針對蛋白質結構預測相關進度展開。此外,他還要處理合作對接事宜,并對學生進行一對一指導。假期里,他反而有了更多時間去參加學術會議,也會根據情況帶學生前往交流。

鄭偉更強調“一起”,對這位年輕導師來說,他更習慣將自己定位為朋友和師兄,給予學生方向上的指引和建議,幫他們明確責任和意義,找到自己的目標,也和他們一起去看“外面的世界”。在他的理想中,這個團隊具有團結、務實、自由、協(xié)作的精神內核。隨著科研計劃逐步鋪開,鄭偉也歡迎更多對生物信息學感興趣的成員加入,他們將共建這個理想的團隊。

走向應用落地

2025年5月,鄭偉以第一作者在《自然·生物技術》發(fā)表了重要研究成果。該研究開發(fā)了一種融合深度學習空間約束與統(tǒng)計能量函數的蛋白質結構預測算法——D-I-TASSER,實現了超越AlphaFold算法的高精度蛋白質結構預測。

“AlphaFold存在兩個主要的短板?!编崅フJ為,一是對孤兒蛋白(同源序列較少的蛋白質)的預測效果仍不理想;二是難以處理由多個結構域組成的復雜蛋白質。D-I-TASSER正是為應對這兩個難題而設計的。早在CASP15期間,它就展現出在復雜蛋白結構預測中的領先優(yōu)勢。在困難單結構域蛋白預測問題中,D-I-TASSER在84%的案例中生成了比AlphaFold2質量更高的結構模型;在多結構域蛋白結構預測問題中,D-I-TASSER的全鏈預測精度較AlphaFold2提升了近12.9%。不僅如此,當D-I-TASSER對人類基因組的蛋白質進行結構和功能預測(基因本體標簽、酶分類和小分子結合位點)后,結果顯示,它能夠成功預測80.5%的單結構域和72.8%的全鏈蛋白質結構,并準確預測了其中3020個令AlphaFold2難以預測的蛋白質,彰顯了其在彌補結構預測盲區(qū)的價值。

▲鄭偉(左三)帶領學生參加第三屆全國生物分子結構預測與模擬學術會議

沒有最好,只有更好?;貒?,鄭偉依舊要圍繞蛋白質結構預測算法進行拓展研究。“蛋白質結構預測問題其實還沒有完全解決,很多工作都要繼續(xù)開展,比如多結構域蛋白質結構預測、蛋白質復合物結構預測,甚至更為復雜的生物分子動態(tài)變化預測等,大多都處于起步階段。我希望能與相關學者共同努力,將國內蛋白質結構預測研究做大做強。”

鄭偉另一項想要大力推進的工作則是落地應用。這些年來,他所研發(fā)的系列算法已累計服務超過100個國家的近10萬名用戶。但他更想看到實實在在的技術轉化。以D-I-TASSER算法為例,它不僅能助力理解蛋白質折疊與功能,也在抗體篩選與優(yōu)化、罕見病致病基因識別、病毒感染性預測、輔助冷凍電鏡結構解析等任務中取得了初步進展。“我們做這么多算法,最終是希望它們能服務于生命科學研究,并幫助企業(yè)去解決藥物研發(fā)過程中所遇到的問題。”

2025年年初,在國家自然科學基金數學天元基金項目交叉重點專項的支持下,鄭偉啟動了“結合高維統(tǒng)計與人工智能的抗體類藥物篩選、優(yōu)化及脫靶研究”,針對可感染人的病原體,使用蛋白質結構預測計算手段,加速中和抗體類藥物的研發(fā)進度。與此同時,在南開大學“百名青年學科帶頭人培養(yǎng)計劃”、傳染病溯源預警與智能決策全國重點實驗室的資助下,他所主持的“蛋白質結構與功能的預測與應用研究”和“基于新型人工智能及蛋白質復合物結構預測的X病毒早期發(fā)現預警”也在有條不紊地展開。

“這些項目之間存在一定的聯系。蛋白質結構預測可以貫穿在傳染病防控及相關藥物研發(fā)的整個大流程中,我們想做的是利用蛋白質結構預測工具去探索新型疾病,一旦有傳染可能,就要及早布控、主動防御,避免新疫情初期引發(fā)的被動局面?!睂︵崅ザ裕壳白畲蟮耐袋c就是開展蛋白質結構預測面臨的海量算力缺口,他正在努力開展各方嘗試,希望能處理好這個棘手的問題,真正打開局面。而在這之余,他還要為明年可能舉行的CASP17做好籌備。

工作很忙,但一想到剛回國就能開展這樣的課題研究,鄭偉就很激動?!八惴ㄩ_發(fā)時一般是用模擬數據來測試,真正到生物醫(yī)藥實踐中面臨的問題會更復雜,這些工作能讓我有機會去與相關研究機構和藥企產生碰撞,從而探索如何在醫(yī)藥研發(fā)領域落實這些算法。這很重要。”在他眼中,那些大大小小的蛋白質結構中,折疊出的是通往健康中國的未來。

專家簡介

鄭偉,南開大學統(tǒng)計與數據科學學院教授,傳染病溯源預警與智能決策全國重點實驗室成員。入選國家級青年人才項目。擔任蛋白質預測結構文件存儲格式(ModelCIF)國際標準制定委員會委員、《分子》雜志特約編輯,《自然·通訊》《自然·機器智能》《自然·計算科學》等期刊審稿人。長期從事于基于深度學習及統(tǒng)計能量函數的生物分子及其互作的結構預測研究,開發(fā)的算法多次在國際蛋白質結構預測競賽(CASP)名列前茅,已服務于100多個國家的近10萬名用戶。在《自然·生物技術》《自然·方法》《自然·通訊》《美國科學院院刊》等高水平科學引文索引(SCI)期刊發(fā)表文章50余篇,累計引用3800余次。主持國家自然科學基金-數學天元基金項目交叉重點專項等項目,入選南開大學“百名青年學科帶頭人培養(yǎng)計劃”。

    本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業(yè)務經營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司