- +1
英國公布世界最大全基因組數(shù)據(jù)集,但不適用研究亞洲人健康問題
·除了全基因序列數(shù)據(jù)之外,數(shù)據(jù)庫還收集了50萬名志愿者身上超過10000項生物指標,包括血壓、認知功能、飲食和骨密度等。通過將這些數(shù)據(jù)聯(lián)系起來,研究者們就能夠探究精準醫(yī)療相關(guān)的問題,比如為什么帶有相同致病基因的人卻對同樣的治療有不同的結(jié)果、反應和副作用。
當?shù)貢r間2023年11月30日,英國生物數(shù)據(jù)庫UK Biobank公布了迄今為止世界上最大的全基因組序列(whole-genome sequence)數(shù)據(jù)集,包含近50萬人的基因數(shù)據(jù)。這些數(shù)據(jù)將通過UK Biobank的云平臺向全世界的申請者開放。
“對于從事健康研究的科學家來說,這個數(shù)據(jù)庫毫無疑問是一個寶庫。我期待全球的研究者們可以通過它做出診斷、治療和藥物方面的轉(zhuǎn)化性成果?!盪K Biobank的項目負責人、英國醫(yī)學科學院院士(FMedSci)Rory Colins教授在數(shù)據(jù)庫官方新聞中說。
UK Biobank開始于2006年,是一項由英國衛(wèi)生和社會福利部(DHSC)資助的長期生物樣本研究計劃。該計劃的目標是通過收集志愿者的基因、生物和健康數(shù)據(jù)來研究疾病和生物特征之間的關(guān)系。2010年,該計劃完成了對50萬年齡在40歲至69歲的英國居民志愿者的招募,并持續(xù)收集他們的生物樣本、全身掃描數(shù)據(jù)以及健康和生活方式數(shù)據(jù)。除此之外,在參與者同意的情況下,該數(shù)據(jù)庫還通過英國國家健康服務(UK National Health Service)所保存的醫(yī)療記錄來追蹤參與者的病史。UK Biobank稱,所有的數(shù)據(jù)均剝離了參與者的姓名、住址等個人信息。
在2012年之后,UK Biobank開始陸續(xù)發(fā)布測得的健康數(shù)據(jù)以及基因組數(shù)據(jù),包括DNA標志物掃描數(shù)據(jù)與外顯子組數(shù)據(jù)。2021年,UK Biobank發(fā)布了一個初步的全基因組數(shù)據(jù)集,包含20萬人的數(shù)據(jù)。而這次發(fā)布的數(shù)據(jù)在質(zhì)量和數(shù)量上均有提升,包含491554名參與者。據(jù)悉,UK Biobank此次項目受到英國政府、一家投資公司以及四家制藥公司共計2億英鎊(約合18億人民幣)的投資。
UK Biobank的數(shù)據(jù)通過其網(wǎng)絡研究分析平臺向全世界申請者開放。目前已有來自90個國家的超過3萬名研究者成功申請使用數(shù)據(jù)庫,并產(chǎn)生了超過9000篇經(jīng)過同行審議的研究論文。
全基因組數(shù)據(jù)助力精準醫(yī)療
通過研究全基因組序列,研究者們能夠發(fā)現(xiàn)基因的編碼和非編碼區(qū)域中生物特性與罕見基因變量之間的關(guān)系。編碼基因又稱“外顯子”(exon),能夠翻譯成蛋白質(zhì),而非編碼基因是指那些不直接負責蛋白質(zhì)合成的基因。這些基因占據(jù)了基因總數(shù)的98%,且對生物性狀具有重要調(diào)控作用。目前人們對非編碼基因還知之甚少,而這次公開的全基因組序列將成為研究它們的重要材料。
在這些數(shù)據(jù)的基礎(chǔ)上,研究人員有望以更高的成功率來開發(fā)藥物。目前全世界有超過四分之一的在研藥物因為藥效差而無法通過臨床試驗?!蹲匀弧みz傳學》(Nature Genetics)上刊載的一項研究顯示,包含直接基因證據(jù)的藥物機理研究對藥物研發(fā)至關(guān)重要,能夠提升兩倍的臨床試驗成功率。大數(shù)量的全基因組數(shù)據(jù)有助于研究人員發(fā)現(xiàn)疾病靶點,從而進一步明確疾病和藥物機理。
“這個里程碑式的數(shù)據(jù)集能夠讓我們借助人工智能的力量來快速識別新的疾病靶點,幫助研究者們根據(jù)基因來預測候選藥物對特定病患群體的影響。這將使得臨床醫(yī)學發(fā)展更加高效,使我們在通往精準醫(yī)療的道路上邁進一步?!睆娚镜膭?chuàng)新藥物研究部執(zhí)行副總裁John Reed博士評論道。
“精準醫(yī)療”(Precision Medicine)是目前公共衛(wèi)生領(lǐng)域炙手可熱的概念,于2008年由哈佛大學商學院一位教授提出,其基本含義是通過研究人的基因、環(huán)境和生活方式等因素之間的復雜關(guān)系,以制定出更加精準的治療方式。大數(shù)據(jù)基因組學是精準醫(yī)療的基礎(chǔ)之一,通過對比分析健康人群與患病人群基因的差別,研究者們能夠發(fā)現(xiàn)基因與疾病的關(guān)系,從而進行精準防治與個性化治療。
UK Biobank在官方網(wǎng)站上透露,除了全基因序列數(shù)據(jù)之外,數(shù)據(jù)庫還收集了50萬名志愿者身上超過10000項生物指標,包括血壓、認知功能、飲食和骨密度等等。通過將這些數(shù)據(jù)聯(lián)系起來,研究者們就能夠探究精準醫(yī)療相關(guān)的問題,比如為什么帶有相同致病基因的人卻對同樣的治療有不同的結(jié)果、反應和副作用。
多國部署全基因組計劃
盡管有著史無前例的樣本數(shù)量和參數(shù)數(shù)量,這一數(shù)據(jù)集仍然存在值得注意的缺陷。首先,參與計劃的志愿者在健康程度和社會經(jīng)濟地位上都要高于英國民眾的普遍水平。其次,在50萬樣本中大部分人是歐洲白人血統(tǒng),非洲血統(tǒng)和亞洲血統(tǒng)的志愿者只有各約1萬人。這意味著研究者們難以使用這套數(shù)據(jù)來研究非洲和亞洲人健康問題。
使用本國數(shù)據(jù)能更好反映當?shù)鼐用竦幕蛱卣骱蜕瞽h(huán)境。目前,多國正在開展收集海量居民健康信息的研究計劃。美國國立衛(wèi)生研究院(NIH)于2015年啟動All of Us研究計劃,目標收集100萬人的基因組學信息和其它生物信息,為精準醫(yī)療產(chǎn)業(yè)提供基礎(chǔ)。該計劃目前已公布25萬組全基因序列數(shù)據(jù),但是僅提供給美國的學者使用。該項目在2018年的預算為2.9億美元,約合20億人民幣。
中國也在積極加強精準醫(yī)學研究布局,在2016年公布的《“十三五”國家科技創(chuàng)新規(guī)劃》中部署構(gòu)建了百萬人以上的自然人群大型健康隊列、重大疾病專病隊列和罕見病的臨床隊列研究等,預計投資2.5億元。中國科學院生物物理研究所的徐濤院士與何順民研究員發(fā)起的“女媧”中國人群基因組計劃,是已發(fā)表的唯一高深度測序中國參考人群全基因組隊列,第一階段包含5000多例樣本。該項目于2023年8月15日發(fā)表了第四項研究成果。
參考文獻:
1. World’s largest genetic project opens the door to new era for treatments and cures: UK Biobank’s major milestone
https://www.ukbiobank.ac.uk/learn-more-about-uk-biobank/news/world-s-largest-genetic-project-opens-the-door-to-new-era-for-treatments-and-cures-uk-biobank-s-major-milestone
2. https://www.science.org/content/article/uk-biobank-releases-half-million-whole-genome-sequences-biomedical-research
https://www.science.org/content/article/uk-biobank-releases-half-million-whole-genome-sequences-biomedical-research
3. All of Us Research Program Overview
https://allofus.nih.gov/about/program-overview
4. 中國隊列研究建立和發(fā)展現(xiàn)狀
doi: 10.11847/zgggws1125238





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




