【柳三變專欄】世界上最大的人類基因組序列開放

埃文·卡拉威Ewen Callaway發表在最新一期《自然》(Nature)的<世界上最大的人類基因組序列向科學家開放>(World’s biggest set of human genome sequences opens to scientists)指出,英國生物銀行 50 萬人的整個基因組將幫助研究人員探索我們的遺傳密碼與疾病的關聯。(The whole genomes of 500,000 people in the UK Biobank will help researchers to probe our genetic code for links to disease.)
世界上最大的完整人類基因組庫剛剛上線。
英國生物銀行——健康、基因組和其他生物數據的儲存庫——今天發布了資料庫中 50 萬英國志願者的完整基因組序列。世界各地的研究人員可以申請訪問這些缺乏可識別細節的數據,並利用它們來探索健康和疾病的遺傳基礎。
「科學家們正在像谷歌地圖一樣看待這個問題,」英國生物銀行執行長羅裡·柯林斯在新聞發布會上說。“當他們想知道從生活方式、環境、遺傳學到疾病的途徑是什麼時,他們不會去谷歌,而是去英國生物銀行。”
繼 2021 年發布 20 萬名生物銀行參與者的全基因組之後,今天的財富發布了每位英國生物銀行參與者的完整 30 億個字母的基因組序列。這項耗資 2 億英鎊(2.5 億美元)的工作由生物醫學研究資助機構 Wellcome、英國政府和幾家製藥公司資助,作為回報,這些公司在數據廣泛發布前 9 個月獲得了這些數據。
此前,英國生物銀行的遺傳訊息包括整個「外顯子組」——每個外顯子組是編碼蛋白質的基因組的2%——在此之前,還包括分佈在整個基因組中的850,000 個常見的單字母DNA 變異。後者資訊為連結健康和遺傳學的全基因組關聯研究(GWAS)提供了動力。
罕見的變異能讓我們對生物學有更多的了解
但是,當研究人員尋找遺傳學與疾病或其他性狀之間的關聯時,大多數「命中」出現在基因組的非編碼區域中,這些區域在外顯子組序列中缺失,並且在現有全基因組數據中僅以低解析度覆蓋。英國埃克塞特大學的人類遺傳學家 Michael Weedon 表示,整個基因組也使研究人員能夠發現非常罕見的突變,這些突變對性狀的影響往往比全基因組數據中包含的常見變異更大。“我們希望罕見的變異能讓我們對生物學有更多的了解。”
事實已經證明確實如此。在 11 月 20 日的預印本1中,Weedon 和同樣來自埃克塞特的人類遺傳學家Gareth Hawkes 領導的團隊挖掘了英國生物銀行數據中的前200,000 個完整基因組,發現了29 個罕見的DNA變體,這些變體與高達 7 的有關。身高差異 這些變異在先前的基因研究中並未被發現。Weedon 說,這項研究是分析所有 50 萬個基因組的試點,他計劃花一天時間先查看基因組數據。
超過 50 萬個完整基因組才能繪製罕見基因變異圖譜
Weedon 表示,最終,研究人員將需要超過 50 萬個完整基因組來全面繪製罕見基因變異與健康之間的關聯圖譜。“我認為這是獲取我們可能需要的數百萬樣本的良好下一步。”
這些數字即將到來。由美國政府資助的「我們所有人」研究計畫最終發布來自 100 萬或更多美國人口的全基因組和健康數據。該計畫已經發布了 25 萬個基因組,但直到 8 月才開始接受非美國研究人員的數據研究申請。研究人員表示,「我們所有人」等資料庫也將有助於確認與英國生物銀行發現的關聯。
赫爾辛基大學統計遺傳學家 Andrea Ganna 根據從英國生物銀行前 20 萬個基因組中了解到的信息,尚不相信它們能帶來多大的經濟效益。Weedon 和 Hawkes 等全基因組研究發現的許多非編碼變異接近透過GWAS發現的命中結果。儘管如此,完整的基因組序列可能有助於研究人員更準確地繪製疾病與結構變異(缺失、額外或翻轉的 DNA 區塊)之間的聯繫,Ganna 說。
柯林斯說,英國生物銀行已經發布了 9,000 多種出版物,最新版本的真正影響可能在一段時間內尚不清楚。“我想我們會驚訝地發現有多少結果是我們從未想像過的。”