“測(cè)序技術(shù)抓住了生命科學(xué)技術(shù)的龍頭,基因組測(cè)序成本從最初的3000萬(wàn)美元下降到1000美元甚至更低,使得每個(gè)人都可能為自己進(jìn)行基因組測(cè)序,這將加速生命數(shù)字化的進(jìn)程。”6月21日,2019測(cè)序技術(shù)和應(yīng)用高峰論壇上,中國(guó)科學(xué)院院士楊煥明表示,在高通量測(cè)序技術(shù)自主化的基礎(chǔ)上,不斷有新的“黑科技”跟進(jìn),這使得人們將獲得更加準(zhǔn)確的基因序列,作為生命數(shù)字化的“藍(lán)本”。
吐口唾液就能測(cè)序,但基因組序列不完整
吐口唾液郵寄,一個(gè)人的基因組序列就會(huì)得到分析。
“目前從全世界范圍來(lái)講,大概有接近2000萬(wàn)人有自己的基因信息。”華大智造首席運(yùn)營(yíng)官蔣慧表示,隨著這些年測(cè)序技術(shù)的普及,測(cè)序的門(mén)檻越來(lái)越低,人們?cè)絹?lái)越容易對(duì)自己的基因進(jìn)行部分測(cè)序。
但并不是所有的測(cè)序都是獲得完整的基因組序列。蔣慧介紹,大部分此類(lèi)的測(cè)序是對(duì)特定區(qū)域的測(cè)序,而并不是整個(gè)基因組序列的測(cè)序。
如果將一個(gè)人的基因組比喻成一座奇峰險(xiǎn)峻的高山,可以理解為,有些測(cè)序只是拍攝了“一線天”“巨石陣”“黑龍?zhí)?rdquo;這些有代表性的景點(diǎn);更完整地是,有些測(cè)序是把所有的景點(diǎn)拍下來(lái),被稱(chēng)為“功能基因集”;而完整的基因組測(cè)序才是把高山全部拍下來(lái),包括像荒草一樣叢生的“沙漠基因”或者“無(wú)功能基因”等。
無(wú)疑,要實(shí)現(xiàn)生命數(shù)字化,需要的是把高山全部拍下來(lái)的完整的基因組測(cè)序。
但目前的測(cè)序,即便是基因組測(cè)序,仍舊不能滿足生命數(shù)字化的需要。“目前無(wú)論是數(shù)據(jù)庫(kù)構(gòu)建,還是群體研究、疾病研究,都是采用重測(cè)序的方式,是通過(guò)與參考基因組的比對(duì)獲得的,而不是從頭組裝。”蔣慧說(shuō),比如在炎黃基因組研究項(xiàng)目中,科學(xué)家找到了大概有4—5兆的區(qū)域是個(gè)體所特有的,進(jìn)行測(cè)序時(shí)就對(duì)個(gè)體區(qū)域比對(duì),形成測(cè)序數(shù)據(jù),這是受測(cè)序效率制約的。
可以理解為,每一座高山的形狀、代表性景點(diǎn)都相似,就先找了最具代表性的山做個(gè)詳細(xì)的“數(shù)字化解讀”,描述其他山的時(shí)候,就用差異來(lái)體現(xiàn)。
“或許每個(gè)人擁有屬于自己的特點(diǎn)序列,但目前的測(cè)序方式難以發(fā)現(xiàn)這些獨(dú)特部分。”蔣慧說(shuō),與參考基因組比較獲得的基因組測(cè)序“密碼”不會(huì)對(duì)這些未知謎題給出答案。
從頭組裝,完成整個(gè)基因鏈條的拼接
數(shù)字化生命實(shí)際上需要一個(gè)高清、完整的基因組作為“藍(lán)本”。這意味著需要高質(zhì)量地從頭組裝基因組。
“目前最大的難點(diǎn)是獲得盡可能長(zhǎng)的序列進(jìn)行組裝。”蔣慧說(shuō)。如果單次測(cè)序讀長(zhǎng)變長(zhǎng),那么獲得從頭組裝基因組的難度就會(huì)降低。
人類(lèi)基因組長(zhǎng)度為30億個(gè)堿基對(duì),而現(xiàn)在單次測(cè)序的讀長(zhǎng)僅為50—70kb(5萬(wàn)到7萬(wàn)個(gè)堿基對(duì)的長(zhǎng)度),這猶如拼一副45000塊拼圖,其中卻有很多重復(fù)相似的“小塊”,很難拼接完整。不僅需要以參考基因組做對(duì)比,還要反復(fù)測(cè)序。“目前的行業(yè)標(biāo)準(zhǔn)是需要30倍的重復(fù)測(cè)序,以完成整個(gè)基因鏈條的拼接。”蔣慧說(shuō)。
如果將短片段加上標(biāo)簽就不一樣了。玩過(guò)拼圖的人都知道,在成千塊的拼圖背面會(huì)有不同的區(qū)塊標(biāo)記,提示這些塊在同一區(qū)域。
“以專(zhuān)有DNA分子共標(biāo)簽技術(shù)為基礎(chǔ)的stLFR(單管長(zhǎng)片段)技術(shù)就是基于這樣的原理。”蔣慧說(shuō),華大智造的這一自主技術(shù)通過(guò)將來(lái)源于同一DNA長(zhǎng)片段的短讀長(zhǎng)測(cè)序片段標(biāo)記上相同分子標(biāo)簽,能夠基于高精度短讀長(zhǎng)測(cè)序獲取長(zhǎng)片段的DNA信息。
讀長(zhǎng)是為了確定他山之石的位置,如果標(biāo)簽可以解決定位問(wèn)題,將彌補(bǔ)短讀長(zhǎng)的弱點(diǎn)?;诖耍瑥念^組裝兩條染色體,獲取二倍體測(cè)序數(shù)據(jù)也成為可能。
與此同時(shí),華大智造將執(zhí)行能得到從頭測(cè)序基因組的“676”標(biāo)準(zhǔn)?;谶@些數(shù)據(jù),可以檢測(cè)所有類(lèi)型的結(jié)構(gòu)變異,且無(wú)需與參考基因組進(jìn)行比對(duì),將大大提高基因組數(shù)據(jù)的參考性,最終幫助個(gè)體進(jìn)行復(fù)雜疾病的診斷和預(yù)測(cè)。
蔣慧介紹:“我們首先會(huì)用新的技術(shù)、新的標(biāo)準(zhǔn)在全球完成1000個(gè)人的基因組測(cè)序,希望可以建出來(lái)一個(gè)模板讓大家先試用一下,以在不同人群中創(chuàng)建高質(zhì)量的參考基因組和更為完整的人類(lèi)基因組多樣性數(shù)據(jù)庫(kù),構(gòu)建一個(gè)全新的數(shù)據(jù)集。這些數(shù)據(jù)將免費(fèi)向研究人員開(kāi)放。”
解讀生命,別忘了體內(nèi)的微生物
2018年,《自然》發(fā)表了一篇“為了生孩子把貓狗扔掉”的報(bào)道,成為科普文章的爆款。文中顯示,加拿大科學(xué)家研究了770個(gè)嬰兒的腸道菌群,發(fā)現(xiàn)家中有寵物的嬰兒,其腸道菌群多樣性明顯高于家中沒(méi)有寵物的嬰兒;瑞典調(diào)研100多萬(wàn)兒童發(fā)現(xiàn),與狗狗生活在一起的小孩子得哮喘病的風(fēng)險(xiǎn)能降低13%。
人體是一個(gè)龐大的共生體。人體皮膚表面、口腔、呼吸道、腸道生存著大量微生物,它們的數(shù)量是人體本身細(xì)胞的數(shù)十倍,編碼的基因是人體基因的100倍。每個(gè)人的經(jīng)歷會(huì)以微生物的痕跡留在身體里,而人體的健康會(huì)與體內(nèi)的菌群休戚與共。人們將特定環(huán)境中包括微生物在內(nèi)的總DNA稱(chēng)為宏基因組。
數(shù)字化生命中,人體與微生物的作用和關(guān)聯(lián)如果得到客觀地反映,甚至可能反映生命的進(jìn)程。例如,老年人腸道內(nèi)變形菌門(mén)、黏膠球形菌門(mén)、擬桿菌屬等含量會(huì)降低。“為此,我們?cè)谂c瑞典卡洛林斯卡醫(yī)學(xué)院的微生物轉(zhuǎn)化醫(yī)學(xué)研究中心做了一個(gè)合作,啟動(dòng)了萬(wàn)人微生物研究項(xiàng)目,將對(duì)一萬(wàn)人的宏基因組進(jìn)行測(cè)序。”蔣慧說(shuō),“微生物是人體內(nèi)另外一套基因組,除開(kāi)自己的基因組之外,我們的身體就像一個(gè)小社會(huì),大家平時(shí)和環(huán)境做一些接觸、吃的各種東西,人體內(nèi)的病原或者微生物都會(huì)反映出來(lái)。”
依據(jù)計(jì)劃,萬(wàn)人宏基因組測(cè)序?qū)⒃?個(gè)月內(nèi)完成??辶炙箍ㄡt(yī)學(xué)院之前已經(jīng)收集了大量的樣本,華大智造將負(fù)責(zé)完成數(shù)據(jù)產(chǎn)出,以及產(chǎn)出后的數(shù)據(jù)分析和疾病關(guān)聯(lián)的工作。
DNA是本源,但還需其他參數(shù)
未來(lái),數(shù)字化生命還有很多基礎(chǔ)性工作要做,比如要了解基因和表型是什么關(guān)系,構(gòu)建模型以研究生活習(xí)慣、疾病與特定基因表達(dá)的相互關(guān)系……
但歸根結(jié)底,遺傳性的DNA信息是不會(huì)再改變的,它不像其他一些因素,比如人體內(nèi)的一些微生物會(huì)隨著環(huán)境、飲食發(fā)生一些變化。最源頭的遺傳,來(lái)自于父親和母親的基因組不會(huì)再變化,是一個(gè)本源核心的東西。“華大集團(tuán)有一個(gè)非常宏大的計(jì)劃叫做8B(80億人的高清基因測(cè)序),我們希望在未來(lái)通過(guò)努力讓每個(gè)人都有自己的基因組數(shù)據(jù)。”蔣慧說(shuō)。
“這些需要一步一步去實(shí)現(xiàn),DNA是本源、是核心,但我們還會(huì)有很多其他的生命數(shù)據(jù),包括蛋白、代謝等。”蔣慧說(shuō),除了基因組數(shù)據(jù),還可以加入很多現(xiàn)有的醫(yī)學(xué)資料,例如體檢時(shí)的血液常規(guī)性篩查,可穿戴設(shè)備上的數(shù)據(jù)等,把這些所有的數(shù)據(jù)收集起來(lái),逐步完成生命數(shù)字化的過(guò)程。(張佳星)
近日,蘭博基尼汽車(chē)有限公司宣布Urus車(chē)型在國(guó)內(nèi)正式上市,該車(chē)型搭載了4 0L V8雙渦輪增壓發(fā)動(dòng)機(jī),使其0-100km h加速時(shí)間僅需3 6s,而最高更多
2018-01-08 15:23:45