驅(qū)動(dòng)中國(guó)2017年12月11日消息 上周,谷歌發(fā)布了一款DeepVariant程序工具,它具備先進(jìn)的AI深度學(xué)習(xí)能力,能利用測(cè)序數(shù)據(jù)拼湊更精準(zhǔn)的人類基因圖譜,還可以精確識(shí)別DNA序列中的突變。這也是15年前科學(xué)家對(duì)人類基因測(cè)序后,首次實(shí)現(xiàn)計(jì)算機(jī)工具來(lái)解碼基因數(shù)據(jù)。 據(jù)悉,DeepVariant可實(shí)現(xiàn)將高通量測(cè)序所測(cè)區(qū)的數(shù)據(jù),轉(zhuǎn)換成完整的基因組圖像。其可以自動(dòng)識(shí)別測(cè)序數(shù)據(jù)中的插入基因、缺失突變以及單堿基對(duì)變異。之前,科學(xué)家所運(yùn)用的高通量測(cè)序,雖然可以讓基因測(cè)序更容易實(shí)現(xiàn)。不過(guò),這一測(cè)序方法所提供數(shù)據(jù)有限且易出錯(cuò)。 目前, 科學(xué)家普遍使用的測(cè)序方法有: GATK、 VarDict 和 FreeBayes。不過(guò)這些工具都是通過(guò)排除讀取錯(cuò)誤來(lái)鑒別突變。像使用最廣泛的GATK,就是通過(guò)簡(jiǎn)易的人工設(shè)計(jì)的算法來(lái)測(cè)序。不過(guò),谷歌推出的DeepVariant借助AI神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建基于圖像要比這些方法都要更精確。 谷歌的研究團(tuán)隊(duì),試著將DNA測(cè)序數(shù)據(jù)轉(zhuǎn)換成一個(gè)圖像從而利用圖像識(shí)別技術(shù)來(lái)建立更精確的DNA序列??茖W(xué)家還對(duì)數(shù)百萬(wàn)份基因組測(cè)序以及高通量測(cè)序法進(jìn)行了研究,來(lái)教會(huì)DeepVariant哪些數(shù)據(jù)重要,哪些可以忽略。 據(jù)DeepVariant的創(chuàng)造者來(lái)自哈佛大學(xué)公共衛(wèi)生學(xué)院的Brad Chapman教授介紹,“其中一個(gè)挑戰(zhàn)在于基因組的復(fù)雜片段,每種工具都有優(yōu)缺點(diǎn)。這些復(fù)雜區(qū)域?qū)εR床測(cè)序異常重要,使用多種方法很有必要。” 谷歌此次發(fā)布的DeepVariant,在之前由三種顏色和三種數(shù)據(jù)組成的基因圖像在新發(fā)布的版本中達(dá)到了7種,可以更精準(zhǔn)的表示基因數(shù)據(jù)信息。此外,DeepVariant目前還是款開(kāi)源軟件,其他研究人員也可以使用DeepVariant進(jìn)行基因測(cè)序的研究。
|