專題討論12:海量資料與雲端在醫療的運用與發展

程 序 表

S12-3
海量資料與基因庫之研究:基因體醫學中的巨量資料分析
莊曜宇
國立臺灣大學生醫電資所

  巨量資料分析是一個新興的科技潮流,目前已被廣泛的應用於各類學科及領域上,例如工業界、市場調查以及科學研究等等。在生物醫學研究上,高通量(high-throughput)的實驗技術已逐漸發展並趨向成熟,其中最主要的兩個技術為微陣列(microarray)及次世代定序(next-generation sequencing, NGS)可協助研究人員在短暫的時間中,一次性的檢測數以百萬的基因特徵。舉例來說,人類基因體定序計畫(Human Genome Project)共耗費了38億美金及超過十年的時間才正式完成,但次世代定序技術可以在十天內針對單一個體提供30億組的序列資料。因此,如何針對如此巨量的基因體資料進行有效率且準確的分析,已對生物學家及醫師產生巨大的困難與挑戰。為了解決這個困難,我的研究室目前正在開發一套雲端的次世代定序資料線上分析系統,其主要架構將建構於平行計算上以減少分析所需時間,另外我們希望透過這套系統提供一個簡單易懂的介面,讓非資訊背景的使用者能夠直觀的操作系統進行數據處理。除了這套雲端次世代定序資料分析系統外,我們已經利用高通量的基因體實驗技術及生物資訊方法研究了許多生物醫學上重要的領域及課題,例如癌症的基因體變化、放射基因體學及心血管疾病等等。我們的研究團隊已經開發出許多演算法及線上資料庫不僅可用於分析高通量基因體資料及癌症基因組改變情形,亦可協助研究人員闡述及解讀資料的生物及臨床醫學意義。在今天的演講中,我將利用我們過去的研究經驗作為例子來說明結合基因體技術與生物資訊方法將能夠加快癌症醫學研究的速度。此外,我亦將分享我們過去在食道癌上的轉譯醫學研究成果,我們可以透過兩個單核?酸位點來預測病患的治療效果,此研究成果已經獲得美國及台灣的專利。總結來說,在本次演講中,我將說明巨量資料分析在基因體醫學研究上的優勢與展望,以及要如何將基因體的巨量資料轉為可應用性的生物標記,以協助並改善疾病的診斷與治療。