【醫療AI】發展精準醫療(Precision medicine)為什麼必須要有人工智慧的參與?
精準醫療(Precision Medicine)的概念源自於九零年代的人類基因體計畫(HumanGenome Project),在歐巴馬總統大力推廣下,「精準醫療計畫」(PrecisionMedicine Initiative)收集了近 100萬人的基因資料,除了了解癌症與基因的致病機轉,也持續地研究遺傳變異和疾病形成的相關性。
根據定義,精準醫療是一種「整合個人基因型、基因表現及臨床資料,讓患者和醫療團隊可以選擇最適合個人使用之內外科治療方法或預防的方式」。因此,具備處理基因定序資料的運算技術是精準醫療的基礎,有了個人的基因資料,科學家就能夠預先判斷每個人對特定蛋白質或藥物的效果。對於某些罕見疾病,除了可以進行產前診斷,甚至還能夠針對特定的蛋白質或受器設計藥物,達到「個體化的醫療」提升藥物最大療效,且最大程度地降低副作用。
根據調查,精準醫療相關的領域在 2022年可創造1780億美金以上的市場,有將近六成的氣喘病與糖尿病患者,未來都能改用針對個人設計的藥物,進行精準治療;有將近6%因為藥物相關副作用入院的患者,在不久的未來也能因為入院前的基因檢測,避開錯誤的藥物選擇。對製藥產業、生化產業、生物科技、基因解碼與基因治療等領域,都開創了全新的機會與極大市場。
基因資料龐大且繁雜,適合人工智慧發揮
人體基因解碼的大數據是精準醫療的基礎,但如此龐大的資料庫很難用傳統的方式從中抽取出有意義的資訊。以「人類基因體計畫」中蒐集的資料為例,人體23 對染色體中所有DNA的序列,有將近 31.7 億組鹼基對,每個鹼基位有 A、T、C、G 四種可能,其中有 3 萬至 3.5萬已知具功能的基因對,有許多基因所產生的蛋白質也會相互調控。個體的基因圖譜資料可能就達數百GB外,還往往需要與龐大的蛋白質資料庫比較。基因分析的工作涉及重複性相當高的試誤過程,是非常適合人工智慧的題目。
根據估計,僅僅五年前,我們因數位技術所產生的總資料量為 4.4 ZB(4.4 X 109TB),如今這個數字增加了四倍以上,到了 2025年時,相關資料的數量將會是 10 倍之多。隨著基因解碼的重要性不斷增加,基因分析報告在未來將會是病歷上的個人基本資料,成為下個世代的基礎臨床資料,對具分析能力的人工智慧的需求也會大增。
AlphaFold 2在短短的幾個禮拜內,就預測了人類所有已知蛋白質的結構。
精準醫療需要人工智慧處理資訊的極高效率
過去分析蛋白質的結構,非常繁瑣。要完整分析特定的蛋白質,需要整合低溫電子顯微鏡(cryo-electronmicrosopy,cryo-EM)、X光晶體學(x-ray crystallography)或核磁共振的影像,才能取得成果。但這些影像技術往往非常的貴,且需要曠日廢時的分析。研究單一蛋白質的結構,就可能需要花費數十萬美元的經費和數年時間的反覆實驗,而且研究方法並不適用於其他的蛋白質。
DeepMind 近日與歐洲生物資訊研究所(EMBL-EBI)合作,將AlphaFold DB 中的蛋白質預測結構數量,從 100 萬擴充到 2億,這幾乎涵蓋了目前人類已知的所有蛋白質,在此之前我們只了解了約17萬種蛋白質的結構。DeepMind所建置的 AlphaFold 2 的準確度中位數達到 92.4%,就算是最難的自由建模類的蛋白質,AlphaFold 2的準確度中位數也高達 87 %。
另外像是 Atomwise 的 AtomNet平台,能夠根據蛋白質結構篩選出具有藥物潛力的化合物,速度比人工篩選要快上一萬倍、比目前最先進的高通量篩選快一百倍,單日就能篩選超過一千萬種化合物,能加速縮短藥物研發週期到數月甚至數年,意味著節省了幾十億美金的成本。
另外像是 Atomwise 的 AtomNet平台,能夠根據蛋白質結構篩選出具有藥物潛力的化合物,速度比人工篩選要快上一萬倍、比目前最先進的高通量篩選快一百倍,單日就能篩選超過一千萬種化合物,能加速縮短藥物研發週期到數月甚至數年,意味著節省了幾十億美金的成本。
在這兩個例子中,人工智慧展現的超高效率,是任何研究人員都無法達到的程度。人工智慧可以幫研究人員執行大量重複且繁雜的任務,能夠有效增進研發速度。
Atomwise 的 AtomNet 平台,運用影像辨識技術,不須local ligand data,就能篩選出可能與蛋白質結合的藥物分子。
人工智慧的判斷力能夠持續累積 是精準醫學進步的基礎
根據成大醫院資訊長蔣榮先教授在《從AI到智慧醫療》提及,「任何一位醫師,都有體能或記憶力的限制,不可能精準地記得每一篇醫學文獻中的記載或是每一個醫療案例。醫師可能會因為看診而疲勞、有診斷的盲點或偏見,甚至是生病的時候,使得患者得到品質不一的判斷力。」尤其是精準醫療領域相關的研究與資訊,在未來會持續爆炸性增加,醫療人員想要與時俱進,必須仰賴人工智慧驅動的專家系統協助。
人類醫師隨著年齡增長,雖然經驗上會越來越成熟,但判斷力和思考能力會隨著體力下降而受到影響。人工智慧的成長曲線則完全相反,隨著資料增加,會不斷地自我修正,隨著時間增長,判斷力越來越精確,沒有疲倦的問題,能夠穩定地、精確地大量分析各種醫療資訊。因此越早將人工智慧導入工作流程的醫療院所,會越早取得成熟的人工智慧運算模型。
生醫界每週會產出約五萬篇新的論文與案例報告,人類醫生不可能通通讀過,但經過訓練的人工智慧不但可以讀過,還能為醫療人員做出精簡的報告。即便是小型的診所或研究單位,也能參與聯邦學習獲得訓練人工智慧模型的好處。對於醫療院所來說,對人工智慧投注的成本與心力可以隨著時間持續累積,也不會因為人員離職後就需要重新再來。對有意願發展精準醫學的醫院或研究單位來說,將資源投注於人工智慧是更為永續的選擇。
你也想知道文章中 Atomwise 如何應用人工智慧搭建 AtomNet,將圖像辨識技術用於辨識蛋白質結構嗎?請看影片:
【參考文獻】
- Learn about our award-winning AtomNet® technology, and how it gives superpowers to medicinal chemists
- Highly accurate protein structure prediction with AlphaFold
- AlphaFold Protein Structure Database
- Artificial intelligence powers protein-folding predictions.