醫療人工智慧-診斷AI 第一週筆記 中

螺絲

螺絲

延續上一篇所討論的我們在應用人工智慧到醫療上時會遇到三個主要的挑戰

1.Class Imbalance

2.Multi-task

3.Data Size

沒寫完的部分這一篇將從剩下的兩個挑戰開始寫起:Multi-task和Data Size。

Multi-task

在一開始的例子當中,我們只以有腫塊和沒有磚塊來做區分,但是現實生活中的醫學影像卻是不只有兩種情況,就如胸腔X光來說,可能會發現有許多可能的疾病,例如:腫塊、肺炎、肺積水…等。

像是這樣當我們想要測試的疾病不只一種的時候這樣就是屬於Multi-task的問題,我們必須要建立一個具有處理Multi-task(多重任務)問題能力的模型。

                                                           from deeplearning.ai AI for Medical Diagnostic course

如圖中所示加入我們要在X光胸腔S光分辨腫塊肺癌和飛機隨時我們可以看到左邊所顯示的是每一張圖片的desired label 右邊的話是機器給的prediction probability值,這時候計算多重任務的Loss時他只要像右上角說顯示的一樣將各別的Loss值相加就可以。這樣所計算出來的加總過後的Loss就會是訓練更新模型的Loss。

當然像這樣一次處理許多疾病,在收集資料的時候也有可能出現比重不均的情況,所以在多重任務的情況下也可以使用上一篇第一點(Class Imbalance)所提到的加上權重。

                                                                 from deeplearning.ai AI for Medical Diagnostic course

Data Size

在影像醫學的人工智慧領域當中有許多的研究是以CNN(Convolutional Neural Network)來建立神經網路模型,其中CNN Architectures: Inception-v3, ResNet-34, DenseNet, ResNet, EfficientNet…等,都是很受歡迎的。

題外話:我前幾天找到這篇文章詳細比較了許多不同的CNN Architectures,裡面還有包含原始的研究論文,有興趣可以點進去看。https://towardsdatascience.com/illustrated-10-cnn-architectures-95d78ace614d

然而這些網路是需要大量的label data下去做訓練才會有比較好的效果。通常在醫學影像的領域當中,在處理影像時只會包含10,000到100,000個不同的樣本,像這樣的資料量相對在其他領域例如分辨貓和狗的影像來說是非常少的,就是工程師們可能會遇到的Data Size的問題。

可以解決的方式:

  1. Transfer Learning,使用pre-training。

下面這張圖在pretraining的部分,這一個模型先被拿去做分辨企鵝的訓練等到分辨企鵝的訓練完成之後再轉移到第二個步驟Fine-tuning,這時候工程師可以視情況決定需不需要升級這個訓練模型,最後的目標是要讓這一個模型可以分辨胸腔X光並且輸出是哪一個疾病。

為什麼用企鵝當作例子?

講師在這邊有提到因為企鵝整體的形狀很像肺形狀,所以在初期幾層的神經網路當中可以去讓模型分辨一些比較大的,例如邊緣形狀等等的問題,在第二次Fine-tuning的時候這個模型就會被修改並且能夠分辨比較細節的部分。其實像這樣的方式就是所謂的Transfer Learning。

                                                                    from deeplearning.ai AI for Medical Diagnostic course

2. Data Augmentation 數據增強

如果餵給機器訓練的影像數量太小的話,還有一種方法可以讓影像變多!那就是以人工的方式將影像進行一些變化後再重新把變化過後的影像餵回機器做訓練,這個就是Data Augmentation。

但是這邊要注意一點像是胸腔X光來說,我們可以旋轉圖片重新餵給模型或是改變對比度去產生一張新的影像,然而如果我們將胸腔X光做180度的翻轉時,這樣機器就無法分辨他是正常的胸腔或是dextrocardia(右位心)也就是說這種情況下,label的狀態改變了,由正常的影像變成右位心的影像。所以結論就是,當我們想要利用這種方式去增加影像的數量時,我們必須考慮到這一張影像的label狀態會不會改變。

                                           from deeplearning.ai AI for Medical Diagnostic course

下一篇會整理在醫學AI裡面做Dataset可能會面臨的三個挑戰和解決辦法。

可以找到我的平台:

Leave a Comment

Your email address will not be published. Required fields are marked *

error: Content is protected !!