首頁 > 新聞資訊 >  業內事態

      熒光標記再見,AI不用染色也能看見

      瀏覽次數:      2021年04月28日

      模型可僅通過光學顯微鏡圖像就預測出細胞結構的位置,而無需具有毒性的熒光標記物。


          一直以來,來自華盛頓西雅圖艾倫細胞科學研究所的定量細胞生物學家、副總監Susanne Rafelski和她同事都有一個看起來很簡單的目標:“我們希望能夠標記細胞中多種不同的內部結構,而且是在活細胞里進行3D的結構標記?!?/p>


          這一目標通常依賴于熒光顯微鏡來實現,但問題是可用的染料數量有限,不足以完成對所有種類的細胞結構進行標記。同時,熒光染料和試劑不僅昂貴、操作復雜,著色過程也對活細胞有害。當光激活這些熒光物質時,成像細胞的異?;钴S會損害細胞?!盁o論哪個角度來說,熒光顯微都是耗費很大的方式”,同在西雅圖艾倫研究所的腦科學中心顯微學家Forrest Collman說。當Collman和同事嘗試使用3種不同顏色來拍攝3D延時視頻時,結果令人十分震驚。Collman回憶道:“你就眼睜睜的看著這些細胞在你面前凋零。

      image.png

      插圖:Project Twin

          而另一方面,基于投射白光進行成像的亮視野顯微鏡并不依賴標記物,從而避免了熒光顯微鏡存在的一系列問題。但這種顯微鏡對比度較低,大多數細胞結構無法看出。Rafelski團隊需要結合兩種成像方式的優勢,科學家們不禁在想,人工智能是否可以在亮視野顯微鏡的基礎上,通過一種類似“虛擬染色”的過程,預測出細胞通過熒光標記出結構形態呢?2017年,Rafelski當時的同事,機器學習科學家Gregory Johnson提出了這么個解決方案,他想利用一種稱為深度學習的AI模型,從亮視野顯微鏡的非染色圖像中識別出肉眼難以觀測的細胞結構。


          “天啊,這居然能成,”Rafelski離開了幾個月,回來工作時Johnson告訴她自己搞定了。在非熒光標記的細胞圖像上應用深度學習算法,艾倫研究所的團隊在一段3D視頻中呈現了細胞核內的DNA和精細結構,以及細胞膜和線粒體[1]。


          “這些模型可以‘看’到人類看不到的結構”,英國鄧迪大學的計量細胞生物學家Jason Swedlow說。他說,我們的眼睛并不適應捕捉細微的結構,或諸如光學顯微鏡下的灰度模式,我們不是這么演化的,“你的眼睛是為了發現老虎獅子和樹之類的東西。


          在過去幾年里,AI領域的科學家們設計出了多種系統來抽取這些模式。模型利用亮視場顯微數據和與之精確對應的熒光標記數據來訓練模型,但這些模型在處理數據的維度上略微不同,一些用作2D圖像,另一些用于3D;一些用于近似細胞結構、一些則能生成足以亂真的顯微圖像。


          澳大利亞布里斯班轉化研究院的顯微設備主管Mark Scott說:“這代表了目前所能達到的最前沿水平?!倍F在需要生物學家與AI程序員合作,測試和改進這些技術在真實環境中的應用能力。


      高速發展的領域

          加州大學神經科學家Steven Finkbeiner,以及同在舊金山的格萊斯頓研究所,利用機器人顯微鏡對細胞進行了長達一年的追蹤。在10年代前期,他的團隊每天已經能夠積累TB級的數據。這一研究吸引了谷歌研究者的注意,并拋出了合作的橄欖枝。Finkbeiner建議可以利用深度學習來從圖像中尋找人看不見的細胞結構特征。


          深度學習利用計算機內部的節點進行層次堆疊模擬人腦內部的神經連接過程。首先節點間的鏈接權重被隨機初始化,所以計算機只是在猜;隨著訓練過程的深入計算機可以逐漸調節這些權重或參數,直到越來越對。


          Finkbeiner的團隊曾訓練了一個可以從2D圖像中識別出神經元的模型,然后是挑出細胞核并判斷細胞是否還有活性[2]。Finkbeiner說:“這一項目的主要意義在于向科學家表明,圖像數據里包含著的信息,可能比他們以為的多得多?!眻F隊將這一技術稱為“硅標記”in silico labelling)。


          但這一方法無法識別出運動神經元,可能由于未標記細胞中沒有任何信息可以表示出運動神經元的獨特性質。Collman表示,這一技術只能在有AI可識別的視覺線索時有效,例如膜與周圍結構具有不同的折射率,從而產生了不同的對比度信息,使得這一結構可以被AI預測。


          Collman,Johnson和他們在艾倫研究所的同事們,利用一種不同的神經網絡來解決Rafelski提出的問題,在一種名為U-Net的網絡結構上構建了系統,U-Net是被研發用于處理生物圖像的。與Finkbeiner等人的方法不同,艾倫研究所的模型使用3D顯微圖像。一些科學家日常會用到這一模型,例如在染色質組織學中識別出細胞核標記。


          在伊利諾伊大學香檳分校,物理學家Gabriel Popescu同樣利用深度學習,尋求一個基礎顯微問題的答案:一個細胞是死是活?這一工作可能比聽起來要困難許多,因為測試細胞活性需要借助毒性化學物質,這種矛盾的過程就像用刀捅開病人的動脈來觀察是否活著一樣。


          Popescu和同事將這一研究稱為PICS:基于計算特性的相位成像(phase imaging with computational specificity)。Popescu使用這一技術在活細胞中識別細胞質和細胞核,并計算其質量隨時間的變化[3]。 他說,這些標記準確地表明了細胞的生長和活力。


          PICS系統包含基于U-Net的軟件系統和顯微鏡硬件,整套系統無縫集成,而無需拍攝圖像后訓練機器進行處理。當用戶拍攝好白光圖像后,模型僅僅需要65毫秒就能預測出細胞對應的熒光標記結構。


          其他的研究團隊還使用不同種類的機器學習算法。例如,華盛頓的美國天主教大學的一個團隊利用叫GAN的神經網絡,從相襯光學顯微鏡識別圖像中識別細胞核[4]。GAN是一種生成對抗網絡,包含兩個不同的模型,其中生成器用于預測出熒光標記圖像,而判別器則用于判定生成的圖像是否是贗品。為了躲過判別器的鑒別,生成器需要不斷改進以生成盡量真實準確的結果,如果判別器在一半情況下被騙過,生成器就是在進行可信的預測。這一項目的工程師Lin-Ching Chang表示:“甚至人類也無法區分生成樣本的真假了?!?/p>

      藥物發現

          熒光標記預測技術也在進入制藥行業。瑞典哥德堡阿斯利康的藥理學家Alan Sabirsh一直致力于研究脂肪細胞在疾病和藥物代謝中的作用。Sabirsh和阿斯利康聯合了瑞典國家人工智能應用中心舉辦了一場脂肪細胞成像挑戰賽,要求參賽者從未標記顯微圖中識別出細胞核、細胞質和脂肪滴。最終5000美元的獎金被Ankit Gupta、 H?kan Wieslander團隊獲取,他們是瑞典烏普薩拉大學研究圖像處理技術的兩名博士生。


          與Chang和同事一樣,這一團隊選擇利用GAN來識別脂肪滴。針對細胞核則使用了另一種方法LUPT(learning using privileged information,利用特權信息的學習),為機器的學習過程帶來額外的幫助。該團隊使用了進一步的圖像處理技術,來識別標準訓練圖像對中的細胞核。一旦模型訓練完成,它就可以僅僅基于光學顯微鏡圖像來預測細胞核了[5]。


          Gupta說,雖然生成的圖像并不完美,真實的熒光染色可以比模型預測結果提供更多細胞核與細胞質的細節。但對于Sabirsh來說已經足夠了,他已經開始將這些代碼應用于機器人顯微鏡的實驗中,并期望開發出新的療法。


      在多個技術原型驗證后,這一技術已經度過了蹣跚學步階段,更多的研究者開始嘗試這一技術。Swedlow說:“我們正在學習行走,以及行走的意義所在?!?/p>


          例如,我們需要明確這一方法在白光成像中何時是有效的、而何時又應該避免使用這一技術。麻省理工大學博德學院成像平臺高級總監Anne Carpenter說,嘗試分割細胞內部細胞器和結構也許是一個很好的應用,因為錯誤并不會顯著影響到下游任務的結果。不過,她對預測實驗結果抱有審慎的態度,因為機器可能只在可控條件下,依賴一種結構預測另一種?!?strong style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; word-wrap: break-word !important;">但在生物學中,我們常常尋找的就是例外。”Carpenter說。


      Popescu說,目前來說,至少科學家們已經能夠利用標準的熒光染色來確認模型的關鍵預測是否正確。新墨西哥州立大學電子工程師Laura Boucheron補充說,最好尋求一位相關領域的專家進行合作,“運行并良好使用這些模型,需要大量重要的計算機專業知識。


          雖然一些模型只使用了少量的圖像進行訓練,但Boucheron認為數據量越大越好。比利時根特大學VIB炎癥研究中心的計算生物學家Yvan Saeys認為,幾百甚至上千的數據通常是必須的,如果你需要模型在多種細胞類型上或者來自不同顯微鏡設置下能有效運行,需要在訓練數據中涵蓋足夠多樣性的圖像。


          但Boucheron提醒,大體量的訓練需要擁有多個圖形處理單元超級計算機,訓練上數周時間。但一旦模型訓練完成,預測模型就可以在筆記本甚至手機端運行。


          對于很多研究者而言,如果未來再也無需承受細胞染色的繁雜之苦,這樣一次性的投資是值得的。Finkbeiner說:“如果你可以拍攝未染色的細胞圖像,并且擁有已經訓練好的預測模型,那就意味著你基本上能免花費獲得所有信息了?!?/p>

      參考文獻:

      1. Ounkomol, C., Seshamani, S., Maleckar, M. M., Collman, F. & Johnson, G. R. Nature Meth. 15, 917–920 (2018). 

      2. Christiansen, E. M. et al. Cell 173, 792–803 (2018). 

      3. Kandel, M. E. et al. Nature Commun. 11, 6256 (2020). 

      4. Nguyen, T. C. et al. J. Biomed. Opt. 25, 096009 (2020).

      5. Wieslander, H., Gupta, A., Bergman, E., Hallstr?m, E. & Harrison, P. J. Preprint at bioRxiv https://doi.org/10.1101/2021.01.18.427121 (2021).


      原文以AI spots cell structures that humans can’t標題發表在2021年3月30日的《自然》的技術特寫版塊上 原文鏈接 https://mp.weixin.qq.com/s/YIr19hw-38skvWNpoY-bPg



      被怪物产了一肚子卵