編譯|陳雨潔
今天給大家介紹紐約干細胞基金會研究所的研究人員Brodie Fischbacher等人發表于Nature machine intelligence的一項研究工作《Modular deep learning enables automated identification of monoclonal cell lines》。在本項研究中,研究人員首次提出了模塊化的深度學習框架Monoqlo來自動識別細胞集落,并從細胞成像中識別克隆性。
研究背景
單克隆化是指從培養群體中分離和擴增單個細胞,是細胞培養中的一個重要步驟。它可以最大限度地減少細胞系在細胞改變事件(如重編程或基因編輯)下游的技術變異性,也可以用于單克隆抗體的開發等過程。傳統的驗證克隆性的方法不能很好地擴展至對大群落的研究。用于事后評估克隆性的自動化、標準化方法的缺乏,也將使得單克隆化的方法無法在不加劇細胞系技術變異性的情況下可靠地擴大規模,從而給研究帶來嚴重的障礙。
對此,紐約干細胞基金會研究所的研究人員提出了一個深度學習工作流的設計,該工作流程被稱為Monoqlo。Monoqlo提供了一種完全可擴展且高度可解釋的框架,能夠在一小時內使用商用硬件分析工業數據量。通過利用細胞培養過程的時間方向性,標準化了單克隆化過程,能夠擴大集落選擇方案的規模,同時最小化技術變異性。
研究方法
(1)模塊化的神經網絡
研究人員訓練了四個獨立的神經網絡--全局檢測、局部檢測、單細胞檢測以及形態分類模塊,每一個神經網絡都擁有其自己的“模塊化”功能(如下圖1所示)。全局檢測模塊目的是在全孔圖像中檢測集落是否存在;局部檢測模塊是在不同放大倍數下對不同孔區域圖像進行裁剪并進行集落檢測任務;單細胞檢測模塊是在完全放大、裁剪的圖像中對單細胞進行計數;形態分類模塊是對集落區域周圍裁剪的圖像進行形態分類任務。研究人員通過使用基于focal loss的RetinaNet50檢測結構來實現前三項任務,對于最后一個形態分類任務,作者選擇使用ResNet34結構進行訓練。
圖 1 Monoqlo模塊化CNN架構
(2)整體工作流程設計
研究團隊設計了一個名為“Monoqlo”的計算工作流,其整合了上述訓練好的神經網絡。實驗室自動化工作流程中集成了可以生成用于Monoqlo的數據以及Monoqlo的設計本身(如圖2和3所示)。
圖 2 生成Monoqlo數據的自動化流程
該模型以逆時針順序的方式處理每個孔的圖像,從最近的一次掃描圖像開始,如果通過全局檢測到集落的存在,輸出任一檢測到的集落所在的邊界框的坐標,然后擴展該邊界框的每個維度直到其是預測集落的兩倍,再加載當前孔的上一次的掃描成像圖并按照擴維后的坐標裁剪為結果區域。然后將得到的圖像傳遞給局部檢測模型,其會報告先前群落所處的邊界框,當與最初裁剪坐標相加時,會指示其在原始未裁剪圖像中的位置。該算法會遞歸地迭代這一過程,直至加載的最新掃描圖像是分選后數小時內生成的最早的“day 0”的掃描。
圖 3 Monoqlo算法設計流程
如果在這個過程中觀察到兩個或兩個以上的明顯不同的細胞團(它們被假定來源于相同的FACS分選的兩個或兩個以上的細胞),則通常可以直接判定為多克隆性。如果在全局或局部檢測模型在按時間順序向后迭代的過程中的任意時點上報告集落數大于1,該算法相應地也會宣布該孔為多克隆孔并停止處理該孔的任何進一步圖像。如果工作流能夠繼續精確地檢測一個集落,直到到達day 0的掃描,結果圖像將被放大,并在(祖先)細胞周圍精確地裁剪。然后可以將該圖像傳遞給單細胞檢測模型,提供起始細胞數的計數。在此基礎上,該孔最終可被宣布是單克隆或多克隆性。
這種“孔剔除”的方法,可以在工作流中檢測到任意一個排除標準,并使得算法能夠從工作流中排除整個孔,并忽略對該孔的所有后續掃描。在實施部署的過程中,研究人員進一步擴展了排除標準,可以排除表現出分化形態標志的孔。由于需要進行日常分析的數據集非常龐大,作者提出的淘汰方法在計算時間方面也提供了巨大改進。
實驗結果
研究人員通過可視化地比較需要驗證的圖像的標簽和預測結果,并繪制出邊界框,來人工評估模型的性能。其主要根據兩個指標來量化檢測的性能:一個是正確預測和分類的有標簽對象的百分比;另一個則是模型檢測到不存在對象的假陽率。其性能驗證的結果如圖4a所示, 其中外圈顏色代表孔的真實克隆性,內圈顏色代表Monoqlo模型識別的克隆性,如果存在雙重顏色,則為預測錯誤。
Monoqlo作為一個統一的模塊化的工作流程,研究人員先在人工管理的類平衡測試數據集上測試其特定類別克隆性識別性能,然后在一個原始的、未過濾的數據集上評估其克隆性識別性能,其結果如圖4b所示。
圖 4 Monoqlo框架性能評估
總結
單克隆化在細胞培養中是非常關鍵的一個步驟,但是它在誘導多能干細胞的生產過程中一直面臨著瓶頸。對此,這項研究工作提出了一個全新的框架:Monoqlo,通過具有模塊化設計的深度學習方法可以自動驗證明視野顯微鏡觀察中的單克隆性。研究團隊還將其工作流程擴展至集落的形態分類,展示了自動化工作流程中自主監測單克隆細胞系發育和克隆選擇的潛力。
參考資料
數據
https://nyscf.org/ open-source/monoqlo/
代碼
https://github.com/NYSCF/monoqlo_release
Fischbacher, B., Hedaya, S., Hartley, B.J. et al. Modular deep learning enables automated identification of monoclonal cell lines. Nat Mach Intell (2021).
https://doi.org/10.1038/s42256-021-00354-7