過去一年,是人工智能和機器學習蓬勃發展的一年。許多高影響力的機器學習應用被開發出來,特別是在醫療保健、金融、語音識別、增強現實以及更復雜的3D和視頻應用中。
我們已經看到了更多的應用驅動研究,而不是理論研究。雖然這些研究有著一些不足,但當前的確產生了巨大的積極影響,也促成了很多可以迅速商業化的新研發。這一趨勢也在機器學習的大部分開源項目中得到了強烈反映。
讓我們來看看過去一年中前6大最實用的機器學習項目。這些項目發布了代碼和數據集,允許個別開發人員和小型團隊學習并能實現立即創造價值。它們可能不是理論上最具開創性的作品,但卻非常適用且實用。
Github鏈接:
https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
項目鏈接:https://docs.fast.ai/
Fast.ai庫的編寫是為了簡化訓練快速準確的神經網絡。它去掉了在實踐中實施深度神經網絡可能帶來的所有細節工作。
Fast.ai非常易于使用,并且設計成符合開發者的應用程序來構建思維模式。最初這個開源項目是為Fast.ai課程的學生創建的,該庫以簡潔易懂的方式編寫在易于使用的Pytorch庫上。
github鏈接:
https://github.com/facebookresearch/Detectron?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Detectron是Facebook AI用于物體檢測和實例分割研究所創建的研究平臺,用Caffe2進行編寫。它包含各種目標檢測算法的實現,包括:
Mask R-CNN::使用更快的R-CNN結構的目標檢測和實例分割;
RetinaNet:一個基于特征金字塔的網絡,具有獨特的Focal Loss來處理難題;
更快的R-CNN:目標檢測網絡最常見的結構
所有網絡都可以使用以下幾種可選的分類主干之一:
ResNeXt {50101152}(https://arxiv.org/abs/1611.05431)
RESNET {50101152}(https://arxiv.org/abs/1512.03385)
特征金字塔網絡(使用ResNet / ResNeXt)(https://arxiv.org/abs/1612.03144)
VGG16(https://arxiv.org/abs/1409.1556)
更重要的是,以上都帶有COCO數據集上的預訓練模型,因此開發者可以立即使用它們。
github鏈接:https://github.com/facebookresearch/fastText
這是來自Facebook的另一個研究,fastText庫專為文本表述和分類而設計。它配備了預先訓練的150多種語言的詞向量模型。這些詞向量可用于多種任務,包括文本分類、摘要和翻譯。
GitHub鏈接:
https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Auto-Keras是一個用于自動機器學習(AutoML)的開源軟件庫。它由德克薩斯州農工(Texas A&M)大學的DATA實驗室和社區貢獻者開發。
AutoML的最終目標是為只有有限數據科學或機器學習背景的領域專家提供易于訪問的深度學習工具。Auto-Keras提供自動搜索深度學習模型的最佳架構和超參數的功能。
GitHub鏈接:
https://github.com/google/dopamine?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Dopamine由谷歌創建,是快速原型的強化學習算法的研究框架。它旨在靈活且易于使用,實現標準的RL算法、指標和基準。
根據Dopamine的文檔,他們的設計原則是:
簡單的實驗:幫助新用戶運行基準實驗;
靈活的開發:為新用戶提供新的創新想法;
緊湊且可靠:為一些較舊且更流行的算法提供實現的可能性;
可重復性:確保結果的可重復性。
GitHub鏈接:
https://github.com/NVIDIA/vid2vid?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
vid2vid項目是英偉達(Nvidia)最先進的視頻到視頻的合成算法。Pytorch實現了高分辨率(例如2048x1024)逼真的視頻到視頻轉換方法。這一項目的目標是學習從輸入源視頻到精確描繪源視頻內容的輸出擬真視頻的變換功能。
這個庫的好處在于其選擇多樣性:它提供了幾種不同的vid2vid應用程序,包括自動駕駛/城市場景,人臉和人體姿勢。它還附帶了豐富的指令和功能,包括數據集加載、任務評估、訓練功能和多塊GPU。