史上最完整機器學習自學攻略!我不相信有人看完這份不會把它加進我的最愛 | TechOrange 科技報橘
Search
Close this search box.

史上最完整機器學習自學攻略!我不相信有人看完這份不會把它加進我的最愛

【我們為什麼挑選這篇文章】我們知道很多 TO 的讀者都有相關需求,過去我們分享單堂課程比較多,這次我們看到這篇非常完整的總整理,從上課到作業,還有課外實作全部都包裹了,相信一定會很大程度的幫到大家。(責任編輯:林子鈞)

問耕/編譯整理

本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請聯繫出處

這篇文章的作者為 Andrey Nikishaev,他既是一個軟件開發者,也是一個創業者。

如何成長為一名機器學習工程師?

經常有人這麽問,而這篇文章就嘗試回答這個問題,其中會談到關於機器學習的方方面面,從簡單的線性回歸到最新的神經網絡。你不僅將學習如何使用這些技術,還將學習如何從頭開始構建它們。

這個指南主要面向計算機視覺(CV),這也是掌握一般知識的最快方式,從 CV 中獲取的經驗可以簡單地應用到機器學習的其他領域。

我們將使用 TensorFlow 作為框架。這些課程需要你會 Python,雖然不要求你是大師,但至少要懂基本的知識。(另外,都是英語授課

溫馨提示,學習知識與動手實踐相結合效果更佳。

1. 課程

1.1 約翰霍普金斯大學的實用機器學習

課程總共4周,用戶評分:4.4(5分制,下同)

1.2 史丹佛大學的機器學習

課程總共11周,用戶評分:4.9。授課教師是大名鼎鼎的吳恩達。

上面兩節課,會教給你數據科學和機器學習的基本知識,並為下面的學習做好準備。

1.3 CS231n:面向視覺識別的卷積神經網絡

總共16個課時,目前已更新為2017春季的最新版本。李飛飛是這節課程的導師。

現在才算步入正軌。這是網上最好的機器學習與計算機視覺課程。

1.4 Google 講深度學習

整個課程大約耗時三個月,導師為 Google 首席科學家 Vincent Vanhoucke,以及 Google Brain 的技術負責人 Arpan Chakraborty。

在這個課程中,將會教授深度學習的原理、設計可以從覆雜的大型數據集學習的智能系統、訓練和優化基本的神經網絡、CNN、LSTM 等。

選修課。你可以只看其中練習的部分。

1.5 CS224d:面向自然語言處理的深度學習

總共17個小時。

選修課。推薦給那些需要用到NLP的同學。課程內容也很棒。

1.6 深度學習電子書

Leonardo Araujo dos Santos整理的深度學習電子書。

選看。這是一本涉及諸多機器學習領域的好書。

2. 練習

這部分給了一堆教程和項目的清單,你應該逐一嘗試並了解它們的工作原理,以及考慮如何進行改進提升。這個列表的存在,只是為了增加你對機器學習的興趣,所以遇到一些困難也別氣餒,當你準備好就可以隨時上手練習。

2.1 TensorFlow上的簡單練習

Kadenze學院出品,總共5個課時。

2.2 Tensorflow菜譜

這部分內容來自Nick McClure的電子書《TensorFlow Machine Learning Cookbook》。

2.3 Tensorflow-101教程部分

這是一個用Python和Jupyter Notebook編寫的教程。試圖為TensorFlow初學者提供盡可能的詳細解釋,希望對大家有用~

2.4 快速風格遷移網絡

這個教程展示了如何使用神經網絡,將名畫的風格遷移到任何一張照片上。

2.5 圖像分割

這是一個使用 TensorFlow 實現的完全卷積網絡。作者 Marvin Teichmann 還提供了如何把這部分代碼集成到你的語義分割管道中的示例。

2.6 使用SSD實現物體識別

物體識別最快(也是最簡單)的模型之一

2.7 面向物體識別和語義分割的快速掩膜RCNN

2.8 強化學習

非常有用,特別是當你想搭建一個機器人或者下一個 DotA AI 時。

2.9 Google大腦團隊的Magenta項目

這個項目旨在通過神經網絡創造出色的藝術和音樂作品。

2.10 深度雙邊學習實時圖像增強

一個很棒的圖像增強算法,來自 Google。

2.11 自動駕駛汽車項目

想造一輛自動駕駛汽車嗎?這是一個很好的入門。

3. FAQ

如果中途卡住了怎麽辦?

首先,你得明白機器學習不是 100% 精確的東西,大多數情況下只是一個很好的猜測,並且需要大量的調整疊代。大多數情況下,想出一個獨特的點子是非常困難的,因為你的時間和資源將耗費在訓練模型上。

所以,不要自己想解決方案。去搜索論文、項目,以及求助他人,積攢的經驗越多,你會幹的越好。給幾個可能有用的網站:

http://www.gitxiv.com

http://www.arxiv-sanity.com

https://arxiv.org

https://stackoverflow.com

為什麽論文不能完全解決這個問題,為什麽論文有些地方是錯的?

很遺憾,並不是所有的科技人員都想把他們的成果公之於眾,但他們都需要發表論文來獲得「名」或者「利」。所以一些人可能只發布部分素材,或者給出錯誤的公式。所以找到代碼永遠比找到論文更有用

哪裡可找到最新的資料?

參考上面推薦過的幾個網站,尤其是 gitxiv.com,不僅僅能找到論文,而且還能找到代碼,所以特別實用。

我應該用雲計算還是桌機/筆記本電腦?

雲更適用於有大量計算需求的情況。對於學習和測試來說,使用桌機/筆記本電腦要便宜得多,當然前提是配有支持 CUDA 的顯卡。比方,我自己就用一個筆記本訓練模型,顯卡是帶有 690CUDA 核心的 GTX GeForce 960M。

當然,如果有免費的雲資源可用,當然要用

如何更好地調整超參數?

訓練的主要問題是時間。你不可能一直坐在那看著訓練數據。因此,我建議你使用Grid Search。基本上,只需要創建一組超參數和模型架構,然後一個接一個的運行,並保存結果。這樣就能晚上訓練,白天比較結果,找到最有希望的那個。

詳情可以參考這個網址

【TechOrange 徵才:社群編輯+實習編輯】

你是否常在各類豐富的科技趨勢裡流連忘返?
你是否常被創業故事弄得熱血沸騰無法成眠?
我想你大概就是得了 TO 病,不加入不行了。
準備好你的履歷自傳,寄至  [email protected]
記得標註你要「應徵 TO 社群編輯」,才不會跑錯棚哦!
>> 詳細職缺訊息


延伸閱讀

Google 李飛飛大神圖像識別課免費中文版來啦!一毛錢都不花就學完深度學習精髓
吳恩達人工智慧課程 最新評測!帶你一窺上課時數、作業專案內容
中國 AI 教父吳恩達開課啦!史上「最完整」人工智慧課程,帶你一步步成為頂尖人才

(本文經量子位(公眾號 ID:QbitAI)授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈想成為機器學習工程師?這份自學指南你值得收藏
〉。)