0:00
[音樂] [音樂]
[音樂] [音樂]
大家好,大家好,歡迎來到今天的機器學習課程,我們這個課程叫做機器學習基石 Machine Learning
Foundations。在課程的一開始呢我想要先跟大家解釋 說這個課程設計的理念,我們開始從這個課程的Logo出發,我們這個課程
Logo裏面大家可以看到說,這個Logo是由四個不同的圖案組成的
那我們在未來的課程裏面會慢慢的跟大家講到這四個圖案的意思 那比較小的那兩個圖案大家不要急,下一次的課程中我們大概就會
解釋到它們的意思,比較大的這兩個圖案可能要等到課程比較後期的時候,我們會跟大家解釋
說這兩個圖形是怎麼產生的,我們可以給一些提示,紅色代表危險,藍色代表不危險
什麼時候使用機器學習是危險的,什麼時候使用機器學習是不危險的
這會到我們後期的課程中才會講到。好,那
講到說要怎麼樣設計機器學習這個課程,那當然要先瞭解到未來我們會跟大家慢慢講
說機器學習實際上是一個理論與實務結合的一門學問
好,所以呢,要怎麼教機器課程,就可以從很理論的角度出發
我們跟大家講說,機器學習的這些理論設定它的假設是什麼,它有什麼推論,什麼結論,它可-
以設計出什麼樣的東西 我們可以非常深入的講這些事情
好,講完這些事情後,大家會覺得,哇,好偉大,這些 前輩好偉大,怎麼設計出這麼漂亮的數學,這麼漂亮的
東西,可是對於大多數人來說如果你現在想到的是,你要把機器學習用在你的某個應用
的領域,或者是某個其他的題目上的話,可能會覺得學這些理論不夠實用
好,那有人就說,好吧,既然要實用的話,我們可不可以教大家很多很多
各式各樣不同的方法,機器學習裏面不缺方法,大家隨便去找,每天都有幾十個幾百個新的方-
法在產生 那你就說,老師那你可不可以從這些方法裏面選擇你覺得最棒最好的
最有趣的來教大家,可以啊,我們也可以每堂課教大家 兩個方法,三個方法,四個方法,這樣子幾個禮拜下來大家可能也學了
幾十個方法,但是呢在這個時候大家可能會發現,你如果學完這幾十個
方法都是在很快速的學過去的話,到有朝一日你真的要使用這些方法
的時候,你發現糟糕了,我不知道怎麼樣選,我不知道怎麼樣妥善的使用這些方法,這好像這個
武俠小說裏面,你學了太多的招數以後,發現說,誒呀真正上戰場的時候,不知道要用上哪一
招。好,所以從理論的角度切入,或從方法的角度切入,都有顯而易見的缺點
那在這門課裏面,我們做的選擇是我們要從基礎開始切入
什麼叫基礎?在這幾年來這些教學的經驗,以及跟其他一些學者討論教學經驗之後
我認為說有一些東西,例如說包括哲學上機器學習的思想,包括數學上的工具
包括演算法的設計,以及包括它們的使用,這些 基礎的東西是每一個想要使用機器學習的人都應該要會的東西
你會了這些東西,你就能掌握機器學習 把它變成你的工具,而不是你是它的奴隸
好,所以我們希望在這個課程裏面,能把這些基礎,我叫做基石,基石的意思
大家想到基石,會想到是一個很堅固,是一個這個打底的工作,並不是代表它真的很簡單
而是這些東西你要先學會了,你才可以拿這些東西來蓋大樓
好,那當然這課也不是說真的就這麼嚴肅,講這些基礎的東西,然後一行一行的推導怎麼樣子
大家上過,如果上過我在臺大課程的可能就知道,我在上課的時候
很喜歡在穿插一些,隨便腦袋裏想到什麼笑話,我就講什麼
這些東西綜合起來會是我們這個課的內容 那我們剛才講了說這個課不會太嚴肅,所以我希望大家用
聽一個故事的角度來看這個課,我們講這個課很像講故事一樣,所以
我們的故事會想辦法把我們剛才提到的這些基礎統統都串在一起
所以我們一開始會從一個問題出發說, 我們到底什麼時候可以把機器學習聽起來這麼
偉大的一個學問,我們什麼時候可以用得上機器學習 然後說那在這些時候中,為什麼機器學習會有用
有了這些為什麼,這些可能是一些比較理論的部分,但是有了這些為什麼以後
我們就可以很輕易的瞭解機器學習裏面一些基本的方法,機器到底怎麼樣
可以學得到東西,然後再來我們更進一步瞭解了這些方法之後,我們
可能還想要做到更好,所以我們說怎麼樣讓機器能夠學得更好
所以我們的故事會沿著這四個主題發展下來,大家可以看到我在這四個主題的後面呢
實際上是列了就是說各個主題牽扯到的部分,大家會看到說每個主題不是單一的,並不是說這- 個是一個理論的主題
或這是一個方法的主題,或這是一個應用的主題,實際上就算我們在講最理論的
東西的時候,像在第二個主題裏面我們也會穿插說這些理論背後的哲學意義是
什麼。那我們在講一個最應用的主題,像這個第四個部分的時候,它是一個非常應用的 主題,我們也會講這些應用背後的理論基礎是什麼
我們希望透過這樣子 交錯,各個主題交錯的過程,然後這整個的故事
能夠讓大家學好這個故事以後,未來如果你想 要把機器學習拿到你有興趣的領域裏面去應用
可以很容易做,如果你想要更鑽研機器學習裏面更深入的理論
的話,你可以很容易做,如果你想要學習機器學習裏面更多的技巧的話
你可以很容易做,這些是我們的目的。好,那這個課呢,我之前在臺大
從2008年開始教到現在已經5年了 那在臺大的課程我們有15到17周的課程,看看說那個學期有的剛好
碰到假日,然後每個禮拜差不多是兩個小時到三個小時
的課程,那這個課在臺大的反映還蠻好的。那我們之前在臺大是用純英語授課
然後並且是用黑板或白板即時寫字的方式來做教學
大家可以看到這是前年的選課的distribution,這個字比較小一點
大家看到說比較大塊的這塊,這是電腦科學的computer science的學生
那麼這個有比較小的像這些電機系的學生,那還有很多其他這個工學
院的學生,或者甚至今天他是學財經的,或者學生物的等等選擇這個課來修
那這次Coursera這個版本呢,因為這個15周到17周的課程
對於大多數想要在Coursera上面修課的同學來說,實在是太長了 所以我們把它切成兩個部分,前8周我們講的就是Foundation
就是這個基礎的這個切入的部分 那也就是我們現在正在上的這門課
那麼後7周的課程我們會另外開一門Coursera的課,我們叫做,會叫做Machine Learning
Techniques,所以如果你聽完這個課,有興趣學更多Machine Learning的技巧
的話,歡迎你繼續的來修這門課。那我們決定說,臺大以前是用英語授課,我們這次
會採用中文的授課,希望能夠把機器學習帶給更多這個
華語的聽眾,另外我們也從原來用黑白板教學的方式變成
用投影片教學的方式,然後也會配合Coursera裏面給我們的這個 綫上測驗還有一些作業的機制,希望能夠讓大家也學得
很充實。值得注意的就是說,我們這個課實際上 在內容上幾乎跟我原來在臺大設計的課程,如果你完成了
這個總共15周的課程的話,幾乎跟我原來在臺大設計的課程是一模一樣的
所以你如果能夠完成這些課的話,你可以體驗到在台灣第一學府
台灣大學我們是怎麼樣,用什麼的認真來經營這樣一門
課程,那我們也希望讓Coursera上面的課程能夠跟臺大的課程
保持一樣的品質,一樣的水準。好,那剛才講了說Coursera有
一些機制,可以讓我們跟大家做一些互動等等的,這是其中一個機制,我們可以
問大家問題,所以這邊就是一個簡單的問題,我們以後在課程
三不五時,我們可能就會出現一些這些小問題,讓大家來想想你在這個課程
裏面學到了什麼東西,這個小問題是考驗大家說,到底跟這個課有關的一些敘述
何者為正,我們第一個說我們這個課會用臺語教學
第二個選項說,這個課會告訴大家說怎麼樣,如果大家看過星際迷航記的話應該知道,星- 際迷航記
裏面有一個很著名的機器人叫做Data,它是一個跟真人幾乎一模一樣的機器人
會教大家怎麼樣建出這樣的機器人的技術
好,那第三個選項是這個課總共是15周長,第四個選項 則是說这个课會像講故事一樣告訴大家機器學習背後的
故事。好,所以大家想一想以後,我相信大家選擇到正確
的答案就是4,第一個選項我們是用中文華語教學,但是
不是用臺語教學,暫時還是我的臺語還不夠教大家
那這個我們也暫時還沒有辦法教大家很複雜的技術怎麼樣製造出那樣子的
機器人,這實際上還是一個研究中的領域 那我們課不是總共15周長,這門課是8周長,如果你選擇
繼續下一門課的話,總共15周,你可以得到很完整的這個臺大的經驗
那這個但是我們的課的確會用像講故事的方式,跟大家講說機器學習是
怎麼一回事,現在就讓我們一起來開始這個機器學習的故事