《機器學習漸入佳境》由會員分享,可在線閱讀,更多相關《機器學習漸入佳境(6頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、機器學習漸入佳境
研究具備自我提升能力軟件的嘗試最早始于 20 世紀 60 年代,而經(jīng)常被稱之為“機器學習”的技術仍然基本停留 在學術研究階段,只有極少部分進入商用市場的邊緣,例如 語音識別、信用卡詐騙偵測等領域。如今,專家認為隨著更 好的算法、更強性能的計算機和更智能的應用策略的相繼問 世,機器學習和自我訓練軟件技術將開始進入主流應用。
贏得 200 萬大獎的機器學習
隨著此類技術的進步和推廣,市場需求也將逐漸看漲。 “在過去,程序員可以針對一個問題編寫代碼,再進行測試 和運行, 并在以后人工調(diào)試和改進, 如此反復進行循環(huán)測試, 美國斯坦福大學人工智能實驗室主管 Sebastian T
2、hrun 教授說,
“這樣的問題在于, 軟件將變得越來龐大, 越來越難以管理。 由此產(chǎn)生了一種趨勢,即讓軟件具備自動調(diào)節(jié)和適應能力, 這將是未來計算領域發(fā)生的一項重大革命。 ”
在美國國防部高級研究計劃署 (Defense Advanced
Research Projects Agency最近主持展開的一項競賽中, Thrun 教授通過采用幾種新的機器學習技術的軟件,來驅(qū)動一輛汽 車在沙漠中自動駕駛了 132 英里的路程,從而為斯坦福大學 贏得了 200 萬美元的獎金。在新技術的幫助下,這輛汽車能 識別并記憶它所行駛過的路面特征。機器學習技術還使 Thrun 教授的研究團隊極大地提高了工
3、作效率,據(jù)說他在過 去需要花半個月來完成的人工編程工作,現(xiàn)在只需要一天時 間就能讓軟件自動完成。
讓軟件訓練軟件
卡耐基 . 梅隆大學的自動學習和探測中心主管 Tom Mitchell 說,對人類而言很容易完成的一些任務 (例如語音和 圖像識別 ),要交給計算機來處理往往有較大的難度, 因為很 難用軟件規(guī)則來將這些任務解釋和交代清楚,但機器學習技 術的運用可以明顯改善這種情況。在機器學習技術的應用案 例中,經(jīng)由人工編寫和標記的測試平臺來“訓練”軟件,并 分析和記錄軟件運行結(jié)果的對或錯,不斷對其進行校正,最 終將成熟的軟件派發(fā)出去解決現(xiàn)實中的問題。
為了試驗這種概念, Mitchell 用
4、兩種學習算法來相互進 行基本訓練,以讓二者共同工作的效果好于單獨使用其中一 種。例如,一種搜索引擎算法通過分析網(wǎng)頁上的詞語來對其
進行分類,而另一種算法則分析指向該頁面的超鏈接中的詞 語,這兩種算法共享對同一個頁面的分析線索,并匯集出更 準確的分析報告。試驗結(jié)果表明,這種聯(lián)合訓練方案能明顯 降低錯誤率。它所取得的突破是:軟件的訓練平臺不是由人 工編寫的,而是由另一種軟件完成的。
填補人工編程的盲區(qū)
加州大學伯克利分校的 Stuart Russell 教授正在試驗一些 編程語言,程序員們經(jīng)常用它們來為某些任務編寫代碼,這 些任務很容易理解和編碼,但也容易產(chǎn)生許多無法處理的盲 區(qū)和縫隙。為了
5、填補這些縫隙,該試驗引進了諸如人工神經(jīng) 網(wǎng)絡的機器學習技術。
Russell已經(jīng)將其“局部編程”概念運用在一種稱之為
Alisp(Lisp 語言的擴展 )的語言中?!芭e例來說其原理:如果我 想告訴你如何到達機場,但我手上沒有地圖,哪該怎么辦 呢?” Russell 說,“我將編寫一個程序,告訴計算機來如何 到達目的地:‘沿著這條街持續(xù)走下去,穿過所有的路口, 直到在一個斜坡處進入高速公路。在高速公路上一直走到有 機場出口的路牌處, 下了高速再駛?cè)肫胀ń值溃?直到機場。 在這個流程的編碼過程中,將會產(chǎn)生大量無法處理的縫隙, 但它仍然將是個非常有用的導航軟件。 ”在每個縫隙處,程 序員都會指定
6、相應的學習算法, 但 Russell 的研究目標是有朝 一日讓系統(tǒng)在每個縫隙處自動選擇最佳的算法。
已經(jīng)商用的機器學習技術
計算技術對機器學習自然化的提升,激發(fā)了紐約州立大
學Yann LeCun教授的靈感,他發(fā)明了一種稱之為“回旋網(wǎng)絡”
的人工神經(jīng)網(wǎng)絡系統(tǒng),據(jù)稱它與傳統(tǒng)的神經(jīng)網(wǎng)絡相比,能用 更少的資源和工作量來更好地完成圖像識別等任務。通過大 量的神經(jīng)網(wǎng)絡,軟件必須接受數(shù)量龐大的不同情況下的訓練, 以讓其適應多種不同情況――目標的不同位置和不同大小、 不同的視角和背景等等,而這是項艱巨的挑戰(zhàn)。
LeCun發(fā)明的技術如今已被用于銀行門禁中的模式識別 閱讀器和機場的監(jiān)視系統(tǒng),它將監(jiān)測目
7、標的每個圖像分解成 小塊區(qū)域 (例如鼻子、眼睛等 ),然后再拼接起來,生成高水 平的特征信息, 這種系統(tǒng)更加靈活, 并且減少了訓練的次數(shù)。
軟件也可“物競天擇”
與此同時,研究還推進了機器學習的一個分支一一基因 編碼學(Genetic Programming , GP)的發(fā)展,這種技術讓軟件
的發(fā)展遵循像達爾文的生物進化論一樣的規(guī)律。事實上,對 同一種問題的解決,往往會有多個不同版本的程序,甚至會 同時出現(xiàn)成百上千個版本,而這很容易讓人們混淆。其中的 絕大多數(shù)是比較弱的,但進化程序?qū)钠渲羞x擇兩個最優(yōu)的 出來,并將二者組合成更優(yōu)秀的新一代程序。在沒有人工參 預的情況下,這種進化過程將持續(xù)
8、進行數(shù)百代,并且每次都 使程序得到優(yōu)化和提升。
斯坦福大學的電子工程學教授 John Koza是GP研究的先
驅(qū),他用這種概念來設計電路、控制器、光學系統(tǒng)和天線等 設備,結(jié)果與那些取得專利的傳統(tǒng)設計方法等效或優(yōu)于后者。 他完全用GP創(chuàng)建的一個控制器設計最近還獲得了一項專利。
不過,有點像生物進化過程一樣, GP的研究進展非常緩 慢。即使到了計算機速度超前發(fā)展的當前, GP在解決復雜問
題的過程中所用得上的計算資源仍然是杯水車薪。在那項專 利設計工作中,Koza教授在他的筆記本電腦上所做的工作量 只有幾個小時, 而完成控制器設計的 GP 進程則在由 1000 個 Pentium 處理器節(jié)點組成的集群環(huán)境下持續(xù)了 1 個月之久。
“我們從20世紀80年代后期開始了 GP研究,現(xiàn)在我
們所獲得的計算能力將比那時強 100萬倍” ,Koza說,“預計
再過 10 年左右,我們的研究成果將在實際的工程設計領域 發(fā)揮作用。”