難題與進展：《眼見為憑》選摘（4）

如果你不知道目的地是哪兒，可能要設定其他目標。
──尤吉．貝拉（Yogi Berra）

我們每天都聽到機器學習能夠做到需要感知才能達成的任務：自動駕駛汽車、臉部辨識等。也有人擔心智慧機器失控所造成的危險，害怕有天它們利用遠勝於人類的智能，會掌控整個世界。不過這些討論絕大部分都沒有看到明顯的重點：機器學習的確能夠完成一些了不起的任務，但是研究人工智慧的傢伙全都深深了解到，現在最佳的人工智慧還比不上四歲的孩子。

原因在於，絕大部分著名的人工智慧演算法在學習技能時要人教，同時需要使用到極龐大的資料庫，並且得在超級電腦上執行。四歲幼兒只要知道幾個例子之後，自己就能夠學習。說真的，教自己小孩某些技能和概念時的確痛苦萬分，但是他們絕大部分知道的事物，都是基於基本的感知機制，自己教自己的結果，用他們小小的腦袋就足以完成。事實上，就算是多層級且具備反向傳播的感知器，比起我的小孫子還是差太多了。他不需要數不清的例子和教師，就能認得出自己的祖父。只要抱幾次就很快學會說「爺爺」這個詞。

訂閱風傳媒VIP會員，享有零廣告閱讀介面

透過<Google新聞>追蹤風傳媒

人工智慧研究人員區分了監督學習與無監督學習。你應該記得之前提到那個標準的感知器需要教師。蘋果電腦的聲音識別軟體和咸諾斯基會說話的電腦也要。注重隱私權者所害怕的臉部辨識軟體也需要。你需要大量具備身分標籤的臉部照片，才能夠教軟體辨識臉部。電腦能夠辦得到是因為計算速度非常快，事實上，最近幾年機器學習獲得的成就，主要來自於最近（五年）有了能夠用來訓練的資料庫，以及大型的客製化電腦。腦中神經元運作的速度很慢，無法看這些電腦相比。

但是腦部的能力遠超出這些電腦。在赫柏原始的概念中，創造細胞群組的方式是無監督學習：在邊緣上連續的點本來就會一起出現，腦中的邊緣敏感細胞也是自己出現的。目前電腦科學家迫切的任務之一，是建造出訓練過程如大腦的機器。

目前電腦科學家迫切的任務之一，是建造出訓練過程如大腦的機器。（xresch@pixabay）

我很快就會回來談腦部，不過先說明另一種機器學習形式的例子，這種形式結合了神經網絡和一個新方法。電腦科學家大方的用神經科學的名詞來稱呼這類策略：增強原理（principle of reinforcement），最早有系統進行這方面研究的是偉大的俄羅斯生理學家帕夫洛夫（Pavlov），哈佛大學的史金納（B. F. Skinner）等後繼者發掘了其中的細節。電腦科學家稱這種這種演算法為「增強學習」（reinforcement learning）。「增強」的意思是某種行為會得到報償，如果電腦受到了報償，就會重複那種行為。這個過程讓正確的行為比較容易受到重覆，在神經網絡中的突觸會受到加強，你可以說這是一種反向傳播。增強學習與感知學習很像，只不過電腦會自己製造教師。（相關報導：誰是你的陪審團─你必須溝通並改變其立場的人：《好問》選摘（2）｜更多文章）

電腦也可以得到報償。在增強學習的過程中，電腦得找尋一個目標，它會隨便亂猜，剛開始都猜錯，但是如果某個猜測結果稍微接近目標，就會得到報償。電腦得到的報償不是一塊電腦狗糧，而是得到訊息：「幹得好，增強剛才你做出這個猜想時用到的突觸。」接下來電腦會繼續猜，這次會使用新的加權。接下來的步驟你可以想像出來：電腦會持續猜測，每次都調整加權，直到學得完成任務的方法。

增強學習已經精通了一項極為艱難的技術：下西洋棋，以及更為困難的圍棋。現在電腦的棋力超強，完全勝過人類，而且他們還是自己教自己下棋。我想到的一個演算法是Alpha Zero，在二○一八年耶誕節前夕於《自然》雜誌上發表研究結果。研究人員只教Alpha Zero圍棋的規則：棋盤的模樣、下棋的方式等，之後演算法會自己和自己下西洋棋或是圍棋。這種作法聽起來違背直覺，重點在於每個「自己」並不知道另一個「自己」的思考內容，只知道對方下的棋步。也沒有教師，只有一些事先輸入的規則，讓電腦知道下的棋步是好是壞，以及判定輸贏的標準。四個小時後，電腦就具備了世界級的水準。

這真是非常了不起的成就，而且不只可以讓Alpha Zero下各種棋類，還可以讓它做別的事情。谷歌人工智慧團隊的大衛．希爾瓦（David Silver）展示了Alpha Zero利用遙控器操縱玩具直升機進行飛行特技，看到那個直升機進行筒狀翻滾飛行（barrel roll），真的讓人確信它有能力。

但是Alpha Zero真的比我的孫子聰明嗎？差得遠了（除非我孫子和它較量西洋棋）。電腦對於任務定義的範圍非常狹隘，而且體積要比我孫子的腦大多了，也不能光靠巧克力夾心餅乾就能運作。史密森尼學會（Smithsonian）的吳凱薩琳（Katherine Wu）估計，Alpha Zero硬體運作功率約為一百萬瓦，我孫子的腦只需二十瓦。會在這裡提到神經網絡和增強學習，是因為這兩者都屬於概念驗證（Alpha Zero內部採用了神經網絡），證明了這種邏輯運算的結果雖然距離腦還差得遠，但的確比較接近腦。

會在這裡提到神經網絡和增強學習，是因為這兩者都屬於概念驗證（Alpha Zero內部採用了神經網絡），證明了這種邏輯運算的結果雖然距離腦還差得遠，但的確比較接近腦。（hainguyenrp@pixabay）

人類的腦部是否也採用了類似深度神經網絡或是Alpha Zero所運作的方式？當然有，只是慢得不得了。人腦這種電腦是演化經由無數時光打造而成，其中的突觸和連結都縮小到極致。如果由一堆計算晶片組成的笨重電腦能夠辦得到，人腦也可以。

人工智慧領域中的人很清楚我的孫子遠勝過他們的電腦，並且也正在努力改進。每個人都猜電腦會有多聰明。我認為電腦最後會很聰明，我絕對不會想要和電腦競爭。有各種巧妙的無監督學習模式應用在電腦中，唯一的問題是要花多少時間才能追得上人腦，以及機器完成任務的方式和真正的人腦有多相近。更重要的是，機器完成任務的經濟效率能夠比得上人腦嗎，我會屏息以待這些結果。事實上就目前來說，光是超越人類的電腦所需要消耗的能量之高，就讓我無須擔心會電腦會掌控世界了。

看得到的神經網絡

機器學習領域中的主要人物許多來自電腦科學界，他們有四分之三的屬性為電腦怪傑、四分之一為神經科學怪傑。但是探索智能的科學家中，依然有許多人會親自動手做實驗，好確知腦部的運作方式，而扎實的證據只能來自於研究真實的腦部。（相關報導：誰是你的陪審團─你必須溝通並改變其立場的人：《好問》選摘（2）｜更多文章）

像我這樣的職業實驗科學家最先想到的問題是：「我們要怎樣才能夠研究腦中由無數神經元構成的神經網絡？同時記錄數千個神經元的活動？就算能夠辦得到，要怎麼消化這些資料？」數十年前這似乎辦不到，但現在正有所進展。

一如以往，我們要把各個領域中的進展結合起來。其中有四個領域特別重要。首先是雙光子共軛焦顯微鏡，能夠呈現比傳統顯微鏡更為清晰的影像，而且不只能夠看到表面，還能夠深入下方。如果用來看腦，能夠看到皮質中的各層。之前提到了，雙光子顯微鏡是登克發展出來的，他是科學界中真正的創意大師，也是未來的諾貝爾獎得主（我希望）。有人寫說傳統顯微鏡和雙光子顯微鏡之間的差異，就像是在黑暗和在亮光下看彩色電視機。雙光子顯微鏡讓我們不需要損壞細胞就能觀察，這是傳統共軛焦顯微鏡所遭遇的障礙。

第二個領域是遺傳工程，能夠讓我們改造腦神經元的一種蛋白質，在特定的神經元活動時讓它發光（更正確地來說是改變螢光色）。如果你用共軛焦顯微鏡觀察有這種改造蛋白質的神經組織，可以即時看到個別神經元的活動。

第三項進展來自於昆蟲生物學界。如果你要追蹤一隻甲蟲的爬行路徑，例如你想知道什麼狀況讓甲蟲往左轉或是往右走，你可以拍攝甲蟲爬行的影片，接著找個研究生把甲蟲的移動路徑記錄下來。不過昆蟲生物學家找到了自動記錄的方式。他們把甲蟲的背部黏在固定平臺下方，讓甲蟲的腳懸空，然後在甲蟲下方放一個很輕的圓球，像是乒乓球之類的，讓甲蟲的腳抓住圓球。這個圓球放在幾乎沒有摩擦力的容器上，只要甲蟲腳在動，球便跟著轉動，這時只要測量球的轉動就知道甲蟲的移動狀況了，可以由電腦自動記錄（這時研究生可以去從事其他比較有趣的事情）。

第四項進展是我們現代人認為理所當然之事：廉價的電腦運算能力。當雙光子顯微鏡拍攝出幾千個細胞，每個都因位處於活動中而發出小小的亮光，這時你得到的是巨量資料。沒有當代電腦的運算能力，我們進行實驗的科學家無法從這些觀察結果中發掘出意義。

最後我們需要傑出、堅持與勇敢的神經生物學家。他是雙光子顯微鏡的發明者之一、普林斯頓大學的唐克。他把以上種種進展融合起來，並且加上自己的一些妙點子。

唐克說：「我們把目標放遠，試試看一次觀察數千個神經元，而且是在意識清醒且不受干擾的動物身上，觀察動物在看到東西並且思考這些東西時的神經元活動。」

唐克和其他人發展出了讓小鼠固定在架子中的方法，就像是上面說的甲蟲。但是小鼠並不介意，因為在這個狀況下有食物可吃。小鼠也如甲蟲那樣站在圓球上，唐克把共軛焦顯微鏡對準小鼠頭上開的洞，洞底下是小鼠的皮質。這頭小鼠的皮質神經元中已用遺傳工程的方式，植入了能指示出活動狀況的蛋白質。當牠開始自然的活動（跑動），唐克和同事可以觀察到腦部神經元的活動。還有，這個小鼠是在虛擬實境構成的合成世界中活動的。科學家能夠教小鼠完成各種任務，例如在虛擬迷宮中跑動，同時觀察小鼠神經元的行為。

這是很新的技術，但成效卓著，主要的發現是神經元的活動每天都維持固定的方式，舉例來說，有特定的刺激出現時，在絕大部分的狀況下，同一群主要感覺神經元會活躍起來。並非一定得如此，這些神經元可以各自有活躍的模式，讓我們完全無法理解。事實上，負責感覺運動統合的皮質區域中，神經元的反應更具變化，有時飄忽、有時穩定，目前尚無法解明。這並非意料之外的事情，因為該區域所呈現的是輸入的感覺訊息與行為之間的連結，會因為情況而有所變化。這是巨大的思維挑戰，而不是技術障礙。

這個方向的工作我就只能說到這裡。唐克的學生把這項技術散播到整個神經科學界。小鼠在虛擬迷宮中跑步，牠們神經元活躍的訊號傳入研究人員的電腦。你全心全意思索能夠進行的實驗。我們能夠看到細胞群組形成的過程嗎？記憶會留在腦中固定的場所或是會移動呢？腦睡覺的時候神經元在做什麼？小鼠想要某些東西、看到伴侶時，神經元活動有何變化？現在有了工具，剩下的就是做實驗了。請保持關注，有些事情正在發生。（相關報導：誰是你的陪審團─你必須溝通並改變其立場的人：《好問》選摘（2）｜更多文章）

《眼見為憑》立體書封。（時報出版）

＊作者理查．馬斯蘭（Richard Masland, 1942-2019）為哈佛醫學院科甘傑出眼科學教授（David Glendenning Cogan Distinguished Professor of Ophthalmology）與神經科學教授。曾擔任世上最大視覺研究機構麻州眼耳醫院（Massachusetts Eye and Ear Infirmary）研究主任多年。本文取自時報出版新書《眼見為憑：從眼睛到大腦，從感知到思考，探索「看見」的奧祕》。