AI：人算不如機算？

芝麻開門

AI社會的危與機

人工智能讓大數據得以發揮潛力，造福大眾，然而百利之中，豈無一弊？「AI：人算不如機算？」系列今期會探討人工智能可如何用於公共事務、當中又有何考量。

早上八點，火車又再卡在路上。你汲取上週的教訓，今天已一早出門，但這號稱「服務第一」的鐵路公司，總有辦法令你前功盡廢。你睡眼惺忪，與無數其他趕着上班上課的乘客一樣進退失據，唯一可以做的，大概就是拿出手機，到社交平台發泄一番：

「叻啦你，一個禮拜可以壞三鑊。都唔知你班友點造野。」

區區一則貼文，或已能讓你一吐烏氣，但除此之外，似乎無甚作用。不過對羅淑莉來說，網絡上的漫筆雜談、快言快語，其實也可為社會帶來改變，關鍵在於如何把它們整合，加以分析。

現為地理與資源管理學系博士生的羅淑莉，一直運用社交媒體數據，研究大眾對城市公共交通系統的觀感。她早前便於微博收集數以萬計談及深圳地鐵的貼文，望能從文章的情感及發布時地，找出系統需要改善之處。成果於第二屆國際城市信息學會議上發表，獲最佳學生論文獎。

「以大數據彌補傳統問卷調查之不足，是城市研究近年一大趨勢。」何穎教授說。何教授是羅淑莉的導師，上述論文正是由兩人合撰。教授指出，問卷雖有助學者更全面了解研究對象的社會背景，又可因應研究方向度身訂造，但其所費不菲，不能經常使用。反觀近年智能電話和配備全球定位系統的車輛隨處可見，社交媒體又成為生活必需，各城市的物聯網（Internet of Things，通稱IoT）羽翼漸豐，大可為學者提供源源不絕的數據，揭示居民生活型態。

「要稱得上智慧城市，道路上少不了高效益、低排放的電動車，而要推廣電動車，市內先要有足夠的充電站。問題來了：我們該在哪裏增設充電站？此時大數據便派上用場。」何教授用另一例子點出大數據在城市規劃的角色。過往研究人員只能藉問卷收集數據，如今何教授等人正研究利用現有充電站收集得來的數據，歸納出熱門的充電地點和時段，確保新增站點分布得宜。

但顧名思義，大數據浩如煙海，要探索這個寶庫，難以單靠人力。還好我們可以教導電腦處理數據，讓它們分擔部分工作。我們甚至可以將教學的工夫也省下，讓電腦運用人工智能，自行學習如何理解數據。須知要機器看得懂數據，本身已不容易。就以社交媒體為例，貼文多是信手寫來，舛錯叢生，如文首的例子便夾雜諸多俚語、別字。與其試圖以人手羅列語言的千萬種常態與變態，何不找來一堆範例，讓電腦自己參透領悟，從而學會閱讀各種文本，再加以消化？

美國已有城市利用社交媒體數據偵測交通事故，而人工智能正可幫助營運商分析和驗證社交平台上有關事故的信息，從而作出應變及通知乘客

「將人工智能引入公共管理，目的不外乎提升效率和達致服務個人化。」數據科學與政策研究課程主任黃偉豪教授說。除了釋放大數據的潛能，人工智能亦能不分晝夜，貼身照顧民眾，譬如日本便有能夠針對不同需要、準確提供政府服務資訊的聊天機械人。無論是電子政府（e-government）抑或電子管治（e-governance）、服務供應還是政策制定，人工智能都能助一臂之力。近年有所謂「AI為民」（AI for Social Good，簡稱AI4SG）之說，其理念亦無非是借助人工智能，造福社會。

不過人工智能也是有其缺陷。羅淑莉曾比對她採用的人工智能模型和經典的統計分析法，發現前者在辨別貼文情感方面表現不太理想，最後在研究的其中一部分索性回歸傳統。何教授估計模型或需加強訓練，但這是否就是問題的癥結，恐怕誰也說不準。不少人工智能程式有「黑盒」（black box）之稱，講的就是其決策機制錯綜複雜、模糊不清，如在黑箱中作業，以致一旦犯錯，問題始末難以查究。而無論如何，人工智能本來就不見得比傳統的分析法更善解人意。

「把情感按正負面分門別類，人工智能是辦得不錯的，但說到辨析情感的強弱程度，它還是束手無策。」羅淑莉分享自己用人工智能作情感分析（sentiment analysis）的心得。「即便簡單如分類，它也就只懂正負中立之分。你若硬要它分得細緻一些，具體說出情感的性質，結果大多會是一團糟。」

那麼要人工智能讀懂譏諷、暗示之類的遁辭，自然是難上加難。文首貼文的反語，常人一看就明白，對電腦來說卻不然。何教授指，學界也不斷在嘗試令人工智能看得透上文下理、聽出弦外之音，但暫時來說，機器遇着數據隱晦精微之處，還是要靠我們導正。這也解釋了為何人工智能蔚為風潮，卻始終未能在公共行政領域完全取代人類。

「大眾對人工智能做到甚麼、做不到甚麼，仍有很多誤解。」黃教授說。教授曾參與環太平洋大學聯盟（ARPU）一項關於人工智能與社會進步的研究，一直思考機器可如何改善社會。「應付換車牌、派消費券這種瑣事，人工智能綽綽有餘，反正就是對對資料而已。但撇除此等普通技能，人工智能還剩多少本領？」以大學收生為例，校方看學業成績之餘，也會留意學生的品性。對人類而言，要判別一個人是否有原則、正直、樂於與人溝通等等，不是難事，畢竟我們都經過社會洗禮，對人情世故有所認知。但電腦又如何？在機器眼中，世間萬物俱是一堆數字和規則，然而人之稟性氣質，怎能以邏輯與算術概括？看來要讓人工智能代替中大各位同事招生，還是不太可能。

「又例如有人會覺得，讓人工智能參與法庭審訊可保裁決公正，但我們要從哪裏找來一條可以量度犯人悔意的方程式？」

黃教授這個例子，恰好道出人工智能另一大弊端：機器長着一副鐵面，卻不見得無私。上文提到，人工智能的思維模式、行事準則，皆學自人類選來的範例。人性使然，我們揀選樣本時難免會有偏袒，何況樣本也者，本來就是以偏概全。上樑不正，下樑又豈能不偏不倚？若是像羅淑莉和何教授般研究深圳這種年輕人口較多的城市，借助一套依賴社交媒體數據的人工智能分析法倒也無妨。但說到為公共機構招募人才、選賢任能，以人工智能之眼界，只怕它們愈幫愈忙。電腦以現有的僱員作樣板，選出來的人自然都是同一副模樣。不落窠臼，反而無緣入幕，「塘水滾塘魚」下，機構難有變革。而假如機構原來一直歧視某類應徵者，電腦有樣學樣，更是播其惡於眾也。

「不過也多虧人工智能的種種流弊，暴露為師作範的我們一路在樹立怎樣的榜樣。比起花時間想着把責任推卸給機器，我們更應趁機反省人類的各種偏見陋習，好好想想機器是怎樣學壞。」黃教授說。

輿論多了呼籲將人工智能用於公益的聲音，固然是好事，然而這也提醒了我們，人工智能可用以行善，亦可用來作惡。它為世人開啟的可以是個寶箱，亦可能是潘朵拉的盒子。我們見識過人工智能與大數據如何互利共生，而兩者的結合雖未臻完善，卻也漸見成績。但種種由大數據帶來便利並非予取予求，其代價是我們珍而重之、又或者已棄如敝屣的私隱。

「數據與私隱，好比魚與熊掌。兩相角力下，社會可走向兩個極端：寧可放棄一切好處，也不願犧牲半點私隱，此其一；將所有數據交出，以供監察，細至面部表情、一顰一笑，亦不例外，此其二。」黃教授說。一般人都想在中間落墨，以平衡數據與私隱為旨的數據管治（data governance），近年應運而生。

「一言以蔽之，數據管治就是約法三章，管束政府在內的數據使用者。」黃教授解釋道。法律固然是手段之一，而好的數據法，理應涵蓋數據的收集和使用目的、時間、類型與經手人。

「對數據如何被使用有所掌握，是邁向資訊對等的重要一步，而資訊對等，正是達至權力對等的關鍵。」

觀乎日常生活各領域，以公共行政中的數據運用，影響至為深遠。一眾科技巨頭的影響力再大，人們尚有不使用其服務的自由，然而皇皇政令，觸及的是社會上每一個人。不欲個人資料落入科技公司手中，大可遠離社交平台；面對牽涉大量數據的公共政策，對私隱有所堅持的民眾又是否有不參與其中的權利？

「如今數據科技無孔不入，大隱隱於市，談何容易。我們唯有盡量顧及各人的意願，減少政策對他們的衝擊。」黃教授說。「譬如有些人對智慧城市和物聯網有所顧忌，一想到家裏的電器可以監控自己的起居飲食，便毛骨悚然，那我們制定牽涉數據的政策時，就盡可能讓他們能夠選擇退出，或者先小試牛刀，邀請志願者作體驗，讓有疑慮的人從旁觀察，盱衡利弊。」

但說到底，世上並無十全十美的制度。比起典章律法，公民個人的數據素養（data literacy）更為重要。

「我常常跟學生說，資料刪掉後其實往往可以復原，陰魂不散。製造資料前三思，才是保障私隱的最佳做法。所謂數據素養，其中一環便是這種警覺。」黃教授說。「在數據年代安身立命，說穿了就是懂得用數據改善生活而不受科技奴役。」

以其種種瑕疵，人工智能暫難代替人類作重大決定，而其引起的私隱問題，更叫我們不得不慎而用之。但瑕不掩瑜，人工智能就算只能幫學者整理一下數據、在政策制定層面稍作輔助，也總算帶來一些方便。只要社會上下明白科技有所為、有所不為，人工智能終究能造福大眾。