敬告讀者: 《中大通訊》已停刊,本網暫停更新。請移玉步造訪本校最新通訊《走進中大》網頁:https://focus.cuhk.edu.hk,閱讀大學報道和消息。
人工智能讓大數據得以發揮潛力,造福大眾,然而百利之中,豈無一弊?「AI:人算不如機算?」系列今期會探討人工智能可如何用於公共事務、當中又有何考量。
早上八點,火車又再卡在路上。你汲取上週的教訓,今天已一早出門,但這號稱「服務第一」的鐵路公司,總有辦法令你前功盡廢。你睡眼惺忪,與無數其他趕着上班上課的乘客一樣進退失據,唯一可以做的,大概就是拿出手機,到社交平台發泄一番:
「叻啦你,一個禮拜可以壞三鑊。都唔知你班友點造野。」
區區一則貼文,或已能讓你一吐烏氣,但除此之外,似乎無甚作用。不過對羅淑莉來說,網絡上的漫筆雜談、快言快語,其實也可為社會帶來改變,關鍵在於如何把它們整合,加以分析。
現為地理與資源管理學系博士生的羅淑莉,一直運用社交媒體數據,研究大眾對城市公共交通系統的觀感。她早前便於微博收集數以萬計談及深圳地鐵的貼文,望能從文章的情感及發布時地,找出系統需要改善之處。成果於第二屆國際城市信息學會議上發表,獲最佳學生論文獎。
「以大數據彌補傳統問卷調查之不足,是城市研究近年一大趨勢。」何穎教授說。何教授是羅淑莉的導師,上述論文正是由兩人合撰。教授指出,問卷雖有助學者更全面了解研究對象的社會背景,又可因應研究方向度身訂造,但其所費不菲,不能經常使用。反觀近年智能電話和配備全球定位系統的車輛隨處可見,社交媒體又成為生活必需,各城市的物聯網(Internet of Things,通稱IoT)羽翼漸豐,大可為學者提供源源不絕的數據,揭示居民生活型態。
「要稱得上智慧城市,道路上少不了高效益、低排放的電動車,而要推廣電動車,市內先要有足夠的充電站。問題來了:我們該在哪裏增設充電站?此時大數據便派上用場。」何教授用另一例子點出大數據在城市規劃的角色。過往研究人員只能藉問卷收集數據,如今何教授等人正研究利用現有充電站收集得來的數據,歸納出熱門的充電地點和時段,確保新增站點分布得宜。
但顧名思義,大數據浩如煙海,要探索這個寶庫,難以單靠人力。還好我們可以教導電腦處理數據,讓它們分擔部分工作。我們甚至可以將教學的工夫也省下,讓電腦運用人工智能,自行學習如何理解數據。須知要機器看得懂數據,本身已不容易。就以社交媒體為例,貼文多是信手寫來,舛錯叢生,如文首的例子便夾雜諸多俚語、別字。與其試圖以人手羅列語言的千萬種常態與變態,何不找來一堆範例,讓電腦自己參透領悟,從而學會閱讀各種文本,再加以消化?
「將人工智能引入公共管理,目的不外乎提升效率和達致服務個人化。」數據科學與政策研究課程主任黃偉豪教授說。除了釋放大數據的潛能,人工智能亦能不分晝夜,貼身照顧民眾,譬如日本便有能夠針對不同需要、準確提供政府服務資訊的聊天機械人。無論是電子政府(e-government)抑或電子管治(e-governance)、服務供應還是政策制定,人工智能都能助一臂之力。近年有所謂「AI為民」(AI for Social Good,簡稱AI4SG)之說,其理念亦無非是借助人工智能,造福社會。
不過人工智能也是有其缺陷。羅淑莉曾比對她採用的人工智能模型和經典的統計分析法,發現前者在辨別貼文情感方面表現不太理想,最後在研究的其中一部分索性回歸傳統。何教授估計模型或需加強訓練,但這是否就是問題的癥結,恐怕誰也說不準。不少人工智能程式有「黑盒」(black box)之稱,講的就是其決策機制錯綜複雜、模糊不清,如在黑箱中作業,以致一旦犯錯,問題始末難以查究。而無論如何,人工智能本來就不見得比傳統的分析法更善解人意。
「把情感按正負面分門別類,人工智能是辦得不錯的,但說到辨析情感的強弱程度,它還是束手無策。」羅淑莉分享自己用人工智能作情感分析(sentiment analysis)的心得。「即便簡單如分類,它也就只懂正負中立之分。你若硬要它分得細緻一些,具體說出情感的性質,結果大多會是一團糟。」
那麼要人工智能讀懂譏諷、暗示之類的遁辭,自然是難上加難。文首貼文的反語,常人一看就明白,對電腦來說卻不然。何教授指,學界也不斷在嘗試令人工智能看得透上文下理、聽出弦外之音,但暫時來說,機器遇着數據隱晦精微之處,還是要靠我們導正。這也解釋了為何人工智能蔚為風潮,卻始終未能在公共行政領域完全取代人類。
「大眾對人工智能做到甚麼、做不到甚麼,仍有很多誤解。」黃教授說。教授曾參與環太平洋大學聯盟(ARPU)一項關於人工智能與社會進步的研究,一直思考機器可如何改善社會。「應付換車牌、派消費券這種瑣事,人工智能綽綽有餘,反正就是對對資料而已。但撇除此等普通技能,人工智能還剩多少本領?」以大學收生為例,校方看學業成績之餘,也會留意學生的品性。對人類而言,要判別一個人是否有原則、正直、樂於與人溝通等等,不是難事,畢竟我們都經過社會洗禮,對人情世故有所認知。但電腦又如何?在機器眼中,世間萬物俱是一堆數字和規則,然而人之稟性氣質,怎能以邏輯與算術概括?看來要讓人工智能代替中大各位同事招生,還是不太可能。
「又例如有人會覺得,讓人工智能參與法庭審訊可保裁決公正,但我們要從哪裏找來一條可以量度犯人悔意的方程式?」
黃教授這個例子,恰好道出人工智能另一大弊端:機器長着一副鐵面,卻不見得無私。上文提到,人工智能的思維模式、行事準則,皆學自人類選來的範例。人性使然,我們揀選樣本時難免會有偏袒,何況樣本也者,本來就是以偏概全。上樑不正,下樑又豈能不偏不倚?若是像羅淑莉和何教授般研究深圳這種年輕人口較多的城市,借助一套依賴社交媒體數據的人工智能分析法倒也無妨。但說到為公共機構招募人才、選賢任能,以人工智能之眼界,只怕它們愈幫愈忙。電腦以現有的僱員作樣板,選出來的人自然都是同一副模樣。不落窠臼,反而無緣入幕,「塘水滾塘魚」下,機構難有變革。而假如機構原來一直歧視某類應徵者,電腦有樣學樣,更是播其惡於眾也。
「不過也多虧人工智能的種種流弊,暴露為師作範的我們一路在樹立怎樣的榜樣。比起花時間想着把責任推卸給機器,我們更應趁機反省人類的各種偏見陋習,好好想想機器是怎樣學壞。」黃教授說。
輿論多了呼籲將人工智能用於公益的聲音,固然是好事,然而這也提醒了我們,人工智能可用以行善,亦可用來作惡。它為世人開啟的可以是個寶箱,亦可能是潘朵拉的盒子。我們見識過人工智能與大數據如何互利共生,而兩者的結合雖未臻完善,卻也漸見成績。但種種由大數據帶來便利並非予取予求,其代價是我們珍而重之、又或者已棄如敝屣的私隱。
「數據與私隱,好比魚與熊掌。兩相角力下,社會可走向兩個極端:寧可放棄一切好處,也不願犧牲半點私隱,此其一;將所有數據交出,以供監察,細至面部表情、一顰一笑,亦不例外,此其二。」黃教授說。一般人都想在中間落墨,以平衡數據與私隱為旨的數據管治(data governance),近年應運而生。
「一言以蔽之,數據管治就是約法三章,管束政府在內的數據使用者。」黃教授解釋道。法律固然是手段之一,而好的數據法,理應涵蓋數據的收集和使用目的、時間、類型與經手人。
「對數據如何被使用有所掌握,是邁向資訊對等的重要一步,而資訊對等,正是達至權力對等的關鍵。」
觀乎日常生活各領域,以公共行政中的數據運用,影響至為深遠。一眾科技巨頭的影響力再大,人們尚有不使用其服務的自由,然而皇皇政令,觸及的是社會上每一個人。不欲個人資料落入科技公司手中,大可遠離社交平台;面對牽涉大量數據的公共政策,對私隱有所堅持的民眾又是否有不參與其中的權利?
「如今數據科技無孔不入,大隱隱於市,談何容易。我們唯有盡量顧及各人的意願,減少政策對他們的衝擊。」黃教授說。「譬如有些人對智慧城市和物聯網有所顧忌,一想到家裏的電器可以監控自己的起居飲食,便毛骨悚然,那我們制定牽涉數據的政策時,就盡可能讓他們能夠選擇退出,或者先小試牛刀,邀請志願者作體驗,讓有疑慮的人從旁觀察,盱衡利弊。」
但說到底,世上並無十全十美的制度。比起典章律法,公民個人的數據素養(data literacy)更為重要。
「我常常跟學生說,資料刪掉後其實往往可以復原,陰魂不散。製造資料前三思,才是保障私隱的最佳做法。所謂數據素養,其中一環便是這種警覺。」黃教授說。「在數據年代安身立命,說穿了就是懂得用數據改善生活而不受科技奴役。」
以其種種瑕疵,人工智能暫難代替人類作重大決定,而其引起的私隱問題,更叫我們不得不慎而用之。但瑕不掩瑜,人工智能就算只能幫學者整理一下數據、在政策制定層面稍作輔助,也總算帶來一些方便。只要社會上下明白科技有所為、有所不為,人工智能終究能造福大眾。
「我們不斷談到的智慧城市,其初衷之一便是透過人工智能發掘個人的價值和力量,提升市民的社會參與度。」何教授說。誠然,人工智能用得其所,簡單一篇貼文,亦能惠及整個都市。
「人工智能的真諦,亦莫過於此。」
文/jasonyuen@cuhkcontents
圖/gloriang@cuhkimages、ponyleung@cuhkimages