大數據年代──「人工智能時代下的可持續發展」網上講座記錄摘要
撰文:吳騫桐(《大通報》學生記者)
蒙美玲教授、沈祖堯教授、嚴鴻霖教授主講。如欲重溫講座,可按此。
二十一世紀,人類再次迎來科技革命,當中最觸目的技術正是人工智能。可持續發展目標論壇在六月二十三日舉行「人工智能時代下的可持續發展」網上第四講,邀來中大禢永明系統工程與工程管理學蒙美玲教授、內科及藥物治療學系沈祖堯教授及地理與資源管理學系嚴鴻霖教授,分享他們在相關的醫學與環境研究,以及實際操作人工智能的經驗。實踐可持續發展目標期間,人工智能擔當怎樣的角色?它將為人類帶來甚麼新的機遇與挑戰?
蒙教授:人口老化的威脅
講座一開始,蒙教授便指出人工智能早已滲透到生活的每一個角落。「比如聊天機械人,或者一些推薦你去看電影、聽音樂、買書的系統;又比如圖像癌症檢測,又或者大家都熟悉的人臉識別,及自動駕駛汽車等等⋯⋯有好多種類。」
回溯至1955年,「人工智能」(artificial intelligence)的專有名詞首次出現於美國學者麥卡錫(John McCarthy)等於達特茅斯會議裏的報告。蒙教授指出,「當時這個領域主要想讓計算機去解決一些本來要用人類智慧才能解決的問題。當中涉及一些思考:甚麼是智能?怎樣令計算機去學習與推理、擁有感知,甚至人性化地透過語言作溝通?」
過去十年,人工智能技術出現巨大的突破。蒙教授歸因於三方面,包括「大數據」(big data)、具高度運算速度與能力的「雲端運算」(cloud computing)及自主學習模式的「機器學習」(machine learning)。她特別點出「大數據」的重要性,指基於數據建立的機器學習模型,能作出準確的預測與運算。
以「包剪揼」遊戲程式為例。在示範影片中,程式以鏡頭記錄使用者的手形數據後,能即時建立一個人工神經網絡,與使用者比試,「因為人工智能運算速度好快,所以基本上不會輸。當你差不多出招時,鏡頭捕捉到你的動作,程式就會知道你即將出甚麼招數。」
蒙教授又以語音合成系統為例。她讓觀眾就兩段錄音投票,結果他們皆無法清楚辨識真實人聲和人工合成人聲的差異,「假如有足夠數據,我們能將語音系統,特別是情感不太豐富的英文語音,訓練到好真實的程度。」
2019年,蒙教授團隊與其他大學開展「以人工智能從口語訊息篩查神經認知障礙」研究,嘗試將人工智能應用於醫療檢測。神經認知障礙,乃大腦功能慢性衰退的疾病總稱,最常見的病症包括「阿滋海默氏症」(Alzheimer’s disease)等,發病時病徵較隱匿,患者主要為長者,長遠會導致記憶、溝通、思考、判斷等認知功能全面退化。
神經認知障礙治療成本高昂,將成為可持續發展的巨大障礙。2015年全球六十五歲或以上的人口為百份之十二,2050年預計將增至百份之二十五。2018年神經認知障礙的全球患病人數為五千萬人,平均每三秒鐘就出現一個新案例;隨着人口老化加劇,2050年的患病人數估計將增長三倍,升達一億五千萬人。屆時疾病負擔的費用將由一萬億美元升至二萬億美元,佔全球生產總值一個百份點。
雖然目前已有神經認知障礙的檢測方法,如面對面認知測驗、血液測試及腦部掃描等,但它們皆存有局限,「例如,臨床人力資源短缺下患者需長時間等待,使採樣數據變得稀疏;又如,人工判斷難免會有主觀性。」而人工智能,正是一個相對密集而客觀的數據收集方法。
那到底具體的檢測該如何進行?蒙教授的答案是語言。1986年,美國學者斯諾登(David Snowdon)進行「修女研究」(The Nun Study),透過十多年間持續比對修女年輕時撰寫的入會自傳文章,以及她們年老時腦部衰退狀況,發現文字複雜性、思想密度較低的群組,患上神經認知障礙病症的風險相對思想密度較高的群組高出六十倍。雖然修女研究的對象只有數百人,而且該實驗在五十年前進行,但蒙教授指這研究對預測人們老年時會否患上阿滋海默氏症達九成準確度,足證語言直接反映我們的腦部認知功能。因此,若加上大數據和人工智能的支持,便能加大研究對象的數目及加強結果的分析。
在香港,蒙教授團隊亦有類似實驗。她解釋,阿滋海默氏症主要影響大腦兩個部位,分別是掌管語言產生、意義連貫性和合理性的布氏區(Broca’s area),以及處理語音訊號和理解的威氏區(Wernicke’s area)。藉着提問和繞口令測試,蒙教授團隊發現認知功能較好的人,說話較流暢,感情也較豐富;相對,認知能力比較差的人,說話多停頓與猶豫,反應慢,語速與流利度也較低。
近年,蒙教授團隊設計了兩個應用程式。第一是認知測試,「它主要想方便一般人收集自己的數據。程式內有單詞回憶測試、圖片描述任務等,錄音後,人工智能會自動分析,製作數據圖。」第二是採樣測試,「面對臨床專業人士時,患者反應可能會與日常生活不同,所以程式會以隨機響鈴的方式,讓用家答問題採樣,比如『你現在想甚麼?』、『你現在做甚麼?』、『由0至100,你的放鬆程度是?』等等。」
「我們希望能藉着話語,如咬字、語用、詞彙、談話等特徵,來檢測神經認知障礙的跡像。」蒙教授指人工智能檢測有不少優點,「自動化、低障礙、客觀、符合成本效益的程式,不但有效解決人手短缺問題,其即時口語的數據更能擴充傳統記錄模式,多方面支援專業人士的主觀判斷。」
蒙教授總結,面對日益嚴峻的人口老化問題,發現並盡早預防神經認知障礙的病潮威脅,減輕公共醫療系統的負擔,對香港可持續發展具極長遠的戰略意義。
沈教授:人工智能的醫學應用
面對人口老化的全球威脅,可負擔的優質醫療服務是落實可持續發展目標的關鍵,「在醫學治療愈來愈昂貴的大環境下,我們能否提供公平的醫療服務,使人們不會因缺乏足夠財富而得不到好的照顧呢?」
人工智能在醫學上的廣泛應用,能大幅度優化醫療服務。沈教授從醫生、醫療系統及病人三方面加以解釋。「凡是與掃瞄圖像有關的專科,包括放射科、病理科、腦科等等,都能用上人工智能。有時病人做MRI(磁共振成像),睡在機器洞內十幾二十分鐘已經覺得好長時間,但醫生之後檢測是要花半小時、一小時,甚至更長時間去看一張張黑白相片。」「長時間重覆這些好沉悶的工作,醫生很容易有錯漏,而人工智能正正可以做得更快、更好。」
沈教授又舉例,「腸胃科醫生常要照大腸,在腸道內鑽來鑽去找一兩粒息肉。有時候它們好細粒,或不太突出扁扁的,或在難以看見的彎角處,醫生不專心都會看漏眼。而人工智能不但能偵測息肉的位置,還能測量它們的形狀和大小,甚至可清楚看到細胞核,判斷其為良性或惡性、做手術的機率。」
據統計,醫生平均需要用九十六點六分鐘看片診斷,但人工智能平均只需花六分鐘就能完成同樣的工作,極為省時。「例如,我們常用的一種科技是膠囊胃鏡,它是一部相機,於患者腸道內走六小時後便會『痾出來』。如果醫生要逐一看幾百萬張圖像,可能要花很長時間。」沈教授笑言,「但交給人工智能分析的話,它很快能從中抽出異樣的相片──這樣醫生的生活就美好多了,有時間去看球賽,不用花六小時好痛苦地看着蠕動的腸。」
除了快速精準的圖像分析,人工智能更能通過大數據分析,提升醫療系統內資源調配的效率。「以基因為例,我們抽一筒血,就能知道抽血者的幾萬個基因。人工智能最厲害的地方是,它不但能探測癌症基因,更能大概估算抽血者接受化療後的反應、他患上心臟病或阿滋海默氏症甚至自殺的機率。」
「有些患乙型肝炎的人,發展肝癌的機率遠超普通人一百多倍。若有數據估計,我們就能一早為他們預防,做手術。」沈教授說,「又好似我經常要處理的胃出血。雖然我們會用『焫雞』(soldering Iron,又稱烙鐵)嘗試令血管止血,但當中有百份之十至十五的患者還是會重新出血。如果人工智能可以預先估計那些人需要重新輸血、入深切治療部的話,對日後的治療其實大有幫助。」
承接蒙教授提到的人口老化問題,沈教授點出人工智能對「健康促進」(health promotion)的效用。「如果你時刻將身體的反應,如心跳、脈膊、血糖等數據輸送到電腦,當有事時醫生便能好快察覺,並即時通知你到醫院檢查,預防悲劇發生。」「尤其是老人家需要食不同的藥,他們可能會忘了自己有沒有食,或是食漏了一次,而人工智能的工具正能隨時提醒長者。」
至今,坊間已有不少具監測身體機能的產品,「比如,Apple Watch能量度心跳跳動、心率不規律等等狀況。雖然它只有一個導程的心電圖(ECG),但已獲美國食品藥物管理局(FDA)認證。又或者是一些貼身的運動衣,能量度肌肉的活動、心跳率,甚至汗裏含有的糖份和鹽份。這些可攜式設備不單設計給患病的人使用,還能讓健康的人更好地照顧身體狀況。」
但沈教授強調,使用人工智能同時,也須思考背後的道德問題。「比如某人有癌症,數據指他打針後仍然會死,那是否就不救他,將資源節省來救另一個人?我們會否過於依靠機械計算,而剝奪了某些病人的生存權?如果人工智能計算錯誤,又是誰來負法律責任?」技術背後的私隱保障亦不容忽視,「這些人工智能收集的數據和資訊會不會被人偷去,然後賣到保險公司?我們的私隱會否被公諸於世?」
沈教授更提到機械人的醫護運用及「社交孤立」(social isolation)問題。「做手術有機械人幫手當然好──學生手震不用怕,老花教授手震也不用怕,因為機械人的『眼睛』非常清楚,能將『頭』伸到非常近地觀看整場手術。」「但從護理層面來說,大家覺得老人家喜歡望木口木面的機械人,還是喜歡望真實的人、讓子女孫兒陪他們聊天呢?」
沈教授以汽車駕駛來類比醫療過程,「以前的車全由人手控制,你要用棍波、要踩油門,但將來的車可能連軚盤都沒有,所有路線和車速全由機器負責。當中,人的參與愈來愈少,而機器的參與則愈來愈多。」「正如以前醫生要望問聞切,摸脈膊、望舌頭、與病人聊天,但以後可能只需抽一筒血就可以了,電腦會告訴醫生病人有甚麼病、需要食甚麼藥、需不需要做手術等等⋯⋯過程中,病人全程面對機械人。但,這真的是我們想要的醫療服務嗎?」
面對發展飛快的人工智能,人的價值在何?「醫學包含人文的價值、人的生命、人的感受⋯⋯這些事物皆具有不可取替的地位。有些地方不能過界,因為我們不想醫學只是一門科學,我們不想只依靠機械去面對一個個活生生、有血有肉的人。」沈教授提醒,「或許我們是時候停一停,想一想該如何在科技與人類中間劃一條線,以維持一個可持續的醫療服務。」
嚴教授:人工智能的環境貢獻
接續兩位講者提及的人體健康問題,嚴教授將人工智能的討論擴闊至地球健康的層面。
全球暖化帶來的極端天氣,嚴重影響人類生活及生態環境。「當地區極端高溫與乾燥時,很容易形成大火。2019年,澳洲有一場好嚴重的叢林大火,覆蓋範圍去到一千八百萬公頃。即多大呢?大約是一百六十八個香港。它不但令好多生物失去家園及生命,產出的濃煙更對人體極為有害。」嚴教授指,類似的氣候災異未來將更早出現、更遲結束,而每次的嚴重程度亦將加劇,「正如2018年,歐洲出現一場範圍很廣闊的熱浪,幾乎整個歐洲都受影響。根據專家估計,歐洲熱浪再次出現的機率達五倍之高。」
據氣候中心統計,1980年代至2010年代間全球平均溫度最高的十個年份,有八個是於2010年或之後出現;最高溫度的是2016年,其次是2019年,地球未來將持續升溫,並有更多極端氣候災難發生。「我們都需要問,為何地球會出現極端氣候?氣候改變將如何發生?它們又會對人類生活造成甚麼影響?」
有別於其他星球,地球系統涉及不同時空與尺度的事,包括生物、化學、物理等諸多範疇,乃極為複雜的研究課題。若要認識如此複雜的系統,大數據的支援不可或缺。
在地球科學領域裏,大數據的運用可從「5Vs」理解。以香港為例,嚴教授團隊數年前建立了普勒激光雷達系統,分別在香港中文大學、天文台京士柏氣象站及元朗洪水橋採集數據。「數量(volume)方面,它們每日收集超過100GB數據,儲存量不斷增加。時效性(velocity)方面,它們收集數據的速度以每秒計算,非常快速。多樣性(variety)方面,除了運用系統本身收集的風速風向、氣溶膠高度分佈外,我們團隊更參考超過一百五十種參數,包括空氣質素、衛星數據等作分析。價值(value)方面,三維度的監測系統提供的實時數據,讓我們做準確的氣象預測;正確性(veracity)方面,我們會做一些對比驗證,確保系統數據跟其他事件的一致性。」
雖然過去已有不同數值模型,但它們皆存有局限。2019年,德國學者賴因斯坦(Markus Reichstein)歸納出四種機械學習模式於地球科學的應用方法。其一,物件分類與局部化,讓人工智能指認氣候圖像,如熱帶氣旋。其二,超分辨率(super-resolution)融合,讓人工智能將低解析度的氣像圖還原至標準的地面實況(ground truth)。其三,影像預測,讓人工智能提供短期氣候預報數值,如颱風路徑。其四,語言轉換,讓人工智能將數值自動轉成動態時序,如相對濕度。
人工智能的廣泛應用,對十七項可持續發展目標非常重要。研究顯示,針對「氣候行動」((SDG 15)三項環境相關目標,人工智能對其百份之九十三項細目標具正面作用。
嚴教授逐一引例說明。就「氣候行動」(SDG 13),人工智能可提供詳細的氣候演變及影響分析,「外國有學者用人工智能去計算排污量,研究2020年、2050年甚至2080年全球蚊的種類、數量及分佈區域。蚊是登革熱等病的主要傳播媒介,假如我們預先知道蚊的分佈,就能及早進行針對性的滅蚊工作。」他又以香港為例,「香港路邊空氣污染好嚴重。以往要做較仔細的化學樣本分析,不但貴,也需較長時間。但人工智能可用每日監測站收集的空氣數據,計算令可吸入懸浮粒子、一氧化氮等污染物加劇的氣候條件,讓我們掌握污染物特徵,集中處理排污源頭。」
就「保護海洋生態」(SDG 14),人工智能發展的深度神經網絡系統能快速完成水域調查,「比如左邊黑白的圖,肉眼很難看見全球哪些位置有漏油事件發生。但經系統計算後得出的右圖,可清楚見到紅色地區是較高機會發生漏油事件的地點。」另一例子是水下生物研究,「派人到全球不同水域做統計是不可能的事,但通過人工智能技術,我們能很快知道各類水下動物的分佈、遷徙,從而制定相關的保育政策。」
就「保護陸地生態」(SDG 15),人工智能與衛星技術結合能準確完成陸上調查,「例如,我們做環境規劃及綠化決策時,很需要人工智能推算的沙漠化熱點、沙漠化速度與廣度、植被種類及減少速度等資料。」
嚴教授強調,人工智能的跨範疇數據分析能力,對達致政策上的環境共同效益(environmental co-friendly)不可或缺。「以大灣區為例,單一區域的改變已足以對整座城市的環境有負面影響,包括氣候升溫、空氣質素、人體健康等等。人工智能從不同數據庫裏做綜合分析,正可幫助我們制定全面的土地規劃。」
然而,人工智能亦會對環境構成危害。「人工智能用電腦做大量運算,當中需要使用很多能源。假如不是用碳中和(carbon-neutral)的可再生能源,如水力及風力發電等,其實會產生出很多溫室氣體副產品。」「另外也有一個風險,就是當人工智能準確探測地球的資源分佈時,人類或會過份開採。」
為了更有效地運用人工智能,嚴教授提出五個建議範疇。其一,提升可解釋性,因人工智能目前只能依從數據的特性推算結果,缺乏中間的推理過程,不利實際處理環境問題;其二,與物理學保持一致,訓練人工智能以物理定律進行預算;其三,需充份考慮大數據的複雜與不確定性;其四,突破有限的標籤數據,讓人工智能預知前所未見的極端氣候;其五,提升現有的數據處理及運算技術。
「人工智能確是一個挺好的伙伴去幫助人類更了解地球科學。」講座最後,嚴教授道出自己的未來願景,「將來,不知道機械人會不會成為天氣預報員,甚至成為科研同事,大家一同研究地球氣候呢?這都是下個世紀很有機會發生的事。」
小至個人身體狀況,大至全球環境議題,人類已無法離開人工智能的技術。正如三位講者所言,人工智能對可持續發展目標有莫大的貢獻,包括優化公共衛生體系,「良好健康與福祉」((SDG 13)等等。雖然目前仍有諸多道德與技術上的問題需要解決,譬如個人私隱、法律責任、人倫關係,以及信息量不足、決策偏差、缺乏常識推理等等,但相信只要運用得宜,人工智能可讓我們的世界變得更為美好。