中大成就

《中大創新》系列

人工智能帶領人類邁向智能生活

列印

人工智能技術深入各行各業，由自動駕駛、醫療檢測分析、工業生產，甚至解讀電影，要實現智能化，無不與之關連。林達華教授帶領中大多媒體實驗室（MMLab）團隊，將人工智能和深度學習（Deep Learning）技術融入日常生活，透過產業化發揮技術的應用潛力，亦寄望中大新成立的研究所能進一步推動電腦視覺技術和交叉學科研究的發展。

電腦視覺技術目前已被廣泛應用到人類生活層面各方面，包括自動駕駛、醫療X光片智能分析、體溫探測等等。

看準人工智能為未來大趨勢

林教授在學時已看準人工智能的龐大潛力，後來和其啟蒙老師湯曉鷗教授一同創立科企，成功將技術產業化，實現了將人工智能帶領人類邁向智能生活的願景，公司更一躍成為科創獨角獸。

成功背後，除了努力，還有對人工智能的濃厚興趣和執着。早於2004年，林達華教授在中大攻讀碩士時，已醉心於研究世界各地的人工智能發展。「湯教授是我的老師，他很鼓勵學生多讀別人的論文，那一年我最少看了一千篇論文，發現很多電腦和信息工程界的世界級學者都在研究人工智能，過程中確立了對研究電腦視覺技術的興趣。」林教授憶述。

林教授在美國麻省理工大學修讀計算機工程系博士，當時的電腦視覺技術研究主要偏向統計學習和概計建模。直到2014年，林教授重返中大執起教鞭，正好遇上深度學習技術騰飛。「很多世界各地人工智能專家每年都會參加ImageNet 大規模視覺辨識挑戰賽，參加者要撰寫程式分析並準確辨別一百萬張圖片的內容。歷屆冠軍隊伍的錯誤率保持在兩成六，直至2012年多倫多大學的專家首次利用深度學習技術，將錯誤率一下子降至一成六，震撼全球學界，亦令我深深感受到深度學習將是未來主導人工智能的革命性技術。」

加入中大後，林教授便帶領MMLab將深度學習融入機器學習及電腦視覺技術。MMLab為本港最早應用深度學習於電腦視覺研究的團隊，亦是亞洲唯一獲得由圖形處理器技術大會（GPU Technology Conference）頒發的「人工智能研究先鋒」美譽的實驗室。多年來，實驗室在人工智能技術有不少新突破，包括2015年提出全球首個超越人眼辨識準確性的人臉識別算法，其後更憑可檢測圖片中物體邊界並標出其輪廓的mmdetection系統，勇奪2018及2019年COCO物體檢測國際挑戰賽冠軍。

「凡是需要使用攝像鏡頭或擷取視像數據給電腦分析或學習的，都牽涉電腦視覺技術，當中的用途相當廣泛。」林教授續說，過去的電腦視覺技術每次只能分析5至10秒的影片，但我的團隊在2018年開發視頻分析框架，能每次捕捉10分鐘影片中的人、物件，甚至故事情節，以嶄新的方法理解電影。

在美國修讀博士期間，林教授見識到海外的多媒體實驗室如何將人工智能應用在不同商品，令他眼界大開，更明白到技術產業化才能體現人工智能的潛能和價值。2014 年，林教授聯同湯教授創立科企，將電腦視覺技術廣泛應用於自動駕駛、醫療X光片智能分析、體溫探測、垃圾自動分類，甚至工業生產人工智能化方面。

林教授團隊開發的深度學習目標檢測框架mmdetection，可訓練人工智能系統辨認物體，加快電腦視覺技術的效率及準確度。

推動電腦視覺和交叉學科研究

電腦視覺技術可應用於各種不同場景，不過初代技術只能做到一個模型適用於一個場景，而訓練一個新模型動輒需時數個月。林教授表示，近年相繼有科企研發可以集結過萬枚圖形處理器的「超級模型」，一體化應用在不同場景。「這亦是我們的目標，希望建立一個能應用在一百甚至一千個場景的基礎模型。這種模型的龐大運算和自主監測能力，有望繼深度學習後，再一次為行業帶來革命性的突破。」

林教授續說，交叉學科研究是未來發展趨勢，講求不同學科知識的滲透和參與。中大與上海人工智能實驗室在2021年合作成立「中大人工智能交叉學科研究所」，林教授獲委以重任，領導研究所培養人才、推展教育和知識轉移等，冀能推動人工智能及交叉學科研究的發展。

「我們正在推動交叉學科研究，希望跟不同的產業協作，了解不同行業面對的困難和挑戰，思考人工智能系統如何落地解決業界問題。」

— 林達華教授

中大信息工程學系副教授、商湯科技聯合創始人

研究領域：人工智能電腦視覺技術

主要成就：

曾於CVPR、ICCV、ECCV、NIPS、T-PAMI 等國際頂尖會議及期刊發表過百篇論文
NIPS 最佳學生論文獎（2010）
ICCV 最佳審稿人獎得主（2009、2011）
AAAI（2020）、CVPR（2019）、ECCV（2018）領域主席

下載所有相片