研之成理:
極往知來—— 利用大數據和統計學習方法管理投資組合風險
王海嬰 教授
統計學系
現今金融交易不再單單依賴經濟理論的研究,更牽涉到跨學科的學問,應用統計理論去評估風險和作出投資策略,有助減低投資損失以獲得最大的利潤。統計學家、理學院副院長(學生事務)王海嬰教授成功利用大數據和統計學習方法,開發出一套結合數據分析及決策的工具,並已被應用在商業的交易運算和開發風險管理平台,作出最佳選擇策略建構投資組合。
投資回報和風險平衡
金融投資的風險管理,追求的是利益和可承擔風險之間的平衡。很多人可能以為是低買高賣獲利便為之優異的表現,但現實中不少投資決策更講求的是投資的穩定性,而金融數據正是左右決策的重要指標。王教授指出,這些數據帶有很多「雜訊」(statistical noise),並極具「不穩定性」(instability),因此有必要找出一個有效的「過濾器」把有用的資訊找出來加以應用,增加評估工具的可靠性,以得出最穩定的投資組合。
他舉例而言,如果只是透過分析數據去作出股票買賣,交易的次數就會變得很多而增加交易成本,亦是影響淨回報的其中一種不穩定性。透過數據分析加上調整穩定性,除了減低投資風險,亦有助降低交易次數及其成本,所得利潤因而增加——正是統計學和風險管理之間的微妙平衡。
數字分析以外的統計學
一般人對於數據的固有概念可能局限在數字的型式。然而現今發展中,「數據」可以包含圖像、文字、聲音等各種形式。王教授指出,統計學可分為兩大範疇,分是隨機性的分佈特徵(distributional properties),當中包括包括數據的共性(commonality)及極端值(extreme value);而一方面則是決策 (decision),利用分析數據得出的分佈特徵,再結合不同的目標進行操作,例如每一隻證券價格的數據都含有大量雜訊,如何有效進行適合的決策去篩選出正確的證券建構投資組合。王教授的其中一個研究範疇,正是應用大數據和統計學習方法於金融科技,對證券的隨機性作分析,為不同企業所需的目標去進行決策。王教授強調統計是一門跨學科的專業,除了要了解數據在統計學中的隨機性外,也要考慮數據在各個主題學科領域中的所關心的目標,從而作出決策。
百分百可靠的大數據及人工智能?
傳統統計的過程都牽涉到前文所述的兩個步驟——首先盡力描述大量數據的分佈特徵,再按獲得分析結果去進行決策。可是第一個獨立的過程中,牽涉的數據之大有如恆河沙數,而且有著大量與目標決策無關的雜訊。例如人體共有3,100 百萬鹼基對 (mega-base pairs)的DNA,而出現突變而導致肺癌的基因的數量,相對之下只是滄海一粟。DNA的數量在統計學上可用「維數」(dimensionality)的概念去理解:DNA 的高維數代表了在海量數據中抽出導致肺癌的基因難度極高,因此找出相關基因的稀少性(sparsity)更為重要。透過王教授的研究,他開發了一套統計學習方法去確立具體的應用目標,同時將其結合在數據分析之中,從而有效地辨識出目標數據的稀少性,把數據直接送傳至決策之用。這個方法可大輻減少數據分析的誤差,提高對決策目標的應用效率。證券也是一個高維數的數據組——全球股票數量超過四萬,加上以毫秒計的高頻交易量,辨識目標數據稀少性成為控制投資風險的關鍵。王教授的相關研究已被應用在交易運算和開發風險管理平台,同步結合估計和最佳化程序;他同時希望在日後的研究中進一步有框架之上再加入資本配置的決策目標,以作出最佳選擇策略建構投資組合。
王海嬰教授和薛賢鴻教授推出網上開放平台,針對個別衍生工具的風險製作簡化版計算機,供業界和公眾了解用於證券投資組合的風險管理理論,藉此提升公眾對金融衍生工具的關注及認識。
人工智能AI,正是用大量數據去訓練程式去進行特定目標或決策,因牽涉數據的運用,所以統計學在AI行業的發展愈發重要。王教授指出,AI可被理解成處理數據的昇華,簡化處理數據時繁複的過程。然而,AI絕不會有如科幻電影的情節般無所不能,完全取代人類的作業;以2017年擊敗世界第一棋士柯潔的AlphaGo為例,在深度學習的過程中,始終需要人類的參與對系統作出訓練。因此在一步發展AI的同時,科學家更應該了解AI的好處和限制,絕不能過份依賴。王教授補充︰「即使最聰明的人都會極限,現時每種數理處理的工具都有既定的決策目標,研究過程中要小心考慮如何透過不同的理論和程序在不同目標之間轉化。」因此穩健的理論基礎對於有效排查AI錯誤至關重要。統計學的最基本概念—「大數法則」(Law of large numbers),意指在重複試驗中,隨著試驗次數的增加,事件發生的頻率趨於一個穩定值。隨著電腦科學的進步,採集大量數據的效率隨之提高,更能演繹大數法則的定律,有利於統計學的研究發展,藉AI為一個強大助力,有不同的範疇中得出最佳決策。
虛懷若谷以迎接教學挑戰
王海嬰教授加入中大廿多年,除了教研工作之外,自2015年擔任了中大理學院的副院長(學生事務)一職。王教授在不同的崗位上都經常接觸學生,最大的領悟便是人與人溝通的重要性。不論是研究或教學上,老師更應該作為一個聆聽者的角色。學生有時的表現可能不夠成熟,但王教授了解到每位學生都是獨特的,有著各自的理想;而虛心聆聽學生的想法,令他在教學上、帶領研究生時更加得心應手。學生的想法未必一定正確,但作為師長更應該欣賞學生堅持信念的態度。他笑言:「中文大學的學生都是非常優秀,作為一個老師更加懂得謙遜。」
王教授的卓越教學貢獻獲多次表揚,包括2015及2020年中大校長模範教學獎,以及2006、2009、2011、2015、2020年的理學院模範教學獎。
王教授曾多次獲頒中大校長模範教學獎及理學院模範教學獎,誰想到初出茅廬的他曾被學生不滿他的教學表現?他不停檢討,作為一個奉行「大數法則」主義的統計學家,嘗試不停聆聽、綜合不同學生的意見,建立起教學風格的「大數據」,千錘百鍊下成就了今日卓越的教學貢獻。近年的社會變化為教育帶來不少新挑戰,就王教授而言,他一再強調每位學生的獨特性,其表達方式亦會截然不同,老師更要謙虛地積極了解學生的需要。作為學生事務的領導者,王教授最希望發揮到自己在學生和學院之間的橋樑角色,也發揮到統計學在跨範疇的特點,有助了解不同持分者的目標,在溝通的過程求同存異、互相尊重,再按自己的身份立場作出適切的回應和幫助,達致多贏局面,也符合了統計學中「多目標最佳化」(Multi-objective optimization)的決策效果。
文、編輯:熊思敏