敬告讀者:
《中大通訊》已停刊,本網暫停更新。請移玉步造訪本校最新通訊《走進中大》網頁:https://focus.cuhk.edu.hk,閱讀大學報道和消息

學術探奇

尋找基因病變之鑰

葉旭立發現疑致肝癌基因

葉旭立教授以人體不同細胞和組織系統數據作為基礎,研究DNA中的增強子對基因影響的規律,解釋這些DNA變異的因果

人體內每個細胞都有相同的去氧核醣核酸(DNA)。然而,細胞運作各有不同。為何有些細胞最終演變為癌症,有些卻不會?關鍵在於基因和增強子之間錯綜複雜的相互作用。增強子就像開關按鈕,可以控制是否啟動這些互動作用。中大計算機科學與工程學系副教授葉旭立正嘗試拆解上述千絲萬縷的關係。

我們的DNA負責產生核醣核酸(Ribonucleic Acid,簡稱RNA)和蛋白質,而蛋白質是人體的基本構成元素。相比起基因轉錄部分,DNA中的非編碼部分更大程度影響基因表達過程。

有部分DNA區域作用是增強子,啟動DNA中某些指定基因,有時增強子與被激活的基因在序列中相隔很遠。兩者的關係不一定呈正向,哺乳動物的增強子數量便遠超帶有蛋白質編碼的基因。增強子之間的互動往往產生不同作用。

葉教授把大量數據輸入電腦程式,透過機器學習推論哪些增強子控制哪些基因,及兩者之間如何互動。

葉教授的團隊以人體935種不同細胞和組織系統數據作為研究基礎,部分數據來自日本理化學研究所中名為FANTOM5的基因資料庫。該935種樣本來自人體不同部位,用以研究人類基因組;數學上,人類基因組可以多達三十億個連串「字母」表達。

目前人體有25,000個編碼製造蛋白質的基因。即使我們假設每條基因只有「開」和「關」兩個選項,這些基因之間互動便可產生多達2的25,000次方這個無限大的組合。

葉教授的研究是首個針對不同人體組織中增強子與基因之間連繫的研究。透過研究正常和染病的組織,團隊便可以尋得線索,了解調控基因的機制,及機制為何出錯。

科學家通常能夠確認一些DNA序列與疾病有關聯。不過,他們並不知道為何某種排序會致病,也不能確認有關排序是致病原因,還是純屬巧合。

葉教授分析了人體935個組織樣本的細胞,透過電腦運算推算每一種細胞中增強子和基因的關係。研究團隊要進行大量運算,才可確認一條染色體中的基因與增強子之間是否互為影響。此外,通常最少有兩個增強子,才足以對一條基因產生影響,這種關係使運算更複雜。

「這不過是第一步。當中可能包含錯誤的訊息,例如增強子可能只是巧合存在,或有些增強子以間接的方式調控基因,而研究沒有發現。」葉教授解釋:「我們嘗試找出增強子和基因的相關性,建立預測模型,從而大概指出增強子是否真的正在調控基因。」

鄭詩樂教授相助葉教授,指出哪些基因是肝癌獨有

生物醫學學院副教授、肝癌專家鄭詩樂教授相助葉教授,指出哪些基因在所有癌症中存在、哪些是肝癌獨有。

在935個樣本中,約25個與肝癌有關連。葉教授開始比較正常肝臟細胞和肝癌細胞的基因,從而看看哪些增強子啟動哪些基因,誘發癌症。葉教授逐步收窄範圍,成功找出可能誘發肝癌的三組基因:PSRC1RBM24TERT。這三組基因因為干擾或受到不同增強子的影響而變得異常活躍。

很多基因會進行「甲基化」的化學作用,抑制基因轉錄和蛋白質的產生。不過,個別增強子會出現異常,無法以「甲基化」抑制轉錄作用,產生不正常的蛋白質,最終形成癌細胞,引發癌症。運算結果發現,在突變的肝細胞中,PSRC1RBM24TERT三組基因受到增強子影響而變得過度活躍。

若果移除那些增強子,便可能逆轉不正常基因被激活的過程。團隊能夠運用實驗法CRISPR/Cas9來編輯基因組的排序,把指定基因和增強子部分移除,看看出現甚麼結果。換句話說,他們可以測出當某個增強子存在或不存在時,會帶來甚麼影響。

葉教授成功找出可能誘發肝癌的三組基因:PSRC1、RBM24及TERT <em>(圖片來源:Nature Genetics)</em>

團隊的研究論文去年九月已刊登於國際權威的遺傳學學術刊物 Nature Genetics。醫生可以開始用增強子作為篩選標準,預計哪些病人有患癌風險。之後,科學家可以進一步研究療法,例如抑制增強子運作的藥物。

葉教授主修計算機工程學和計算機科學,攻讀碩士時,他開始展開生物醫學和生物信息學的研究,應用運算技術解決醫學問題。

在實驗室,鄭教授的團隊運用葉教授提供的數據來驗證各項假設和研究結果。因為即使是同一人體內,有些細胞會演變成腫瘤,有些卻不會,所以團隊要用大數據分析才可確認當中的因果關係。

運算測試需時費勁,葉教授打趣地說:「長遠而言,我希望可以研製出根治癌症的方法。但要待多久?我想拋磚引玉。其他人得到我的研究啟發,能夠研製出相關藥物。」

倘中英文版本出現歧義,概以英文版本為準。
 

 

本文出自中大主網頁(2018年5月)

標籤
葉旭立 肝癌 去氧核醣核酸 計算機科學 工程 鄭詩樂 生物醫學 醫學 大數據 機器學習 教授