人工智能研究實驗室 OpenAI 去年年底推出的人工智能聊天機器人ChatGPT(Chat Generative Pre-trained Transformer)近日一躍成為大學生的寵兒——全因它能夠根據用家輸入的要求作答,提供所需答案,成為大學生應付繁重課業時的最佳助手。
雖然 ChatGPT 目前僅限部分海外地區註冊使用,但已引起香港學生和大學教師的關注,香港大學更發佈禁止學生使用 ChatGPT 的短期政策,如有違規會被視為潛在剽竊(potential plagiarism)處理。經過本刊記者實測,更證明 ChatGPT 生成的文章能在大學教授手上取得合格成績。到底 ChatGPT 背後如何運作?文章寫作一概由聊天機器人代勞,雖然大大節省時間,但會否削弱學生思考能力?
記者 | 顏筱微 編輯 | 鍾梓澄 攝影 | 顏筱微 鍾梓澄
ChatGPT 是一種由 OpenAI 開發的語言模型,它能夠學習人類語言,生成文本、回答問題、對話等內容。它通過大量的訓練數據,學到了人類語言的語法、結構和語義,因此能夠生成更加精確的文本內容。這種技術在自然語言處理領域有著深遠的影響,並且已經被廣泛應用在客服自動回覆、知識庫查詢、數據分析等領域。隨著技術的不斷提高,ChatGPT 的功能和應用範圍也在不斷擴大。
事實上,以上文句並非由記者撰寫,而是記者要求 ChatGPT 模仿記者口吻介紹ChatGPT的由來、功能及影響,同時要求它刪去專業用語和精簡内容後而生成的「自我介紹」。如上所見,ChatGPT 生成的中文文章雖偶有沙石,但大致通順。
為了進一步測試 ChatGPT 生成内容的質素,記者指示其寫作一篇約 800 字來自中大通識教育基礎課程,有關自然科學如何協助人類尋找真理的英文哲學文章,並交予中文大學通識教育基礎課程講師司徒偉文評改。
ChatGPT 所答考卷只拿C級
司徒偉文表示題目主要考核學生對課程内容的理解,以及同學如何將課程所學應用於生活,直言 ChatGPT 的文章誤解了課程内容,對日常生活亦只有局部理解。例如文章只是不斷提起題目中的關鍵字,卻沒有多作解釋,他認為文章似是由一位不明白課堂内容的學生寫出,「它就像一位完全沒有上課的同學:『糟了,要交論文了!』便上網 Google,查了一大堆(資料),胡亂複製及貼上一堆字,『嘔』個答案出來。」司徒偉文稱,若平常收到這樣的功課,一定會約同學洽談了解情況。他亦提到文章引用部分錯漏百出,例如文本被引用處根本沒有它所提及的內容。就 ChatGPT 的整體表現而言,因 ChatGPT 於語文(language)部分表現優秀,司徒偉文最終仍給予文章丙等(C)的合格評級。
另一大學講師,中大新聞與傳播學院講師陳永泰亦肯定 ChatGPT 的寫作能力。他稱自己亦曾試以「社交媒體與幸福感」(social media and welllbeing)為題,要求 ChatGPT 生成文章,並認為文章結構、文筆合理,與一般學生無異。他强調,它的文章雖具有完整的寫作框架及以深入的角度分析議題,但缺乏解釋概念的例子,如未能解釋甚麽是欺凌、錯失恐懼症(Fear of missing out, FOMO),所以將之評為乙等(B),形容它的文章等於學生隨便完成作業的質素。
除了功課外,不少外國研究皆顯示 ChatGPT 亦能夠應付大學考試。美國賓夕凡尼亞大學華頓商學院的特維施教授(Christian Terwiesch)就 ChatGPT 的答題能力進行研究,結果發現ChatGPT在工商管理碩士(Master of Business Administration,MBA)的核心課程考試中,能回答簡單的算術和處理分析性長題目,但未能處理資訊量較多的題目進階問題,因而判斷其能考獲乙等(B to B-)。
系統逐字預測 有賴資料庫無所不包
ChatGPT 宛若百科全書,對答如流的強大能力從何而來?中大生物醫學學院講師施由鴻曾研發用於教授學生解剖學的教學聊天機器人 AISS(Artificial Intelligence Support System),他解釋,聊天系統 ChatGPT 透過人工神經網路,即類似於人腦結構的神經元,來吸收大量已分類的網上資料庫數據。經過與人類語言互動的預先訓練,它持續建立及改善文字預測系統,根據經驗預測每一個字元後會出現哪些字元,並組成句子、段落及文章回答用戶提問。施由鴻表示,聊天機器人的技術並非聞所未聞,但 ChatGPT 能回答不少專門領域如法律的問題,反映其背後有龐大(innumerably vast)的資料庫,程度遠超其他聊天機器人,令人驚艷。
ChatGPT 的資料庫固然龐大,但網絡世界瞬息萬變,其資料庫未能即時更新,有人更指出使用網上搜尋器 Google才是更佳選擇。不過中大計算機科學與工程學系系主任金國慶認為,Google 只會將相關網站的搜尋結果詳列予用戶選擇,但 ChatGPT 卻已超前——直接為用家提供已整合的答案,省卻用戶自行整理和總結資料的時間。金國慶又強調 ChatGPT能結合前文後理進行對話,因此不會回答重覆內容,所提供的答案亦更靈活與貼合用戶個人需要,而非如 Google 一般為用戶提供類似搜尋結果。
使用ChatGPT事半功倍 惟依賴用戶判斷
ChatGPT 雖能透過消化衆多資料找出最佳答案,但亦有其限制。施由鴻解釋:「聊天機器人的系統越複雜,錯誤便會越多。」導致 ChatGPT偶爾會出現如以上實測文章中引用錯誤、内容不合邏輯的情況,因此使用 ChatGPT 並不代表一勞永逸,需要自行判斷內容真確性來克服限制。
而司徒偉文尤其認為 ChatGPT 的用家需具備很強的判斷能力。針對實測文章而言,他指,ChatGPT 生成的内容似模似樣,但這亦是其危險之處。當用家不具備該方面的知識,或其判斷力稍弱時,便會被它蒙騙。他鼓勵學生使用 ChatGPT來訓練判斷能力。他補充,當用家判斷內容是否正確時,其實是在不斷進行評鑑(evaluation)——評估它的答案是否正確,以及考慮該如何修正指令讓ChatGPT回答得更好,其中也包括分析、評價等,可鍛鍊用家的高階思維。
完全依賴 ChatGPT 如放棄學習 如何使用才是關鍵
對老師而言,最理想的是同學能夠善用 ChatGPT 幫助學習,但司徒偉文對同學可能濫用 ChatGPT 的情況表示擔憂。他形容,完全依賴 ChatGPT 來完成課業而不加思考的同學猶如放棄學習。而三位受訪大學教師皆擔心同學會因依賴 ChatGPT 而變得拙於思考。
為了防止同學濫用 ChatGPT,不少美國公立學校今年相繼宣布禁止學生使用 ChatGPT。回到香港,香港大學去信教職員,禁止在課堂、功課和其他評估使用ChatGPT;中文大學方面,創辦中大官方防抄襲軟件系統 VeriGuide(維誠)的金國慶稱,其團隊正研究並尋找如何透過 VeriGuide 系統支援老師識別使用 ChatGPT 生成的文章。因 VeriGuide 的原理是將大學圖書館收藏的電子資源及互聯網上其他資料庫,與學生遞交的功課的句子相似度作對比,而 ChatGPT 生成的文章是由 ChatGPT 「原創」,所以該文章在原則上是可以通過 VeriGuide 的防抄襲系統。
除強硬禁止學生使用 ChatGPT 外,司徒偉文希望同學能靈活運用 ChatGPT,作為幫助學生學習及減輕教師壓力的工具。他認為,學生可善用 ChatGPT 解答一些基本的問題,遇上進階的問題才尋求教師協助。同時,教師亦可投放更多時間處理教學事宜,提升教學質素,對同學學習有所裨益。