學生用AI寫論文怎麼辦?──歷史學教學現場的挑戰與對策

近年來隨著各種AI工具興起,AI成為許多人學習過程中的必備工具。不少學生將其納入作業與報告的準備流程中,「外包代寫」、「生成偽造文獻」的情形亦逐漸浮現。當這類新工具的應用趨勢與挑戰進入教育現場,促使師長們不得不重新思考:「學生究竟能從中學到什麼?我們該怎麼教?」同時也讓我們得以重新審視傳統教育、研究訓練的養成過程中,未曾被細緻檢視的環節,以及新工具帶來的可能性。
歷史學作為強調史料查證、論證架構與詮釋深度的學科,在面對AI所帶來的標準化、模糊化與幻覺式(hallucination)生成文本時,尤其容易暴露出其侷限與風險。而史料的複雜性與研究方法的多元性,也是讓AI參與整理、協作的空間所在。以下從國內外教學實況與經驗著眼,揭開老師、學生在AI時代所面臨的問題,並嘗試提出可行的因應之道,以及圖書館能提供的支援。[*]
一、AI代寫的氾濫:從國內外案例看教學現場焦慮
2025年6月,中山大學葉高華教授在臺灣博碩士論文知識加值系統發現,有學生在論文中引用了他未曾寫過的文章。不僅是他個人,該學位論文中,其他多位國內人文學者的文獻引用,也大多被「張冠李戴」地羅列其中。學生透過AI生成「虛構文獻」,引用格式看似正常,實則無從查證,亦能逃過抄襲軟體檢測,順利通關。這起事件旋即在學界引發關注與熱烈討論。對此,校方已出面道歉並撤銷論文,要求學生重新撰寫。[1]該生的指導教授則表示自己從未使用AI撰寫論文,經此一事才知道AI會假造文獻。這也顯示出部分教師對於AI工具及其運作邏輯認識有限。大學教師如何因應局勢、強化AI素養教育?指導教授是否應負責為學生的論文乃至文獻引用一一查證?這些問題亦成為熱議焦點。
上述因葉教授於社群網站公開而浮上檯面的個案,絕非孤例。根據筆者初步訪查開設文史學科課程的老師及助教,結果表明將課堂作業、論文由「AI代寫」、「使用AI生成文獻卻不查核」的學生,在近幾年實非鮮見,甚至有日漸增長的趨勢。明顯或懷疑使用AI代寫的情況不外乎以下幾種:
1.
虛構文獻。不僅是引用書目的作者與文章無法對應,還有宣稱引用二手研究著作或古籍史料段落,回查原書卻根本不存在。[2]
2.
摘要、文獻綜述、書評等基礎型成果作業代寫。
3.
文不對題、陳述空泛(常見於只將史料重新描述、換句話說)。
4.
非專業領域學生,使用生僻的學科理論或用語,且不引用來源。
5.
寫得頭頭是道,面對提問,卻一知半解或無法回應。[3]
焦點轉至海外,同樣在今年6月,美國UCLA學生在畢業典禮上,高調展示自己使用ChatGPT完成期末報告並取得學位,並對此表示驕傲,引發各界譁然。[4]此外,「AI代寫」在美國進一步衍伸更多爭議,例如教師處分使用AI寫作業的學生,反遭家長控告,理由是學校並未明訂AI使用規範,降低評分將影響孩子未來升學發展與權益。[5]更有甚者,當誠實寫作的學生,被AI檢測軟體誤判為AI寫作,需被迫花費更多時間精力自證清白,成為AI代寫亂象下的「受害者」。[6]
這些案例無一不在警示,AI在教學與論文寫作現場的介入,早已不再是「是否使用」、「禁止與否」[7]的問題,思考「如何因應與引導、如何妥善制訂規範」才是當務之急。
二、實務解方籤:六項嘗試與建議
(一)各系所/課程宜自訂AI使用規範
國立政治大學圖書館推廣諮詢組柯俊如已在其研究中指出,雖然全臺大學多已制訂AI使用指引,但內容大多停留在2023年,並未隨著AI日新月異的進展調整。再者,其主要指引對象為教師,而非學生,且對學術倫理的涵蓋範圍、使用限制皆未具體說明。[8]這些都使得學生使用AI時更加無所適從。
實際上由大學行政體系制訂具體應用標準,本身就是極為困難的。因為各科系所對於學生使用AI的態度、學術風氣並不相同,有些科系提倡鼓勵,有些則謹慎保留,難以訂出統一適用的使用標準。由各教學單位、老師依自身課程目標與學風自訂明確規範,並且在課前/簽指導前/口試前,就申明使用規範。如此一來,不僅保留教師裁量空間,也能讓學生有具體依循的依據。
(二)AI檢測軟體
為了應對大量AI虛構與代寫層出不窮的局勢,許多政府單位及企業紛紛投入開發AI檢測程式。[9]然而在論文的檢測上,現行檢測工具仍存在諸多限制。例如將真人撰寫的論文標記成AI生成的文本,而經過人為稍加潤飾的AI文本卻檢測不出來。或者使用舊語言模型比起能使用先進模型者,更容易被檢測出來。[10]
換言之,這些工具存在一定程度的誤判率,缺乏100%正確辨別文章係由人類抑或AI所作的能力。因此其檢測結果僅供參考,無法論定,否則將導致評量結果不夠公正,讓清白的學生名譽、權益受損,並陷入前述「如何自證」的困境中。
(三)重新設計作業及評量標準
基於過去的養成經驗與習慣,歷史系的教育過程中為培養學生提綱挈領、掌握學術動向的能力,經常要求繳交文章摘要、書評或文獻回顧型的作業。或者為考驗學生對課程內容掌握度,經常會出一些有關「歷史事件」因果分析的題目,諸如:「國民政府為什麼會在內戰中失敗?」或「羅馬帝國成立的背景為何?」,請學生查資料後回答。然而這些也恰恰是AI工具推出後,人們最常使用的功能之一(擷取文章重點),甚至可能是AI最「擅長」的範疇(因為其訓練資料多為各類網路資源,包含Wikipedia),很容易提出教科書式的答案。因此這類作業也最容易成為學生「外包」且未必分辨得出來的類型。
如果課程仍希望訓練學生基本能力,諸如在有限時間內摘錄重點,以及考察其對課程的消化程度,採用隨堂筆試或口試仍然可以達到同樣的目的,且能避免轉交AI代寫的機會。
相對於上述基礎作業,歷史學訓練中常見的史料檔案分析或有關個人及家族經驗的課題(如口述史、考察族譜),應屬於不容易外包AI,且就算外包,教師也較容易判斷的作業類型。[11]正是因為現行常見的聊天機器人,其訓練資料多來自現存以英語世界為主的網路資源,[12]相對的,中文歷史資料收錄比例極低。尚未全文化的歷史檔案或個人經驗材料,無庸說,幾乎不存在。[13]即便強行投入文字內容詢問,通常也只會得到空泛的回答,難以進行深度分析。
然而,要如何讓學生了解AI對史料解讀的限制性呢?或許可以嘗試讓學生直接利用AI進行各類史料分析,甚至比較自己和AI撰寫同一道題目的差異為何,進而從過程中逐漸掌握AI工具的優勢與局限。
(四)建立合理使用Check
List
既然已經無法禁止學生使用AI,至少可以請學生在使用前確認以下幾點:
1.
我有沒有辨別錯誤資訊、查證的能力?
2.
是否真的省時、省錢、提升工作效率?
3.
是否讓個人研究能力、質量有所進度?
4.
使用是否註明與揭露?
以上四點是基本的自我檢查要點(可視課程需求增加),倘若有任何一點無法符合,請不要貿然使用。否則使用AI只是剝奪個人思考與學習的能力。
除了作業事前準備的自我檢查,接著甚至可以拆解研究流程,一步步與學生共同探索、分享每一個研究階段,各種AI工具能夠合理參與協助的方式。
拆解研究流程,師生可共同探索AI合理協作的方式與注意事項。
(五)AI使用揭露
目前國內大學、人文學科學術刊物尚無制定詳細的AI揭露格式與相關政策規範。不過國外各大著名期刊平臺,諸如Sage、Taylor & Francis、Wiley等,[14]對於作者、編輯乃至審查人皆已訂定人工智慧政策與應用指南。其中使用揭露政策大多建議在研究方法、致謝(書籍則在前言、導論)中,說明自己所用AI的工具名稱、版本及用途。考量到臺灣學者經常在註腳處補充相關資訊的習慣,或也可考慮於註腳處揭露。(如本文註腳一)
Sage、Taylor & Francis、Wiley針對作者AI使用揭露政策之要點
除了在文章/作業中揭露之外,國外亦有不少大學設置人工智慧使用聲明書模板,以便在教學中,提供學生搭配作業繳交。以下可參考英國劍橋大學人文社會科學院針對學生設計的人工智慧使用聲明書。
University of Cambridge,
School of the Humanities and Social Sciences ,“Template Declaration for Use of
Generative AI,” 2025.
(網站提供聲明書模板Word檔,可供下載使用)
(六)培養查證、蒐集資料的能力
隨著學生越來越習慣向AI提問、接收資訊,學術訓練中一項極為關鍵卻常被忽略的能力——查證與主動蒐集資料的能力,也勢必悄然弱化。當知識取得越趨便利,人們越可能傾向接受「直接生成的答案」,而非質疑資料從何而來、是否有誤、有無遺漏。學生若未具備基本查證意識與蒐集資料能力,更容易信以為真。
那麼,學生應如何查證AI提供的資料?如何意識到「AI幻覺」?更甚者,當研究所需的資料根本無法由AI或網路取得時(如古籍、舊報刊、地方志、日記、檔案、微縮資料等),學生是否知道這些資料存在?又是否知道要到哪裡去找、如何使用?這時候請告訴學生:「來圖書館走一趟吧!」在這裡,館員將會針對讀者需求提供指引,學生可以在此重新學習查找學術資源、辨證資訊正確與否的方法,將缺失的部分能力拾回。這也正是體現圖書館作為學術資料與知識庋藏場域,並公開提供讀者利用的重要價值所在。
三、學術圖書館如何提供協助?
為應對AI在教學現場與研究歷程的全面滲透,圖書館除了持續增進學術資源的質量,還可以學生/研究者提供三項具體支援:
(一)提供AI素養與學術倫理課程
圖書館具備跨領域的知識整合優勢,是推動AI素養教育的絕佳平臺。我們可透過課堂合作、專題分享,引導學生理解AI生成的運作原理、潛在風險與合理使用方式。甚至模擬研究中情境,設計相關課題(如前述),讓學生能透過這類實務操作,提高對AI幻覺的敏感度與查證方法的掌握度。
(二)引介可供查證且AI找不到的研究資源
在AI訓練語料尚未全面涵蓋的當下,許多歷史研究所需的一手資料甚至二手研究,仍須透過實體或封閉型資料庫取得。圖書館能透過主題書介、研究資源指南與學科諮詢,引導學生接觸這些「AI看不見」的資源,並協助建立更完整的研究視野與史料網絡。
(三)帶領學生重新認識圖書館與檔案館的重要性
許多學生習慣於網路搜尋與AI問答後,對圖書館的認識有時僅止於「流通借還書」或「線上資料庫」,卻未意識到圖書、檔案館其實是一座待挖掘的知識寶庫。我們能藉由設計課程、館藏導覽,讓學生理解資料不只在網路上,也深藏於未被AI看見的實體館藏中。那些尚未被釐清、探索的過去,需要透過讀者到場發掘、細讀與詮釋,一片片拼湊而成。這不僅攸關研究者的研究品質,也關乎整體學術傳承。AI再厲害,也無法取代人們親身走入資料場域、篩選閱讀文本、思辨詮釋到知識建構的歷程,而這也無疑是歷史學研究最為珍貴的部分。
四、會後討論與分享:更多來自教學現場的觀察與省思
在分享會結束後的開放討論中,來自不同院校與背景的師長同道也分享了各自的經驗與思考,進一步突顯AI議題在歷史教學中所面對的多元挑戰與結構性問題。
1.
臺灣大學歷史系課程助教的觀察
今年必修課期末採取線上限時測驗形式,雖為降低手寫閱卷負擔,卻遇到不少可疑現象。例如:線上考試作答中,不少學生開頭用句幾乎一致,甚至學生在90分鐘內寫出超過6300字內容,平均每分鐘產出70字,包含思考與組織時間,顯示極有可能是非純人工撰寫。這些現象雖無法立即證明使用AI,只能一一註記並交由授課教師判斷。未來也應思考如何加強作業或考試的難度,遏止AI代寫與評量不公的情況。
2.
東海大學歷史系助理教授的反思
大學部課程已改為筆試評量,以降低AI外包風險。但研究所課程仍維持傳統書面報告,結果品質參差不齊,不少報告疑似AI生成或混合拼貼。理想上,研究所的學生應更能自主閱讀、寫作與論證,但現況讓他不得不重新思考該如何調整研究所課程的評量標準。
3.
關於AI偽造文獻的運作原理
本所研究員提問:「為什麼AI要生成假文獻?難道AI不能檢索真實文獻後再組織答案嗎?」另一位研究員回應:「AI生成文字的運作邏輯,並非如人類一般經由理解資料後進行有根據的寫作,而是依據語言模型中大量語料的『接詞機率』進行排列組合。換句話說,AI像是在玩接龍遊戲,而不是進行真實的檢索生成。」講者補充,目前即便是具備學術文獻搜尋功能的AI工具(如Perplexity),未公開的英文文獻、非英文的中、日文等學術文獻仍未大量納入其訓練資料庫,更容易造成錯誤。
4.
從通識教育課程AI代寫情況反思非本科系學習動機
中興大學歷史系教授觀察到,AI代寫現象似乎在今年開始特別盛行,且在通識課程中尤為明顯,本科課程中出現比例較低。他認為,這與學生選課動機密切相關:「修通識的學生多半是為了學分、成績,不一定對課程主題本身有高度興趣,自然更容易傾向外包或仰賴AI。」這樣的現象應促使我們重新考慮通識課的定位、學生修課訴求。同樣都是歷史系老師開設的課程,對外開設的通識課程,以及對本科系的必修、選修課程,兩者的課程設計與要求應如何調整,或如何引導學生對AI資訊批判、查證,都需進一步思考。
5.
從師資培育觀點看待AI依賴問題
來自梨花女子大學的教授在會後指出,他所任教單位屬於師範體系,大部分學生未來都將成為高中小學教師,但目前學生在報告中可能多少存在依賴AI生成的內容。這令他深感不安:「如果未來的老師在求學過程中都是靠AI完成作業,他們將怎麼教導下一代?會不會讓學生誤以為,只要問AI就好?」他強調,這不只是現階段教學或AI代寫的問題,更關係到未來下一代教育發展的潛在危機。
這些分享,從教學實務、評量制度、知識本質到師資倫理等面向,補充與擴充了本文的觀點,並再次印證AI議題的複雜性與跨領域性。筆者深以為,即便我們尚未掌握全部解方,但此刻正是嘗試重建共識與反思傳統教育框架的時刻,而非急於歸咎或全盤否定。
延伸閱讀
更多[生成式AI與歷史研究系列]文章,可參考:
(1) 歷史學者如何應用ChatGPT(一)歷史教學篇
(2) 生成式AI如何輔助歷史研究(二)口述史篇
(3) 生成式AI如何輔助歷史研究(三)數位人文篇
(4) 生成式AI如何輔助研究工作(四‧上集):Oral Presentation & International Exchanges
[*] 本文根據2025年6月25日中研院近史所舉辦COFFEE TIME 分享會「學生都在用AI寫論文怎麼辦?危機還是轉機?」簡報、講稿及會後討論紀錄,由講者本人使用ChatGPT4o模型重新整理,改寫為Blog形式。全文內容皆經由講者修訂,所有參考文獻皆屬人工查詢後引用,由講者發表並全權負責。AI生成初稿請參見此處:https://docs.google.com/document/d/102LAM4wR4V2xwa8AEycHMq8MCba4KSAc/edit?usp=sharing&ouid=108909535618839633591&rtpof=true&sd=true,歡迎各界參照與指教。
[1] 劉星君、郭韋綺,〈AI虛構碩論參考文獻
屏東大學:論文重寫、強化AI教育〉,「聯合報‧聯合新聞網」,https://udn.com/news/story/6928/8825513,刊載日期:2025-06-23,最後瀏覽日期:2025-06-25。李宗祐,〈偷吃步?碩士生疑「用AI掰參考文獻」寫論文 南華大學要求重寫論文〉,「聯合報‧聯合新聞網」,https://udn.com/news/story/6928/8825991?from=udn-relatednews_ch2,刊載日期:2025-06-23,最後瀏覽日期:2025-06-25。
[2] 有關AI生成不存在的史料、參考文獻,可參考〈歷史學者如何應用ChatGPT(一)歷史教學篇〉,中研院近史所郭廷以圖書館學科資源部落格,https://asmhlibref.blogspot.com/2023/06/chargpt.html,刊載日期2023-06-29,最後瀏覽日期:2025-06-28。
[3] 特別感謝臺灣大學歷史系、政治大學圖書館及圖資所、暨南大學歷史系、臺灣師範大學歷史系、東京大學大學院人文社會系研究科等各單位系所的師友同道對於教學實況的反饋。
[4] Abhinav Singh, “Student Flaunts Use of ChatGPT at Graduation
Ceremony, Faces Backlash: ‘Next-Level Foolish,’” NDTV, June 20, 2025, https://www.ndtv.com/offbeat/student-flaunts-use-of-chatgpt-at-graduation-ceremony-faces-backlash-next-level-foolish-8713770.
accessed June 26, 2025.
[5] Julia Reinstein, “Parents Sue School in Massachusetts after Son
Punished for Using AI on Paper,” ABC News, October 16, 2024, https://abcnews.go.com/US/parents-sue-school-massachusetts-after-son-punished-ai/story?id=114819025
, accessed June 27, 2025.
[6] Callie Holtermann, “A New Headache for Honest Students: Proving
They Didn’t Use A.I.” The New York Time, May 17, 2025. https://www.nytimes.com/2025/05/17/style/ai-chatgpt-turnitin-students-cheating.html
, accessed June 27, 2025.
[7] 分享會的報告中,列舉四點說明為何無法禁止,因BLOG篇幅限制,簡述如下:一、根據對學生AI應用的調查,當前學生已經在使用。二、教育政策持續推動與鼓勵,可以預期未來的學生將非常熟悉且依賴。其三,教師未必了解AI工具。倘若缺乏AI素養,教師是否能識別AI寫作文本的格套,識別之後該如何教育,都是需進一步思考的問題。其四,回望歷史經驗,全球化的數位科技崛起浪潮勢不可擋。從1980-2000年代,網際網路、電子資料庫到數位人文工具興起的時代,對於學生寫作業是否該使用這些工具,同樣遭受過許多質疑。如今大多數學者都會使用網際網路、電子資料庫,甚至數位人文工具,但史學家並未因此拋棄傳統的文本閱讀、史料分析等重要能力。面對AI的崛起應持同樣的態度,新工具只是產生不同的研究方法、研究視角,改變整理資料的方式或查用效率而已。
[8] 柯俊如,〈臺灣頂尖大學的 AI 指引政策分析與政大圖書館的教學探索〉《圖資與檔案學刊》,16(2),(臺北,2024),頁188-221。文章係針對2024年10月以前各大學AI指引進行的初步討論。
[9] Tiffany Hsu and Steven Lee Myers, “Another Side of the A.I. Boom:
Detecting What A.I. Makes” The New York Time, May 19, 2023. https://www.nytimes.com/2023/05/18/technology/ai-chat-gpt-detection-tools.html
, accessed June 27, 2025.
[10] Shoumik Saha and Soheil Feizi, Almost AI, Almost Human: The
Challenge of Detecting AI-Polished Writing, arXiv preprint, last revised May 5,
2025, https://arxiv.org/abs/2502.15666,
1-18. accessed June 27, 2025.
[11] 特別提醒:個人經驗型的作業確實無法外包AI,但是可以虛構。倘若以生命經驗為題,卻未附上相對的證據,實際上只會更難證明是不是真的「經驗」。歷史學研究畢竟仍是很講究史料證據支持的一門學問。
[12] 本文暫時不對中國大陸方面推行AI工具訓練中文材料的成果展開討論。
[13] 目前中央研究院數個研究單位已著手以館藏史料訓練AI模型,例如民國時期婦女期刊、《臺灣新民報》、明清官文書與地方文書等;臺灣大學亦啟動「臺鵠計畫」,訓練資料來源涵蓋漢文《臺灣日日新報》、臺灣省議會公報與明清臺灣地方行政檔案等。上述計畫將有助於未來以中文史料為基礎的AI應用發展,並拓展探索臺灣史、中國史研究新課題、新方法的可能性。更多詳情可參見中研院2025年學術大會(2025/6/30-7/3)與臺鵠計畫官方網站。
[14] SAGE Publications, “Artificial Intelligence Policy,” last modified 2025, https://uk.sagepub.com/en-gb/eur/artificial-intelligence-policy. Taylor & Francis, “AI Policy,” last modified 2025, https://taylorandfrancis.com/our-policies/ai-policy/. Wiley, “AI Guidelines,” last modified 2025, https://www.wiley.com/en-us/publish/book/ai-guidelines.
留言
張貼留言