隨著人工智慧(AI)大模型不斷升級,以ChatGPT、文心一言、BingChat等為代表的生成式AI工具對教育領域產生了極大的影響。這類技術工具可以依照使用者指示分析閱讀材料、翻譯文本、進行論文寫作並潤飾,已經在高校學生群體中得到大量的關注與使用。
那麼,生成式AI工具寫作的內容文本究竟有哪些特徵,限制在哪裡?就寫作而言,學生借助AI寫作,是否與大學開設人文通識課程的目標相反?未來,我們有沒有可能讓這類生成式AI工具從「學術不端」的「幫兇」轉變為人文教育的「幫手」呢?
生成式AI寫作工具,為教學帶來新挑戰
筆者在一所中外合辦大學開設「中西文化比較」課程,這是學校的人文通識必修課,每年會有超過4000名學生選課並參加課程考核。過去,不少大一新生會帶著自己的高中作文摘抄本進入大學課堂,並在不自知的情況下進行引用,從而引發學術不端的問題。
2022年OpenAI推出ChatGPT後,許多網路公司也紛紛推出了各自的大語言模式。 2023年後,入學的大一學生也與時俱進,開始在作業或期末論文中直接使用最新的技術進行寫作。於是,學生提交上來的小論文,查重率高的現像明顯減少,同時,用AI工具寫作的痕跡明顯增加。
數千份課程期末論文中,10%以上有明顯的全文使用AI工具產生的痕跡,另有不少課程論文有局部使用AI軟體代寫的嫌疑。筆者在評閱作業過程中,也常發現有的學生在文末忘記刪除投餵給AI的指令、忘記刪除某AI寫作工具試用水印,或是用英文AI工俱生成內容再用翻譯軟體翻成中文導致奇怪語法錯誤的案例。
對學生而言,使用AI工具代寫論文顯然充滿誘惑:在短短幾分鐘內,只需輸入課程要求的論文選題,就能生成一篇還看得過去、且大概率能躲避系統查重的文章,尤其是在繁忙的期末,這為學生帶來了難以抗拒的便利。根據筆者的統計,在學生提交上來的具備AI寫作特點的文檔中,最短編輯時間只有1分鐘。但從教學角度而言,這類AI工具的出現對老師的工作帶來了許多新要求與新挑戰。
AI確實在輸出,卻並非寫作論文
近兩年內,網路上出現了許多內容完整、邏輯通順的ai生成論文,甚至讓人難以辨認這些作品是否由真人寫作。但是在筆者面對的上千份課程期末論文中,AI寫作的特徵非常明顯。
首先是格式與結構的雷同。這類文章往往生硬地在段首使用「首先」「其次」「最後」「總結」等詞語,試圖給讀者形成邏輯明確、主次有序的印象。然而,在每段的闡述中,卻只有寥寥幾筆的空泛之言,會讓人覺得“就這麼點單薄的觀點,還需要分一二三四這麼多層次嗎?!”
同時,由於生成式AI寫作工具並不是真正的思考,而是依據使用者輸入的關鍵字在海量資料中檢索、再重新組織出語言,因此它在生成文章時也非常強調關鍵字的輸出,並以圍繞著對應關鍵字的答題式格式呈現出來,導致這類文本在格式與結構上的同質化。
例如,圍繞主題“從教育的角度討論中西方文化的差異”的論文,用AI寫作的學生文本內容格式都非常清晰,甚至可說“對仗工整”,文本往往圍繞著幾個關鍵詞,進行清晰的分點陳述。但實際上,只要認真看一下就會發現,文章有一種生硬的、答題式的割裂感,與課程要求的「行文完整」相差甚遠。
再以和教育傳統有關主題的小論文為例,透過AI生成的內容中均提到中式教育和西方教育各自的特點,這些論斷都是大家耳熟能詳的,然而這些表述卻與我們課程中相應專題所要傳達的觀點南轅北轍,如果學生結合了課程所學,絕對不會羅列出如此片面的表述。例如,我們在專題《書院與大學》中,就對比了兩宋時期中國的書院與西方中世紀盛期隨著城市興起而逐漸誕生的大學,並為學生提供了延伸閱讀的論文與書目。 AI產生的小論文完全不會涉及相關的案例與史料。
被「投餵」的答案不斷加深學生刻板印象
事實上,我們的課程之所以被列為通識人文必修課,在教學目標中就涵蓋了「增進學生對於中西方文化多樣性的認知,在此基礎上形成並堅定對自身文化的認同感」。課程透過比較研究的方法,希望可以打破學生先前的某些既有印象,獲得更廣闊多元的研習視角,而AI生成的內容卻以無法保證準確性的同質化觀點,不斷加深學生的刻板印象,助長文化偏見。
究其原因,這類AI寫作工具並非真正的思考主體,它們的運作機制是在人類生成的大量文本中提取數據,再透過整合生成答案,因此這些答案的生成取決於在網絡世界中被「投餵」了哪些數據,以及「投餵」了多少量,很容易引發偏見問題。
同時,AI生成內容無法保證其準確性。例如,在一篇作業中,出現了將宋代詩人陸遊所作所為《秋夜將曉出籬門迎涼有感》誤寫成「唐代詩人杜牧的《秋夜將曉樹桑鳥》」的常識錯誤,也出現了「明朝小說《紅樓夢》」等錯誤說法,再搭配上查無此證的參考文獻,可謂一本正經胡說八道了。
同時,AI生成的文章行文邏輯混亂無序。與內容錯誤並行的是行文缺乏清晰、合理、有序的邏輯,這更加劇了這類文本「胡說八道」的程度。在一篇試圖從經濟發展的角度討論中西方文化差異的作業中,提到中國文化的優點在於注重家庭和社會的關係,這一觀點也出現在許多AI生成的其他不同主題的作業中。更不用說,眾多重複、錯亂的語句,佔據了大量全文篇幅。
讓AI從助長“學術不端”轉向“學習助理”
生成式AI工具已經越來越深地介入大學學術寫作,針對此類技術進行規範治理迫在眉睫。但是筆者在面對近兩年眾多學生使用AI生成的文本時,還發現了一些有意思的現象,這不禁令人思考:除了在規範、制度的層面對AI工具的使用進行管理,對於教師而言,是否可以從課程設計、教學模式等角度進行改革,從而使技術從助長「學術不端」轉變為「學習助理」?
首先,這類生成式AI工具不擅長針對一些較複雜且精細的問題輸出論文。課程期末考核要求學生只需在3題目中選擇一道進行寫作,有兩道的題目比較宏大,一道比較具體(需要學生設定具體的歷史情境與人物)。結果,所有被認定為提交了ai代寫作業的學生,所選的題目均為前兩道,且AI生成內容的特徵非常典型。
回顧學期中作為平時作業的小論文,寫作的題目均和相應專題緊密結合,且列出了學生需要閱讀的具體文獻和需要完成的實作內容。例如,關於「城市與商業」專題,學生需在觀摩《平江圖》、走訪蘇州古城、參觀蘇州市規劃展示館的基礎上,結合國內外學者撰寫的城市研究論著,討論有關歷史上中國城市規劃和坊市製度演變的問題。這類主題的論文,幾乎不會出現AI生成的情況。因此,在課程內容與任務設計中,教師不妨避免設定容易泛泛而談的問題,而將問題與課程專題結合更為緊密,甚至強化實踐性、體驗性的要求,促成學習者更參與。
其次,學生所選取的國外AI軟體和國內AI軟體所產生的論文風格有明顯差異。這不禁引發一個疑問:到底是國內和國外的生成式AI工具「寫作」能力不同,還是選取不同AI工具的學生本身在提問、組織文本內容時存在差異?
其實,即使在都使用了AI技術生成全文的情況下,同一主題的文章品質也有高低。所以,老師其實也可以在教學過程中,藉助這現象,從比較文化的角度引導學生對AI生成的內容進行批判性思考。例如,對比學生本人所寫的內容與AI生成的內容;對比不同AI工具針對同一主題/問題所給出的答案;對比免費與付費的AI工具所生成的文本,去追問不同文本之間有何差異,為什麼會出現這種差異?然後,老師可以再將這種對比與分析的過程呈現到作業之中,一方面能避免學生直接將考題餵給AI“坐享其成”,另一方面,能夠在引導學生合理使用新技術的同時加深對課程專題和相應議題的理解。
面對生成式AI工具,老師與其擔心學生會因其變得「懶惰」而抗拒、禁止它,不如在新的教學任務中將其轉變為能夠讓學生發揮更多自主性、提升參與感、主動發現問題、提出問題的助手,畢竟AI生成文章內容的品質與提問的角度息息相關。
可以預見,未來會有越來越多的作業內容帶有AI生成的痕跡。除了在教學過程中進行新的嘗試,期待學校對AI技術的使用作出更健全的規範,在這裡,我們或許可以再留一個問題:目前的生成式AI技術往往被學生一方用來代寫論文,那麼會不會有一天出現了能自動評閱論文的AI軟體,如果學生們知道老師「用魔法對抗魔法」採用AI技術來生成分數,還會不會那麼放心大膽地依賴AI進行全文代寫?