來源:文藝報 | 趙 薇 時間 : 2025-04-21
分享到:
“人工智能時代的人文知識生產(chǎn)”,是現(xiàn)在很多人都在討論的話題。但是,不要忘了,人文研究又不僅僅是一場知識生產(chǎn)。如果不對一些本質(zhì)的東西發(fā)問,我們可能還是在一個比較淺的層面上談論這個事。
一
從我個人切身體驗來講,我當年是一個理科生、理學學士,可為什么費了那么大勁跨學科考研,考到中文系來?這是因為,我意識到,自己本質(zhì)上是一個文藝青年。我希望在當時的社會里找到能夠詩意地棲居的方式,不想過心為形(行)役的生活。我很慶幸,我來到的是20年前的中文系,而不是今天這樣項目化、工程化的中文系。我也很慶幸,自己接受了比較純正的文學教育,師生之間也是“從導師游”的非功利的關系。而且為了能夠獲此機會,我還算是踏踏實實看了幾年書,背了幾年書。我懷著對人文學術的美好向往來到了中文系,現(xiàn)實沒有讓我太失望。
但是我萬萬沒想到,20年后的中文系正在發(fā)生的改變,是由我這樣的一分子來參與促成的。這幾年我的內(nèi)心其實是非常矛盾的。從精神層面看,大概從十年前開始,我基本上又開始撿起了本科階段的一些工作,比如說,統(tǒng)計建模、實驗設計、數(shù)據(jù)分析。雖然我還算有一些基本訓練,但是仍然感到吃力。近五年來,我的時間開始大部分放在讀數(shù)據(jù)、讀paper、做檢驗、分析特征、論證問題上,我明顯感到曾經(jīng)珍視的一部分,比如一些審美感受力、恰如其分地抒情的能力,正在從我的生命里逝去,抓不住了。我其實不太相信,一個中文系的(本科)學生,可以既打好文學基礎,在自由的環(huán)境里獲得深刻的生命感悟,又學好理工科——他必然付出代價,要失去我曾經(jīng)享有的記憶,更不要說團隊合作的過程中可能存在的關系異化。這兩年在各種年會上,有些像我一樣即將跨學科的理工科學生跟我吐槽:趙老師,我感覺自己剛從一個坑爬出來,又要掉進另一個坑。
之所以扯這么遠,是因為我想說明,人文學術它不僅僅是一個目的,不僅僅是一個效果,一個知識生產(chǎn)的結果,更不是一個手段。它還是一個過程,它如果有目的,唯一的目的應該是人本身。但是,目前看來,人工智能中有人嗎?有人文學者的體驗和身影嗎?
這里涉及到的一個問題是,我們?nèi)绾蝸砝斫饨裉斓娜斯ぶ悄軐θ宋难芯康慕槿?,如何來理解?shù)字人文的研究形態(tài)?首先,現(xiàn)階段的AI是不是工具?如果承認AI就是一個工具,那么人文學者的工具論,他們對工具的使用,必然是和理工科不一樣的。人文學者使用工具,不僅僅是為了達到一個“目的”,而是為了在這個實踐的過程中更好地認識事物、理解事物,進而體認和解釋世界。我們是在這個過程中,通過自己親自建模,來創(chuàng)造一個工具(我們最喜歡用隱喻,不管是遠讀還是細讀,是望遠鏡還是顯微鏡,還是可以遠近拉動的鏡子,它本質(zhì)上都是一個透鏡)。我們靠這個工具來實現(xiàn)對世界的認識,來推進對問題的理解。并且,更重要的,是要能夠?qū)@個過程完成真正的反思。也就是說,在這個建造的過程中思辨,這是數(shù)字人文帶給人文學術最有價值的、最有沖擊力的地方。但問題是,現(xiàn)在AI的黑箱讓你無法認識“認識的過程”,讓你對世界的體驗和認識是可疑的、甚至是虛假的。所以,從根本上說,基于現(xiàn)有路徑的AI人文,實際上并不是那么“人文化”的,甚至是“反人文”的,或者用一個好聽的詞,是“后人文”的。
二
這就是為什么這幾年來我們一直在提倡計算批評,而不僅僅是數(shù)字人文。在工具的層面上,我們不反對AI,它確實提高了生產(chǎn)率。例如,為了用網(wǎng)絡分析研究人物體系問題,我們做了幾年小說對話引語角色歸屬的自動提取模型,效果一直不理想,現(xiàn)在接入大模型,在精標數(shù)據(jù)集上調(diào)整后,召回率提升到85%以上,這在此前是不可想象的,但這只是一個簡單的目的,只是解決了一個工具運用的問題,僅此而已。或者說,盡管如此,我覺得仍然沒有理由不假思索地跟著服務商和傳媒界一起歡呼AI時代的到來,或者提倡AI人文,或者讓AI4DH(Artificial Intelligence for Digital Humanities)、AI4Humanities(AI for Humanities)成為時代口號。這是因為,當推理模型,可以干活的AI Agent,讓人人皆可不學而能,憑借一個問答系統(tǒng)或最基本的入門知識便能高效地完成工作,果若如此,與傳統(tǒng)人文學術相比,數(shù)字人文(DH)才是最早應被AI取代的領域。這一點對于那些僅僅將DH做簡單的工具化理解、認為它就是借助新工具新方法解決人文問題的人來說尤其如此。也就是說,AI在“for”DH的同時,第一個取代的就是DH自身,這是不無諷刺的。
我之前在很多場合都談到過,越是人工智能時代,越需要計算批評。計算批評是以數(shù)據(jù)化和計算建模為基礎的知識表征和文本詮釋過程,它強調(diào)工具的可解釋性,以及建模在推理和論證中的作用,它要求算法必須能夠和個體經(jīng)驗一一對應。今年以來,我更加堅定自己的選擇,這是因為基于統(tǒng)計的機器學習已經(jīng)到了人文認知或者說具有人文意義的可理解性的邊界,已經(jīng)頂格了,深度學習以后除非發(fā)明一種新的方法論來拆解黑箱,否則基于細讀經(jīng)驗的解釋是根本達不到的。在這個意義上,工具已經(jīng)徹底變成了工具,倒向了工具理性。人文學者想要在這樣的條件下保持主動性和主體性,必須要發(fā)明出一種反制的手段,要選擇可解釋的、可回溯的建模方法。這一選擇是為了保證讓任何一個人文學者自身,可以通過調(diào)用中間過程,返回到每一個特征的細部去,用自己的生命體驗、實實在在的審美經(jīng)驗來和算法對話——對話的目的是為了加深對事物的理解,把問題真正推進,同時,有辦法完成對建模的檢驗。就像我們在用機器學習的分類框架對新詩的節(jié)奏理論進行重構時所做的,我們需要知道到底是哪些頓組合特征,讓模型做出最終的文體判斷結果。這些特征,它們不僅是一串串N-gram的數(shù)字組合,我們還要知道,它在100多年來的聞一多、卞之琳、何其芳、林庚,甚至郭小川、賀敬之的境遇中,究竟意味著什么,對于今天的我們自己又意味著什么。這是前AI時代的建模帶給我們的。然而,目前的人文學界能夠接受到這一步嗎?我心里仍懷忐忑。如果說,他們連這都接受不了,那就只能心甘情愿去接受AI提供的一個似是而非的結果了,只因為AI幫他們省力,幫他們偷懶,讓他們暗度陳倉?
三
這么說或許仍顯得抽象。有一個實在的例子,今年初DeepSeek開源不久,澎湃對齊實驗室推出一個應用場景的視頻在網(wǎng)絡上廣為傳播,就是將近60萬字的《封神演義》《武王伐紂平話》灌給DeepSeek R1模型,五個小時后它計算并繪制出了一張包含1126個節(jié)點、4794條關系線的“封神宇宙”人物關系網(wǎng)。這個網(wǎng)絡不僅可以答出“李靖和哪吒開始是父子關系,在李靖被哪吒追殺時變成敵對關系”這樣的顯性關系,還會就這些關系對子“推斷”出文本主旨。我當時在深夜刷到這個視頻不能說內(nèi)心是平靜的,因為幾個月前我剛提交了一部數(shù)字人文教材中的《網(wǎng)絡分析》一章,這是我們在清華可能開了有三年的一個課程的教案,我們曾經(jīng)花那么大力氣去講如何基于特征去建構人文網(wǎng)絡。而且大家知道,近年來基于NLP(自然語言處理)的人物向量的關系抽取和表示,歷史人物計算和人物聚類等等,原是數(shù)字人文的內(nèi)容。此前花費很長時間訓練出的向量模型以及圖知識庫搭建,現(xiàn)在仿佛瞬間完成了。不僅如此,真正實現(xiàn)“端到端”的、從文本到動態(tài)關系網(wǎng)絡的自動化構建,也似乎指日可待。如果說這就是數(shù)字人文,今后AI確實可以替代人,在所謂人機協(xié)作的過程中,人的戲份將越來越少。但問題是,當模型幾乎代勞一切,用戶對模型背后的計算邏輯和向量化等工作一無所知,到頭來真的能增進人們對文本和網(wǎng)絡的理解嗎?退一步說,即便用戶具備理解這一切的知識基礎,這一問題解決的過程對人文研究就是有意義的嗎?這里不僅涉及復雜的認知挑戰(zhàn),也與我們到底認同什么樣的本體論有關,關鍵點在于計算的機制能否真正透明。
為了搞清楚它的工作機制,我們可以用現(xiàn)成的AI工具解析出這個視頻的關鍵代碼,發(fā)現(xiàn)它仍然是一個標準的RAG(Retrieval-augmented Generation,檢索增強生成)流程,即實驗者先行引導AI調(diào)用開源的智源大模型對文本做向量化處理,然后再利用DeepSeek強大的“推理”能力,對人物關系做出“深層”判定。如此,向量化和知識庫建構的細化步驟,協(xié)助DeepSeek精準而專業(yè)地“定位”了關系,故而可以有效降低幻覺問題的出現(xiàn)。不難想象,在人工智能時代這種方案解決的門檻會越來越低。僅一個多月過去,我們可以用更簡單的知識庫工具加開源工具鏈復原這個過程。但問題是,即便復原了全過程,我仍然不知道它的具體的計算過程,換句話說,即便DeepSeek一類“推理模型”可以在思考過程中直接呈現(xiàn)“推理鏈”了,但具體計算細節(jié)仍然不會給出,也無力給出,也就是說人的經(jīng)驗依然無法回應之。即便大模型可以將據(jù)以建立起關系的文本源以我指定的格式返回來,例如它之所以認為“盤古”和“伏羲”是“創(chuàng)造”與“被創(chuàng)造”的關系,乃是依據(jù)了“混沌初分盤古先,太極兩儀四象星”,但是這一給出依據(jù)過程未必可以對應有意義的人文理解,且很難弄清為何模型只定義了這些關系類型,但這些對于真正推進研究來說依然是至關重要的。
這是因為大模型對關系的“讀取”仍然是以向量計算本身為基礎,無論是調(diào)用外在的模型,還是自己進行“抽取”,它處理的并非真正的文本,而是全部語詞被轉(zhuǎn)化為高維向量后通過復雜計算得來的語義距離(如經(jīng)基礎語義相似度計算,“盤古”與“伏羲”的向量更接近)。就大語言模型輸出的答案來說,其實質(zhì)永遠都是通過概率來預測下一個token,這一過程不再與對現(xiàn)實世界的認識、概念、思維和操作具有一一對應的關系,也就是說已經(jīng)溢出了實然界,它制造的更是一種語言上的可能性。所以,即便現(xiàn)在通過逆向工程或可解釋工具許可定位到相關文本片段,也只是提供了機會讓我們得以窺見廣闊語義簇世界之一斑,未必經(jīng)得起現(xiàn)實經(jīng)驗的檢驗,或根本就無從檢驗。從這一意義上說,盡管可以為這些結果提供各種技術上的解釋將其合理化,但大模型輸出的結果絕非經(jīng)過“上下文共現(xiàn)、依存特征、關鍵詞匹配、長程邏輯鏈、圖神經(jīng)網(wǎng)絡”等等或簡單或復雜的運算得來,它所做的只是對這一切的“模擬”。
高維向量計算的復雜性導致數(shù)值向量無法映射到人類可理解的概念,它和深植于人類經(jīng)驗的文化符號體系仍然不可“對齊”,無法獲得真正的“解釋”,只要人還沒有變成機器,人與機器之間的認知鴻溝永遠存在。這個問題并不始于大模型,而是從深度學習的圖計算就開始了。就人文意義而言,由于缺乏細讀檢驗環(huán)節(jié)的支撐,此種手段-目的式的驅(qū)動方法已然面臨解釋的難題,導致最終結果的呈現(xiàn)與實現(xiàn)和算法總是隔著一層,不僅難以引起人文學界的注意,其精神與計算批評也是背道而馳的。
四
現(xiàn)如今,很多人文學者都認為自己有能力來調(diào)戲模型,但實際上沒有人有這個能力,這只是一個幻象。它生產(chǎn)一個大玩具,你以為是你在戲弄它,其實是它在調(diào)戲你,你創(chuàng)造出一個自己也無法理解的東西的時候,就會面臨弗蘭肯斯坦式的恐慌。但現(xiàn)在的情況是,它是在迷惑你,用海妖的歌聲迷惑你,用快感蒙蔽這種危險的恐慌。
因此,希望我們的刊物能夠更多呈現(xiàn)的,是真的全透明的工作,不是一種蒙蔽的、簡單的調(diào)戲模型的、花拳繡腿的研究,否則,AI就會成為“作為大眾欺騙的啟蒙”(阿多諾)。我們在學生時代曾經(jīng)反復想要去讀懂的那些批判理論,我們今天才真正讀懂。
我們要為人文學術、人文體驗留一點余地,留一點人味兒。我們發(fā)展數(shù)字人文,不是要讓它成為一個封閉的學科,一個個“計算機+”的領域。相反,它是一個高度跨學科的領域,它一定要保持一種活潑潑的狀態(tài),而這個跨學科的主體是人,而且至少要有一半是人文學者,而且人文學者至少要拿出一半的精力真正投身到全流程中來。你在河邊走,如果不濕身,不親自做,而只是靠別人,你永遠不知道其中的酸甜苦辣,永遠是隔岸觀火,永遠不知深淺,永遠在敲鑼打鼓。
真心希望我們的數(shù)字人文也好,計算批評也好,哪怕是AI人文也罷,它處于一種正常的、靜水流深地發(fā)展的狀態(tài),而不是像今天這樣過度熱鬧、沒有方向感,也不是要加速去“卷”,而是要讓它減速,真正有效地融入當下的人文研究,并催生出屬于這個時代的學術成果。
(作者系中國社會科學院文學研究所副研究員、數(shù)字人文與計算批評實驗室負責人;本文為2025年3月30日在清華大學、《文藝研究》主辦的“人工智能時代人文知識生產(chǎn)的模式變革與體系重構”工作坊上的發(fā)言)
湖南省作家協(xié)會 | 版權所有 : 湘ICP備05001310號
Copyright ? 2005 - 2012 Frguo. All Rights Reserved