深研中華文化 闡揚傳統專學
探究學術真知 重視人文關懷
中國文化 2021年春季號
進入21世紀,我們處在一個壓力明顯增長的時代。歷史學界面對著創新的挑戰,出現了許多新的探索和嘗試,“數字人文”是其中重要的路徑之一。這些年來,學者根據各自不同的研究實踐,提出過多方面的建議與質疑,體現出對于“數字人文”走向的高度關注。
最近二三十年來,海內外人文領域、信息領域的諸多學者持續貢獻心血與精力,希望為人文學科研究方式的提升與轉變創造條件。“數字人文”是數字化、智能化環境下多學科匯聚的學術增長點,為人文學科的發展提供了新方法,注入了新活力,也在某種程度上突破了傳統史學的格局,使一些有賴于大量數據處理的研究成為可能。
我個人是傳統式的史學工作者,并不熟悉“數字人文”技術及其運作方式。但我和大家一樣,都受益于“數字人文”發展的成就;不僅研究中離不開各類電子資源,而且閱讀、思考與寫作的方式都在隨之發生變化。
歷史研究者是面向歷史,也是面向未來的。人文學科需要積累與傳承,需要拓展學術空間,激活學術潛力,這種內在需求,使當代學者一直追求學科融通,不斷尋求新的發展路徑。這是推動“數字人文”進展的根本動力。我們看到,作為信息科技與人文學科的交叉,“數字人文”是迄今為止理念最為開放、成就最為顯著的跨學科研究與運行方式。它的產生和推進,是基于“數字”與“人文”雙向的需求與驅動。它將計算工具與方法引入人文學科,也使科技工作者逐漸理解歷史學的學術語境,從根本上突破了彼此之間的學術壁壘。“數字人文”的發展,架構起跨越學科界限的橋梁,拉近了人文學者與信息科技工作者的距離,提供了多學科交流的平臺和全新的研究工具,開辟了更加廣闊的思考界域和學術天地。
就歷史學而言,所有成就的基礎,無非來自“材料”與“議題”二者,來自二者的結合。窮盡史料“竭澤而漁”,是史學研究的重要前提;材料搜討是否充分、處理是否得當,效率高低,是決定研究成敗的關鍵。數字人文的工作重點,也在于材料挖掘、文本分析;文獻、圖像、考古資料以及視頻音頻的轉化處理,是其強項。數字人文技術的介入,所針對、所嘗試突破的,恰好是從歷史學關鍵的基礎性節點起步。
就我們歷史系師生常用的古籍文獻數據庫來說,大多是基于純文本的數據呈現,其主要功能為檢索查詢。數據庫材料范圍寬泛,排列隨機性強,查詢者如果主題與關鍵詞設置得當,不僅會增補史料,而且可能糾正先入的觀念,一些原本潛在的問題也會凸顯出來。例如,利用數據庫觀察詞頻的分布,觀察某些詞語在特定時期的密集出現,可能發現一些帶有時代趨勢性的議題;又如,查找某些文本的史源,通過搜尋比對雷同文字,往往有不少紙本閱讀之外的發現;有些本不熟悉的關鍵詞,也可能在檢索過程中意外“跳”出來。透過不斷追問,即便是字面的檢索,也可能支持并且引導學者的深度研究。如學者所指出,數據庫提供的檢索方式,類似于索引,“本質上都是揭示人類知識內在關聯的認知方式”,“索引揭示的知識規則,是構建新媒體時代人類知識體系的基礎,也是實現知識發現新方案的基礎”。知識系統的有序性和關聯性,在數據互聯的網絡體系中得以呈現和把握。[1]此類數據庫,作為人文研究的基礎工程,不斷朝往便捷、高效、準確的方向努力,已經被學界廣泛接受與利用。
目前,專題性數據平臺建設不斷得到擴充,整合式文獻數據庫的建設有了顯著的成果,服務于特定研究項目的個性化、訂制化的數據庫也開始興起。像萊頓大學魏希德教授(Prof. Hilde DeWeerdt)主持開發的MARKUS就是一個針對中文古籍進行半自動標記和分析的開放性平臺,它允許學者在原始文獻與各種分析和可視化工具之間自由切換,便利學者建立自己的文本數據庫,從事智能化、個性化的學術操作。
歷史上筆與紙的出現、印刷術的出現都為知識與學術思想的生成、傳布創造了新的條件。如今數字人文技術的出現,也促成了新的記載、閱讀與研究方式。數據質疑學者的假設,也可能印證學者的思考。過去需要多年積累才有可能注意到的議題,現在相對容易凸顯出來。作為歷史學者,我們都有這樣的體會:閱讀中產生的問題、形成的積累,在寫作過程中要不斷檢索新的材料,補充質證;搜討效率的提高,使研究者得以更加專注于深度議題的探究。
人文學科“知識”的形成,有賴于整理提煉;歷史學處理的材料,往往是對于有形事件、人物、制度的敘述,而這些內容背后,將方方面面勾連為一體的,事實上是無形的結構性“關系”。哈佛大學費正清中心、臺灣中研院史語所與北京大學中國古代史研究中心合作建立的CBDB(中國歷代人物傳記資料庫)正是關系型數據庫的一個范例。這些年,已經出現了越來越多經過深層開發的、關系型分析型的數據庫,逐漸深入到文本整理、資料挖掘、知識鏈接的層面,超越“檢索”而致力于“發現”。學者無需學習編程,就可以訪問大量結構化的數據。人文學者與信息學者都在此基礎上進行了多方面富于活力的研究嘗試。
互聯網的優勢在于“互聯”。信息科技原本是專門的學術領域,通過“互聯”,如今已經成為學術的風尚。數字與人文有不同的學科特點,也有拓寬天地的不同要求。二者的連結,不僅在于計量,而是希望深化學術內涵,有效延展觀察歷史的“平臺”。近年來,國內十馀所高校先后成立了數字人文研究中心,出版相關期刊雜志,其成果不僅有數據庫,也有各類專題互動網站,并且開設了面向不同層級學生的教育項目,搭建起“數字人文”國際合作聯盟計劃。
復旦大學歷史地理研究中心與哈佛燕京學社共同開發建設的“中國歷史地理信息系統”(China Historical Geographic Information System)項目,構建時間序列下的空間基礎數據,成為歷史地理學界重要的學術增長點。在此基礎上進而衍生出HGIS(Historical or Humanities GIS)。[2]歷史本來是在時間和空間中流淌,空間不僅是自然地域,不僅是演生歷史活劇的靜止舞臺,歷史上的“空間”本身也是一種社會建構。CBDB與CHGIS的互聯,呈現活動于時空之中、相互關聯的“人”,從而可能刺激新的研究題目,形成新的研究契機。
跨越學科界限、疆域界限的議題互聯,學者互聯,使研究交流的方式發生了根本性的改變。收藏在世界各地的不同資料得以廣泛利用,切磋往復、知識探詢與傳播的手段發生了前所未有的變化。針對全球性問題,交換意見的渠道也極大地豐富起來。2020年疫情期間,德國馬普科學史研究所(Max Planck Institute for the Science of Human History)的朋友三月中就發來視頻、音頻,在北京大學人文社會科學研究院的平臺上,向公眾介紹“數字人文與歷史上的災害研究”。
一波一波專題性、結構型數據庫出現在面前,與時俱進的前沿感和新鮮魅力激發出研究的活力。多種類型多重手段的互聯,使歷史學者有了新的工作方式、新的延展平臺,有了更多量化統計與質性研究的對話;有可資調遣的新手段用以處理“老”問題,也會面對“數字人文”帶來的新問題。與此同時,也開始了學術機制的重組重構,開始了大跨度文理交叉的試驗與實踐過程。
“數字人文”已經取得諸多成就,但總的來說,還是處于起步階段;其應用價值,需要學者們在學術研究的實踐中來探討和驗證,可以在反饋反思的基礎上促使其性能的進一步提高。追索某類主題的數據庫,在將描述性文本轉化為量化數據的過程中,可能會使立體敘述扁平化,也可能過濾掉某些看似不直接相關的內容,造成歷史信息的衰減。如何使數據庫層次類型豐富適用,準確、方便、完善,是人文學界和信息學界面臨的共同任務。
“數字人文”不僅是一種技術,不僅是人文學者使用漸多的查詢檢索方法,也體現著傳統治學方式與數字技術關聯融通的開放態度;它開啟了新的研究窗口,改變著我們慣用的工作方式,也不同程度地影響著我們組織學術議題的思維方式。我們不宜將其與人文學科的終極價值、人文學者的學術想象力對立看待,而應當意識到,“數字人文”的應用為我們提升研究水準、回應多面相問題提供了新的可能。“數字人文”要登上新的臺階,有賴研究者針對計算技術“提問”,這與我們的學術視野、學術前瞻力相關。這是一個逐漸趨于完善的過程——盡管絕對的“完善”永遠不會“一勞永逸”地實現。作為人文學者,我們是這一過程的觀察者,也是參與者、親歷者。人文學術與計算技術的“知己知彼”,雙方的溝通與契合,對我們是一挑戰。“數字人文”技術的完善,不能僅靠期待、“仰賴”;研究者的實踐,實踐中提出的議題、發現的問題,正是推動相關技術手段糾錯、細化的必要條件;而所謂“范式更新”、“思維革命”,則要靠研究者自身基于新條件、新可能的努力。
從古到今的技術、知識與思想,無不靠“人”的追求與創造而生成;迭進更新的技術、知識、思想,時時刺激、推動著人類文明的進程。無論目前數字化還有多少不足與改進的空間,這一基本潮流終歸會不斷向前發展。我們有理由相信,只要具備清醒的認識,就能依靠“互聯”的持續探索、共同的學者智慧引導“數字人文”的方向與歷程。
世界文明的發展,對于文明的研究,從來都是跨時代、跨地域、跨學科的。在文明對話的大潮下,今天的“數字人文”領域,可以極大拓寬研究視野,也正是國際交流、合力互通的典范。諸如中國古代史研究中常用的“數字人文”學術研究平臺DocuSky、CBDB、CHGIS,以及漢語料標注平臺MARKUS、地方志分析平臺LoGaRT,都是多方合作的結果,也都惠及國際學界。
數據庫是靠有心人制作完善的,歸根到底也是服務于有心人的。任何學術方式,都不可能成為簡捷單一的倚賴工具。我們不能將“數字人文”的研究方式與傳統考證方法對立起來。盡管看起來積累不足的初學者容易從數據庫中受益,而事實上,研究畢竟不靠尋章摘句,真能充分利用數據庫優勢而不致被其限制的,首先是具備史學訓練基礎、具備清晰問題意識的學人。有位長期參與數據庫工作的朋友跟我說:“我們要用數據庫;對于數據庫有哪些問題,也要清楚才行。不然,會出大問題。”這也恰恰說明,數據庫的完善,必須有人文學者參與。
歷史學是反思的學問,處理的對象是紛繁世界的實質關聯。平面表淺是史學研究的大忌。我們關注“歷史表象的背后”,如何調度材料、形成聯想、深度開掘、恰當組合,如何從字里行間透視研究對象的來源、結構關系和層進脈絡,這些特有的追求,在“大數據”的洪流下,應該得到支持、發展,而要避免被遮蔽的可能。
資料的全面、精準,是數據庫提高有效利用率的前提。好的系統,要方便使用,才能充分發揮效能。人文學科特有的屬性,使其不會仰仗固定統一的資料處理標準和研究模式;其學科素養,又離不開對于歷史文化現象的感覺與體悟。這種特性化的需求,對“數字人文”的功能提出了很高的要求。建設檢索項目界定清晰、選擇性功能完備、多版本比對方便、反饋糾錯機制便利、與相關數據庫功能銜接的檢索平臺,將是人文學界的重要福音。
任何技術進步,都有類似雙刃劍的兩面。有實質的幫助,也會帶來挑戰——對此要抱持“歷史性”的態度。追捧與貶抑,既是對“數字人文”前景的傷害,也是對自我學術天地的限制。就歷史學者而言,數據庫在一定意義上降低了我們搜集資料的難度,使得論文數量大幅提高,研究領域有所拓展;但我們要清晰地看到,“數字人文”對歷史學者的素質提出了更高的要求:既然不能僅靠材料的熟悉奪得先機,辨析與追問的能力高下會更加凸顯。一個有意思的現象值得注意:目前批評過度依賴數字化的學者,往往不是對于“數字人文”一無所知的人士,許多批評者是在國內較早推動史料數字化的“先驅”。他們的分析與提醒從長期研究實踐中來,應當引起重視。“數字人文”研究方式的廣泛應用,應該是人文學科得以深化的路徑。我們要十分警惕急功近利導致“表淺化”的可能,警惕滿足于表層文本的提取和簡易的量化排比,警惕不注意社會文化的綜合背景而輕易達成結論。
史籍的數字化不會自動帶來史料的“大發現”。數據庫促成了學者搜檢材料的便利,但經驗告訴我們,僅靠語詞搜討無法完成真正的研究;只有自文本閱讀起步且有所積累的學者,才能充分瞭解并且利用語詞及語詞組合完成檢索的目標。檢索出來的大量語詞數據,如何篩檢過濾,也要靠相關知識的日常蘊蓄。[3]更為重要的是,技術更新了,學業探究的要旨卻沒有輕易改變,深入研究仍然要靠“讀書得間”。這正像南宋大儒朱熹所說:“讀書,須是看著他那縫罅處,方尋得道理透徹。若不見得縫罅,無由入得。看見縫罅時,脈絡自開。”[4]這“縫罅”存在于字里行間,要靠體悟,靠“窮究”與“痛理會”。
各類數據庫協助我們抓取文本,觀察文本間的關聯;而非字面的深層領會,只能靠我們對各類史籍、對田野、對歷史遺跡的“觸摸”,靠我們內心的感悟,靠自身實踐與思考來摸索形成。“數字人文”的深度發展、其成果的出現及其充分利用,都與人文學科的深度發展相伴相隨;加強問題提煉、材料閱讀與辨析的訓練,仍然是學人不容忽視的基礎與責任。
(本文為作者2020年6月6日在“北京論壇”云端國際論壇系列“數字人文視角下的中國歷史研究”上的發言,有增補修訂。)
中國藝術研究院主辦 劉夢溪主編