- +1
史家之眼︱“e-考據(jù)”時代來臨了嗎
近年來計(jì)算機(jī)技術(shù)飛速發(fā)展,并對史學(xué)研究產(chǎn)生了深刻影響。利用數(shù)據(jù)庫可以快捷地檢索信息,甚至輕易地將有關(guān)材料一網(wǎng)打盡,不少學(xué)者都認(rèn)為一個“e-考據(jù)”的時代已經(jīng)到來。但電子檢索方法也有其局限性,更加不能“以檢索代替讀書”。
圍繞著計(jì)算機(jī)技術(shù)與史學(xué)研究的關(guān)系這一主題,私家歷史選取了四篇相關(guān)論文,概述摘要,以饗讀者。
計(jì)算機(jī)技術(shù)在歷史研究中的運(yùn)用,首先體現(xiàn)在對原始史料的電子化上,研究者由之可以更加方便與快捷地獲取與整合相關(guān)史料。馬創(chuàng)新等的《中文古籍?dāng)?shù)字化的開發(fā)層次和發(fā)展趨勢》和張治江的《日本古籍綜合目錄數(shù)據(jù)庫及其特點(diǎn)》兩篇文章,從古籍?dāng)?shù)字化的角度出發(fā),談了中日兩國在這方面的技術(shù)與經(jīng)驗(yàn),有助于加深我們的理解。
其次,隨著計(jì)算機(jī)技術(shù)不斷介入歷史研究,有些學(xué)者認(rèn)為產(chǎn)生了新的歷史研究方法與路徑,甚至史學(xué)本身也發(fā)生了革命性的改變,但有的學(xué)者對之則相當(dāng)不以為然。周祥森的《空間轉(zhuǎn)向:電子傳媒技術(shù)與當(dāng)代史學(xué)形態(tài)》和王子今的《“史識”與計(jì)算機(jī)“利器”》是兩篇思路相近,觀點(diǎn)卻截然相反的文章,可以看作是與之相關(guān)的爭鳴。
古籍?dāng)?shù)字化有很多層次,“元數(shù)據(jù)信息庫”比書目索引更重要

中文古籍?dāng)?shù)字化利用現(xiàn)代信息技術(shù),對中文古籍進(jìn)行加工處理,使其轉(zhuǎn)化為電子數(shù)據(jù)形式保存和傳播,是中文古籍再生性保護(hù)的重要手段。
其開發(fā)層次又可以分為表層與深層,主要內(nèi)容如下表所示:
古籍善本的圖像掃描錄入雖然快捷,但不便檢索。OCR識別則可以對掃描過的圖片進(jìn)行分割,識別每個字體的圖像輪廓后與字符集對應(yīng),進(jìn)而把圖片中的古籍內(nèi)容轉(zhuǎn)化成字符序列。但現(xiàn)有所有的OCR識別技術(shù)都無法達(dá)到百分之百的辨識準(zhǔn)確度,最后不可避免地需要一道人工校對工序,浪費(fèi)大量時間與人力。
而這是OCR識別技術(shù)的內(nèi)在缺陷導(dǎo)致的。用于匹配掃描圖像的常用字符集有GB2312、Big5、GBK等。但漢字中出現(xiàn)過巨量生僻字,尤其是其中的異體字,是無論如何擴(kuò)大字符集規(guī)模都不可能把它們?nèi)堪ㄔ趦?nèi)的,遑論準(zhǔn)確對應(yīng)、識別,所以研究字符集之外的文字識別方法是現(xiàn)在的前沿課題。
所謂深層,則是指深入到古籍的“內(nèi)容和意義”層面,研究古籍著錄和描述的元數(shù)據(jù)標(biāo)準(zhǔn)和聯(lián)系方法。
元語言是一套描述文檔結(jié)構(gòu)與含義的語法標(biāo)記,元數(shù)據(jù)即是描述元語言的信息。它對應(yīng)的,不再是古籍中的某個字詞,而是其基本內(nèi)容特征。制定通用于古籍著錄的元數(shù)據(jù)標(biāo)準(zhǔn),就能夠使用更抽象的檢索詞,更快速、準(zhǔn)確地找到目標(biāo)古籍。所以“元數(shù)據(jù)信息庫”要比單純的“書目索引庫”應(yīng)用價(jià)值大得多。
日本學(xué)者制作的古籍?dāng)?shù)據(jù)庫先進(jìn)在哪?

中日兩國的古典文獻(xiàn),不論在內(nèi)容,還是在印刷技術(shù)、紙張、裝幀形式上,都有很大的相似之處。但在文獻(xiàn)的電子化上,日本比我們先行一步。
日本從60年代初就開始對全國現(xiàn)存古籍進(jìn)行整理編目,1963至1967年間,巖波書店刊行了九卷本《圖書總目錄》,1980年又對其進(jìn)行了補(bǔ)編,并初步建立了古籍綜合目錄數(shù)據(jù)庫。1990年2月,巖波書店刊行了其續(xù)編——《古籍綜合目錄》,標(biāo)志著日本對本國現(xiàn)存古籍實(shí)行了全面的書目控制。它不僅僅是一部書本式目錄,而且還是一個具有較高自動化程度的數(shù)據(jù)庫,可以輸出書本式、磁帶式、磁盤式等各種形式的目錄。
《古籍綜合目錄》所收錄的古籍涉及63個圖書館和文庫,83個其它收藏古籍的機(jī)構(gòu)(如博物院等), 共收古籍43000件,采集古籍書目約91000件,數(shù)據(jù)文件共分為四部分,研究者在檢索某一部分的信息時,可以隨時查看與之對應(yīng)的其余部分的內(nèi)容:
一、書志文件,是關(guān)于被收入的古籍書志的著錄數(shù)據(jù);
二、著作文件,記錄與著作有關(guān)的一系列情報(bào);
三、著者文件,記錄關(guān)于著者的一系列情報(bào);
四、收藏和數(shù)據(jù)源文件,記錄被收錄古籍的收藏者、收藏機(jī)構(gòu)及有關(guān)的數(shù)據(jù)源等情報(bào)。
該數(shù)據(jù)庫結(jié)構(gòu)非常合理,對日本國內(nèi)現(xiàn)存古籍的版本流變、收藏歷史等方面都記錄詳備,遠(yuǎn)超以往書志目錄的水平。而且與普通圖書相比,古籍最大特點(diǎn)就是書名、著者名等在流傳中常常會出現(xiàn)各種變化,如《今昔物語集》別稱《宇治大納言物語》,即使在同一部書中,一書也常常出現(xiàn)多名。另一方面,同名異書者也很多,書同、著者不同者更多,這給古籍檢索帶來很大的困難。日本古籍整理專家們對這些大規(guī)模存在的異名現(xiàn)象進(jìn)行了完備的整理歸納,為檢索者提供了良好的檢索途徑。

技術(shù)變革引發(fā)了三次史學(xué)革命,計(jì)算機(jī)技術(shù)讓歷史研究產(chǎn)生空間轉(zhuǎn)向

人類對于歷史的記憶,與對歷史的書寫,都和傳播媒介技術(shù)及其工具的變革密切相關(guān)。迄今為止,人類傳播媒介技術(shù)的發(fā)展經(jīng)歷過三次重大的革命,即文字的發(fā)明、造紙術(shù)特別是活字印刷術(shù)的發(fā)明以及電子技術(shù)的發(fā)明。
文字的發(fā)明標(biāo)志著人類文明史的真正開始,人類的感知體驗(yàn)?zāi)J接陕犛X觸覺習(xí)慣的思維過渡到了視覺習(xí)慣的思維。這種思維最大的特征是線序性,歷史編纂上的編年史記錄法因之產(chǎn)生,適應(yīng)吟誦需要的史詩被淘汰。唐代宋雕版、活字印刷術(shù)的發(fā)明,使過去難得一閱的古代文獻(xiàn),如今可以被重復(fù)性且均質(zhì)性地大量生產(chǎn)。因此就像后來的西歐隨著谷登堡印刷術(shù)的發(fā)明而出現(xiàn)了一個文藝復(fù)興運(yùn)動時代一樣,中國唐宋時期也出現(xiàn)了一種復(fù)古主義思潮和復(fù)古主義運(yùn)動。在史學(xué)上,具體表現(xiàn)為編年體史學(xué)復(fù)興;史學(xué)開始社會化和民眾化;歷史認(rèn)識更加個性化。
但二十世紀(jì)下半頁電子技術(shù)的發(fā)明與普及,使世界變成了即時性和同步性共鳴的多維世界。在麥克盧漢、布厄迪(Pierre Bourdieu)等20世紀(jì)最重要的思想家看來,空間并不是事物外在的容器,而是事物的關(guān)系與性質(zhì)的總和,時間在很大程度上也隨之“空間化”了。電子文明塑造的這種時空觀念與印刷文明時代的時空觀念非常不同。以往的人們普遍認(rèn)為過去發(fā)生的事即是在時間中發(fā)生的事,歷史書寫者往往更加關(guān)注時間巨鏈上發(fā)生的先后變化,而不是空間性的并存差異或即時同步性的事物之間的關(guān)系。
歷史研究方面的空間轉(zhuǎn)向表現(xiàn)得非常明顯。以黃仁宇《萬歷十五年》(1587,A Year Of No Significance)一書為例,正如英文版書名暗示的,1587年是一個沒有意義的時間點(diǎn),它實(shí)質(zhì)上起到了提供空間化的平面場所的作用。萬歷皇帝、首輔申時行、政治改革家張居正、清官海瑞、抗倭名將戚繼光、異端思想家李贄在這一年前后的活動碎片被拼貼出了一幅歷史鑲嵌畫,孔飛力的《叫魂》、日常生活史代表作《馬丁?蓋爾歸來》等20世紀(jì)最重要的史學(xué)巨著對于時空關(guān)系的處理手法,皆與黃氏并無二致,這種特征被麥克盧漢稱為“鑲嵌畫式的歷史研究”。讀者必須進(jìn)入歷史拼貼游戲之中形成與作者的共鳴,而在時間中的歷史碎片本身則沒有意義。
如今的史學(xué)研究單元也基本由歷史時段或歷史過程轉(zhuǎn)向歷史地域,因此地方性歷史或區(qū)域史的研究大有取代斷代史研究的主流地位之勢,這是史學(xué)研究空間化轉(zhuǎn)向發(fā)生后的必然結(jié)果。
“史識”和計(jì)算機(jī),哪個更重要?

王子今:《“史識”與計(jì)算機(jī)“利器”》,《史學(xué)月刊》2015年第1期
當(dāng)今計(jì)算機(jī)技術(shù)的進(jìn)步和普及顯著沖擊著社會文化的各個層次,史學(xué)領(lǐng)域多數(shù)學(xué)人也普遍應(yīng)用計(jì)算機(jī)技術(shù)檢索史料、收集信息、整理思路、撰寫論著。清醒的歷史學(xué)研究者面對這一情形,自然會思考史學(xué)方式的革新與史學(xué)傳統(tǒng)的繼承這兩者之間的合理關(guān)系。
司馬遷和司馬光是中國古代史學(xué)史上兩個最重要的、具有跨時代意義的大家,前者的著作是紀(jì)傳體正史的濫觴,后者則開創(chuàng)了編年體通史的寫史手法。巧合的是,司馬遷撰寫《史記》時,正值紙這種書寫材料出現(xiàn),司馬光編纂《資治通鑒》時,活字印刷術(shù)也問世不久。但司馬遷對于史學(xué)的重要推進(jìn),似乎與紙的發(fā)明毫無關(guān)聯(lián),至今也未曾聽聞過印刷術(shù)的進(jìn)步對于司馬光的創(chuàng)造性工作提供了怎樣的便利。
作者由是在電子技術(shù)的重要性與其對史學(xué)的影響上,得出了與周祥森《空間轉(zhuǎn)向》一文截然相反的結(jié)論。回顧史學(xué)進(jìn)步的各個關(guān)鍵點(diǎn),技術(shù)層面的進(jìn)步似乎都并沒有形成顯著的推進(jìn)力,主要因素還是在于先進(jìn)思路的開拓和新出資料的公布。計(jì)算機(jī)技術(shù)被普遍認(rèn)為是自文字、紙與印刷術(shù)之后,足以再次推動信息傳播方式革命性變化的主要媒介。不可否認(rèn),計(jì)算機(jī)技術(shù)的應(yīng)用也為我們的史學(xué)研究提供了便利,提高了效率,無疑是應(yīng)當(dāng)鼓勵的。
但學(xué)者取得史學(xué)的突出成就,往往需要靈性、思辨能力、創(chuàng)新追求,在一定意義上,也需要藝術(shù)素養(yǎng)與美學(xué)理念,也即劉知幾一再強(qiáng)調(diào)的“史識”?!胺蚴凡胖y,其難甚矣”,“史識”,而不是計(jì)算機(jī)技術(shù),或許才應(yīng)該是“史才”修煉必然的追求和必備的條件。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




