中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

信息時(shí)代的古史研究:不打開數(shù)據(jù)庫(kù)都無(wú)法找課題

澎湃新聞?dòng)浾?臧繼賢
2017-05-24 16:51
來(lái)源:澎湃新聞
? 翻書黨 >
字號(hào)

互聯(lián)網(wǎng)和計(jì)算機(jī)技術(shù)現(xiàn)在不僅改變著生活的諸多方面,也為文史哲的學(xué)術(shù)研究帶來(lái)了一場(chǎng)變革。如果說(shuō)老一輩的文史哲學(xué)者不做卡片就不能開始學(xué)術(shù)研究,現(xiàn)在的學(xué)者可能不打開數(shù)據(jù)庫(kù)就無(wú)法尋找選題。

2017年5月19日,上海師范大學(xué)古籍整理研究所所長(zhǎng)張劍光、華東師范大學(xué)古籍研究所所長(zhǎng)顧宏義、華東師范大學(xué)錢幣博物館館長(zhǎng)陳江、上海師范大學(xué)歷史系教授范兆飛同中華書局總編輯顧青一起在上海靜安書友匯進(jìn)行了以“信息時(shí)代:古史研究的新思路”為主題的研討會(huì)。

活動(dòng)現(xiàn)場(chǎng):顧宏義(左)、張劍光(中)、范兆飛(右)

離不開數(shù)據(jù)庫(kù)的學(xué)術(shù)研究

數(shù)據(jù)庫(kù)檢索功能帶給學(xué)術(shù)研究的便利可謂今非昔比。上海師范大學(xué)歷史系教授范兆飛回憶起自己16年前在沒(méi)有檢索系統(tǒng)的情況下,收集碩士論文資料時(shí)的艱辛:

“當(dāng)時(shí)我在山西大學(xué)的碩士論文題目為《北朝的九品中正制研究》。做這個(gè)題目首先要做兩項(xiàng)工作:第一:先把在北朝擔(dān)任中正的人找出來(lái)。當(dāng)時(shí)山西大學(xué)是沒(méi)有檢索系統(tǒng)的,我用了整整一個(gè)學(xué)期的時(shí)間把北朝的史書和墓志材料全部翻了一遍,把擔(dān)任北朝中正的人找出來(lái)。現(xiàn)在如果用中華書局的‘經(jīng)典古籍庫(kù)’,這項(xiàng)工作只需一到兩天就能完成。第二,需要找出北朝中正制的相關(guān)研究成果,當(dāng)時(shí)沒(méi)有檢索條件,只能整天泡圖書館,翻過(guò)刊、人大復(fù)印過(guò)刊資料、全國(guó)報(bào)刊索引等。我用了整整兩年時(shí)間才把這項(xiàng)工作做完。但即便如此,我還是擔(dān)心遺漏了重要的研究成果。但在現(xiàn)在的技術(shù)條件下,這些都不是問(wèn)題了。”

上海師范大學(xué)古籍整理研究所所長(zhǎng)張劍光講到現(xiàn)在做學(xué)問(wèn)和以前不太一樣,“以前每天都要去資料室,而現(xiàn)在因?yàn)殡娮淤Y料非常豐富,所以除了要核對(duì)古籍的版本問(wèn)題,平時(shí)都可以在家中做研究。”

華東師范大學(xué)古籍研究所所長(zhǎng)顧宏義也經(jīng)常對(duì)學(xué)生講,“如果不打開數(shù)據(jù)庫(kù),我都不知道該怎樣進(jìn)行研究、設(shè)計(jì)課題?,F(xiàn)在不管是我自己寫文章也好,還是看學(xué)生的作業(yè)也好,只要手上有東西,就會(huì)把數(shù)據(jù)庫(kù)打開?!?/p>

中華經(jīng)典古籍庫(kù)微信版

“因?yàn)槲覀儸F(xiàn)在的記憶力不如前輩的老先生了,他們有童子功,四書五經(jīng)都背得很熟,我們背不出來(lái),而只是模糊記憶,所以要有檢索的幫助。”

在顧宏義看來(lái),檢索首先能夠彌補(bǔ)精確記憶的缺失,“有些原文即使能背出也會(huì)有出入,就像古人寫書引用時(shí)也會(huì)與原文有一兩字的出入。而按照現(xiàn)在的學(xué)術(shù)要求,只要加引號(hào)的引用,和原文相差一個(gè)字也不行?!?/p>

“我們現(xiàn)在做學(xué)術(shù)研究要用數(shù)據(jù)庫(kù),這同我們的前輩學(xué)者相比是一種革命性的變化。過(guò)去幾年我寫了幾本小書,讓我有一個(gè)清醒的認(rèn)識(shí),我能夠?qū)懗鲞@幾本書,就是靠數(shù)據(jù)庫(kù)。現(xiàn)在很少有一條很冷僻的史料沒(méi)有被發(fā)現(xiàn)的情況;如果有,也是因?yàn)闆](méi)有充分利用各種查詢路徑而已,而研究的差異可能產(chǎn)生于史料的辨別之上。”

以前的問(wèn)題是史料太少,現(xiàn)在的問(wèn)題是史料太多

數(shù)據(jù)庫(kù)的使用為學(xué)術(shù)研究帶來(lái)了便利,但也帶來(lái)了新的煩惱。老一輩的學(xué)者在做學(xué)術(shù)研究時(shí)可能擔(dān)心史料不夠豐富,而現(xiàn)在的學(xué)者則要面臨如何處理海量的史料和數(shù)據(jù)的問(wèn)題。

顧宏義講到現(xiàn)在能夠查詢到的信息量太大。“以前老先生會(huì)表?yè)P(yáng)文章引用的史料豐富,而我們現(xiàn)在就怕看到史料太豐富的文章。因?yàn)槎际菑臄?shù)據(jù)庫(kù)中尋找到的史料,有些史料一看就知道是從《四庫(kù)全書》中‘拉出來(lái)’的。這樣就產(chǎn)生了一些問(wèn)題,需要辨別哪些是更重要的數(shù)據(jù),哪些是一般重要的。”

活動(dòng)現(xiàn)場(chǎng):顧青(左)、陳江(右)

華東師范大學(xué)錢幣博物館館長(zhǎng)陳江也講到,“20世紀(jì)早期的大師包括呂思勉、錢穆、陳寅恪等人在內(nèi),所利用的古籍以正史為主,而我們現(xiàn)在所利用的古籍范圍可能是他們的50倍、100倍以上?!?/p>

面對(duì)這些問(wèn)題,顧宏義希望能在今后的數(shù)據(jù)庫(kù)開發(fā)中標(biāo)出文獻(xiàn)的區(qū)分度。“比如二十四史是基本的文獻(xiàn),而在其基礎(chǔ)上產(chǎn)生了很多文獻(xiàn),很多筆記和野史的內(nèi)容都直接抄自二十四史。希望數(shù)據(jù)庫(kù)能夠把最基本、最重要的史料放在最前面,不像現(xiàn)在查詢出來(lái),很多要重要的史料都在列表的后面?!?/p>

而張劍光希望數(shù)據(jù)庫(kù)能在逐字檢索之上提供主題檢索的功能,例如搜索“節(jié)度使”后出現(xiàn)即使字詞不匹配但依然相關(guān)的內(nèi)容。

顧宏義認(rèn)為如果數(shù)據(jù)庫(kù)能夠提供主題檢索,則功莫大焉,但這個(gè)問(wèn)題也不能僅僅靠數(shù)據(jù)庫(kù)的開發(fā)者來(lái)解決,更需要研究者的工作。

對(duì)此,陳江也持類似的觀點(diǎn),“主題檢索的方法其實(shí)古人一直在用,就是使用類書。包括上個(gè)世紀(jì)50年代的一些學(xué)者在收集史料時(shí)的一個(gè)訣竅也是先看類書。但類書就不僅僅涉及古籍的整理了,它們本身就是已經(jīng)花大力氣編撰過(guò)的著作。如果我們的數(shù)據(jù)庫(kù)能實(shí)現(xiàn)主題檢索的話,那就必須先把所有的數(shù)據(jù)重新按主題編纂”。

將古籍整理工作也搬到線上

除了數(shù)據(jù)庫(kù)逐字檢索的結(jié)果數(shù)量龐大之外,有些古籍?dāng)?shù)據(jù)庫(kù)還存在著其他問(wèn)題。

張劍光講到,現(xiàn)在一些數(shù)據(jù)庫(kù)中提供的古籍是沒(méi)有經(jīng)過(guò)整理的,也不能提供版本的選擇,“這樣的數(shù)據(jù)庫(kù)只能是聊勝于無(wú)”?!坝袝r(shí)候會(huì)發(fā)現(xiàn)在學(xué)生的論文中,有的引文沒(méi)有標(biāo)點(diǎn),有的引文繁簡(jiǎn)字體都有,有的引文是自己標(biāo)點(diǎn)的,都存在很多問(wèn)題。如果數(shù)據(jù)庫(kù)里的古籍是經(jīng)過(guò)整理的,有標(biāo)點(diǎn)并且有校勘,可以為學(xué)術(shù)工作提供很好的參考作用?!?/p>

中華書局全資子公司古聯(lián)公司于2014年推出了“中華經(jīng)典古籍庫(kù)”,收錄了中華書局以及天津古籍出版社、齊魯書社、遼海出版社、華東師范大學(xué)出版社、鳳凰出版社和巴蜀書社共七家出版社已出版的整理本古籍圖書。目前收錄的古籍已達(dá)1274種,合計(jì)7.5億字。除了全文、書目和一些分類檢索功能之外,“中華經(jīng)典古籍庫(kù)”還提供圖文對(duì)照——在文本旁可顯示原書掃描圖片,省去與紙書核對(duì)的功夫、自動(dòng)生成引用格式、人名異稱關(guān)聯(lián)檢索等功能。

中華經(jīng)典古籍庫(kù)的“圖文對(duì)照”功能

中華書局總編輯顧青講到現(xiàn)在“中華經(jīng)典古籍庫(kù)”的可信度得到了普遍的認(rèn)可,但被吐槽最多的問(wèn)題是數(shù)據(jù)太少。顧青表示,再過(guò)兩三年“中華經(jīng)典古籍庫(kù)”計(jì)劃收集3000到4000種整理的古籍,總字?jǐn)?shù)計(jì)劃達(dá)到30億字,而中最終的目標(biāo)是覆蓋文史哲所有重要的古代典籍。

在現(xiàn)場(chǎng),四位教授也根據(jù)自己的研究領(lǐng)域和目前關(guān)注的問(wèn)題舉出一些希望被數(shù)據(jù)化或整理的史料,包括《宋元方志叢刊》等已整理方志、明清史料的數(shù)據(jù)化,天一閣所藏方志、宋代的書信、中古史研究需要的墓志、造像記和神道碑等史料的整理和數(shù)據(jù)化。

中華經(jīng)典古籍庫(kù)的“自動(dòng)生成引用格式”功能

相對(duì)于史料的數(shù)據(jù)化來(lái)說(shuō),史料的整理更是一項(xiàng)耗時(shí)耗力的龐大工程。據(jù)顧青所述,中華書局所有的古籍編輯室目前一年能夠完成出版的數(shù)字量最多能達(dá)到1億,如果大家都能持續(xù)做一輩子編輯,大概一共能處理20億到30億的數(shù)字量,但即使如此,還是遠(yuǎn)遠(yuǎn)小于目前古籍的整理需要。

在未來(lái),古籍的數(shù)據(jù)化和整理或也將成為相互促進(jìn)或者同時(shí)發(fā)生的過(guò)程。顧青告訴澎湃新聞(m.nxos.com.cn)記者,現(xiàn)在古聯(lián)公司也正在搭建一個(gè)國(guó)家級(jí)的“中華古籍整理出版資源平臺(tái)”,在此平臺(tái)上能進(jìn)行古籍整理,把線下的古籍整理平臺(tái)搬到線上,呈現(xiàn)的形態(tài)首先是在線的電子版;同時(shí)讀者也能查詢和閱讀;此外還提供版權(quán)交易的功能。

利用數(shù)據(jù)庫(kù)的前提是要有扎實(shí)的基本功

數(shù)據(jù)庫(kù)的使用為學(xué)術(shù)研究帶來(lái)了莫大的便利,但即使如此,仍然不能忽視對(duì)經(jīng)典文獻(xiàn)和最新學(xué)術(shù)成果的閱讀和了解。

對(duì)此,陳江講到:“數(shù)據(jù)庫(kù)的使用不能取代基本古籍的閱讀。我是做歷史學(xué)研究的,如果沒(méi)有一定的閱讀量,則沒(méi)有辦法去評(píng)估任何一件事情在整個(gè)歷史長(zhǎng)河中的意義,面對(duì)海量的數(shù)據(jù)也沒(méi)有辦法產(chǎn)生研究成果。”

而針對(duì)這一問(wèn)題,顧青也反復(fù)強(qiáng)調(diào)閱讀古籍的重要性?!扒f(wàn)不要以為不讀書,只用數(shù)據(jù)庫(kù)就能獲得好的成果。不把基本的工作做好,不把該讀的書都讀過(guò),對(duì)于數(shù)據(jù)庫(kù)里的海量信息就無(wú)法辨別。數(shù)據(jù)庫(kù)可以給我們插上翅膀,但能飛上天的一定是下過(guò)苦功的人?!?/p>

同時(shí),范兆飛也強(qiáng)調(diào),“必須要擺正海量數(shù)據(jù)和的傳統(tǒng)閱讀的關(guān)系,傳統(tǒng)閱讀可能是‘體’,數(shù)據(jù)庫(kù)則是‘用’。如果我們把數(shù)據(jù)庫(kù)的史料價(jià)值形容為冰山的話,檢索的途徑可能只是冰山的一角,我們只有帶著通過(guò)閱讀所獲得的問(wèn)題意識(shí)去檢索,才可能探尋到冰山的真面目?!?/p>

    校對(duì):丁曉
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司