瀏覽“江蘇省珍貴古籍數字資源集成平臺”,如同漫步在歷史長(cháng)卷中。《投筆集一卷》《憺園文集三十六卷》等文集有序排列在電子書(shū)架上,點(diǎn)開(kāi)一看,古樸厚重的線(xiàn)裝書(shū)一頁(yè)一頁(yè)、圖文并茂地呈現在眼前。
近日,南京圖書(shū)館“清人文集數據庫”上線(xiàn)。作為“江蘇省珍貴古籍全文影像數據庫”項目第一期成果,該平臺目前共收錄清人文集400部,以全本彩色掃描的方式制作成13萬(wàn)余幅高像素數字圖像,并帶有檢索功能,在全網(wǎng)發(fā)布。
“南京圖書(shū)館館藏的清刻本有7萬(wàn)多冊,其中不少是清人文集。”南京圖書(shū)館歷史文獻部主任、江蘇省古籍保護中心副主任陳立說(shuō),本次南京圖書(shū)館發(fā)布的數據庫,便是結合館藏優(yōu)勢,以圖像數據庫形式,集中公布了一批具有相同主題的珍貴文獻。值得一提的是,這其中有許多“罕見(jiàn)”文獻,甚至有些還是僅存“孤本”。陳立介紹,例如嘉慶時(shí)期刻本吳俊《榮性堂詩(shī)集》、潘奕雋《三松堂集》等,都是存世較少的清人文集。
這些古籍是怎樣從圖書(shū)館庫房被“搬”到網(wǎng)絡(luò )平臺的呢?
陳立介紹,古籍數字化過(guò)程分為兩步。首先,要將古籍進(jìn)行掃描。古籍掃描使用專(zhuān)用非接觸式掃描儀,通過(guò)高像素照相機,盡量不按壓古籍頁(yè)面進(jìn)行拍照;采用的光源是防紫外線(xiàn)的LED燈冷光源,圖片顏色不能失真,要用色卡比對。
掃描完成后,就要對這些原汁原味的圖像做數據化處理,做至少深入到第二層級的標引,方便使用者按子目檢閱相關(guān)內容。記者看到,每種文獻的序和跋都進(jìn)行了單獨標引,通過(guò)檢索可以單獨搜索出來(lái)。“古籍的序和跋中不乏名家作品,具有較強的文學(xué)和研究?jì)r(jià)值,如《莫愁湖風(fēng)雅集》中就有姚鼐作的序。”陳立介紹。
平臺的開(kāi)發(fā)建設也至關(guān)重要。一方面,要完整、全面地給古籍“搬家”,還要方便、快捷地幫助使用者找到相應內容;另一方面,還要給后續發(fā)布的方志、家譜等多種類(lèi)型的古籍文獻“搬家”預留接口。
古籍數字化的最大挑戰,一是專(zhuān)業(yè)知識,二是技術(shù)。“從事這項工作,需要懂歷史學(xué)、文獻學(xué)、目錄學(xué)等的復合型人才,還要有甘坐冷板凳的精神。”陳立坦言,南京圖書(shū)館對古籍文獻進(jìn)行掃描的工作從15年前就開(kāi)始了,數字標引小組也在4年前啟動(dòng)。正因為有這些基礎準備,“清人文集數據庫”才能在近期與讀者見(jiàn)面。
不過(guò),古籍數字化到這一步還沒(méi)有結束。陳立介紹,古籍數字化的2.0版,將為古籍愛(ài)好者梳理浩如煙海的文字背后的知識邏輯順序,制作專(zhuān)題知識圖譜型數據庫,甚至可將部分書(shū)中內容制作成“數字文創(chuàng )”,讓曾經(jīng)束之高閣的古籍更好走進(jìn)千家萬(wàn)戶(hù)。(來(lái)源:人民日報;記者 姚雪青)