羅宣 撰(南開大學,歷史學博士,南開大學歷史學院美國歷史與文化研究中心講師,研究方向為現代中美關係、網絡資源與史學等)
《史學集刊》,2003/04,92~99頁
【內容提要】
伴隨著數字化、網絡化的高速發展,各式各樣的學術性數據庫應運而生,學術文獻載體的形式、結構、功能及生存環境因之發生根本性變革。數據庫作為新的史學研究手段,在提高科研效率、改變歷史學資料收集各環節的工作方式、及時追蹤國內外研究最新動向、以及豐富資料來源等方面使史學研究產生了革命性的變化,將引發傳統史學的革命。
伴隨著數字化、網絡化的高速發展,各式各樣的學術性數據庫應運而生,學術文獻載體的形式、結構、功能及生存環境因之發生根本性變革。所謂“學術性”數據庫,是指數據庫出版公司或機構在製作數據庫時是以教學、研究為目的,以教師、研究人員和學生為服務對象的。本文涉及的學術性數據庫同時也是商業性的數據庫(此後簡稱“數據庫”)。所謂“商業性”是指數據庫出版商收取費用的行為。具體地說,數據庫出版公司或機構通過某種方式對用戶群進行限定,以確保交納一定數額使用費的用戶方可使用其產品。由於數據庫費用昂貴,用戶一般採取集團購買的方式獲取使用權。因此,此類數據庫多見於各院校、研究機構等的圖書管理機構的主頁上。
對於歷史研究工作者來說,通過數據庫快速、及時地獲取數字化的相關歷史文獻資料與相關研究信息,不僅能夠提高科研效率,而且可以及時追蹤國內外研究最新動向,保證研究成果的質量。顯然,數據庫是利用現代信息技術全面而又快捷地查詢文獻資料的法寶,是網絡時代進行學術研究應該熟練掌握的研究手段。但是,對於許多史學研究工作者而言,數據庫還是一個比較陌生的新生事物。如何充分利用數據庫資源進行歷史研究,是數字化、網絡化時代歷史學研究所面臨的新課題。
目前歷史學主題數據庫還不多見。歷史類期刊多散見於各大綜合性數據庫中。同時,歷史學研究對象涉及面廣的特性也決定了歷史學者必須從其他學科的數據庫查尋資料。有文章對史學研究者使用歷史類數據庫和綜合性數據庫的情況進行了研究,研究結果表明,歷史學者在檢索文獻時使用最頻繁的是綜合性數據庫,而非歷史學數據庫。[1](P23-34)
國內外綜合性數據庫的數量和種類繁多,本文擬以國內常見綜合性數據庫為主線,按照史學研究收集資料的步驟,依次論述數據庫在歷史研究中的應用。
一、調查課題研究狀況
進行歷史研究,首先應調查課題研究現狀。正如李劍鳴教授所指出,調查課題研究現狀實際上是“論者對自己的課題”作“史學史的研究”,回顧“前人成果”,“妥善處理學術的繼承和創新的關係”,使讀者瞭解該課題的學術價值。“同時,瞭解某一領域的學術源流,有利於鑒別關於同一問題的不同見解。”[2](P42-43)這也是國外訓練史學工作者時著重強調文獻回顧(Literature Review)的原因所在。
課題研究現狀的調查對象一般包括三部分:前人所著書籍、期刊文章以及學術論文。此階段強調掌握概況,不求全文,搜索對象以文摘目錄類為主。
調查前人所著書籍的傳統方法一般是在圖書館按照著者目錄、主題目錄或書名目錄等方式翻查目錄卡片。伴隨著圖書館的數字化,目錄卡片已被館藏目錄數據庫所取代。如今,通過上網查找目標圖書館的網址,在其館藏目錄網頁上選擇相應字段,挑選所需書目,再將檢索結果或打印或存盤,無須親身前往,便可方便快捷地完成此項工作。
各圖書館所藏書籍數量畢竟有限,WorldCat圖書資料數據庫為全面調查前人成果提供了可靠途徑。WorldCat是OCLC(Online Computer Library Center,聯機計算機圖書館中心)(注:OCLC創建於1967年,總部在美國俄亥俄州都伯林,是世界上較大的提供文獻信息服務的機構,聯合了全球近76個國家和地區36000多個圖書館和教育科研機構,以每年200萬種資料的更新速度對外提供服務,現已成為全球最大的聯合數據庫網絡信息服務系統。OCLC的FirstSearch是一個面向最終用戶設計的聯機檢索系統,由幾十個子數據庫組成。1999年國家教委211工程CALIS工程中心以年訂購的方式購買了OCLCFirstSearch基礎組(Base Package)的13個數據庫的年使用權,提供給211工程的61所院校免費檢索。各校師生可在自己的校園網的任一台計算機上應用。13個數據庫絕大多數是綜合性質的數據庫,它們主要涉及工程和技術、工商管理、人文和社會科學、醫學、教育、大眾文化等領域,還包括國際會議論文、網絡資源、世界年鑒等。)為方便研究人員查詢資料,收集了世界範圍的圖書、網絡資源和其他資料,並將其製作成了聯合目錄編目數據庫。它是目前全球覆蓋面最廣、信息收錄最全的圖書資料目錄數據庫,包括4,900多萬條記錄,覆蓋了從公元前1000年到現在來自400多種語言的資料,基本反映了世界範圍內的圖書館所擁有的資料,適用於外國史學者尋找各時代以及各語種圖書資料,是瞭解某課題世界範圍研究成果概況的最佳工具。
在WorldCat數據庫的資料記錄中,除著者、題名、出版單位、出版時間等基本情況外,章節目錄、館藏情況和主題鏈接等是傳統書目無法比擬的。通過章節目錄列表,讀者可對書籍內容一目了然,便於對圖書的取捨;通過館藏情況介紹,讀者可瞭解收藏該圖書的圖書館名稱、收藏數目及該館網址;主題鏈接按照選詞、單複數、邏輯關係、標點符號等嚴格標準編寫,只要學者找到一條與自己課題類似的記錄,點擊主題鏈接,就可以把所有同類文獻找出來。
數據庫為檢索期刊文章所帶來的影響更具革命性。按照傳統的調查方法,徹底收集分散於各期刊中的相關文章信息似乎遙不可及。期刊文摘數據庫的出現,使這種狀況有了較大改觀。目前國內期刊文摘數據庫以中西日俄文期刊聯合目錄數據庫最為知名。該庫是全國性、多學科、多文種的綜合性數據庫,能同時揭示300餘家成員館的期刊聯合目錄和網上外文期刊的目次文摘及部分全文,共收錄西文期刊3.9萬種、館藏25萬條,日文期刊6千種、館藏1.3萬條,俄文期刊6.6千種、館藏1.4萬條,中文期刊4.5萬種、館藏5萬餘條。此外,該數據庫在2000年增收了連續出版的光盤和3000多種網上電子期刊。該數據庫時間跨度大,收錄的西文館藏可追溯至17世紀,收錄的日文和俄文館藏可追溯到18世紀。
在外文期刊文摘庫中,從文獻收集的廣度、深度和使用的便捷性等方面考察,Web of Science文摘引文數據庫無疑是首屈一指的。Web of Science文摘引文數據庫是ISI(Institute for Scientific Information美國科技信息所)以科研為目的製作的學術性數據庫。它分為三部分:自然科學庫SCI(Science Citation Index)、社會科學庫SSCI(Social Science Citation Index)和藝術與人文科學庫A&HCI(Art & HumanitiesCitation Index)。歷史類文獻收錄在藝術與人文科學庫。該庫是藝術與人文科學方面期刊文獻的多學科的索引光盤,完整地收錄了25個學科的1100多種期刊,還包括ISI各個數據庫中有關藝術與人文科學方面的其它7000種期刊中的內容。人文科學方面的主題範圍包括考古、建築、藝術、亞洲研究、古典著作、舞蹈、電影、歷史、人文、語言學、文學、音樂、哲學、詩歌、廣播、宗教、電視和戲劇等。所錄文獻時間跨度從最新資料可回溯到1945年,可以選擇一次檢索全部年份、特定年份或最近一期的資料。
Web of Science的獨到之處是具有強大的引用文獻情況和被其他文章引用情況的查詢功能。在瀏覽文獻時,不但能瀏覽該文獻的出處、文摘、作者通訊地址等信息,而且通過點擊“Cited Reference(所引用的文獻)”,還可調出該文章的參考文獻目錄,直接點擊該文獻的某一篇參考文獻即可查到該參考文獻的記錄。這樣沿著文獻引證關係的路徑,一直可以向前追溯查詢。這一功能對調查某一課題的脈絡、瞭解前人的研究工作和成果極為有效。同時,“Time Cited(被引次數)”可直接給出引用某文獻的所有文獻的題錄列表。點擊列表中任一篇文獻篇名或作者,即可查到該引用文獻的記錄。這一功能對瞭解相關研究工作的背景和進展,借鑒、滲透相關學科領域的思想和成果提供了最便捷的手段。這種全新的檢索功能對於科學研究、文獻評價和研究也具有重要價值。此外,點擊“Related Records(共同引用一篇或數篇文獻的論文,即相關論文)”可輕鬆查找相關學術文獻,同時獲取原文摘要。
查找1945年以前的期刊文摘資料首選ABC-CLIO公司製作的Historical Abstracts(史學文摘數據庫)。該庫是1450年至今世界歷史研究的參考指南。(注:美國史和加拿大史部分未列入此庫,收在該公司的America:History and Life(美國:歷史與生活)數據庫中。)目前收有世界範圍的2000餘種歷史類期刊。
此外,歷史學者還會經常用到Periodicals Contents Index期刊目錄索引數據庫。該庫提供西文過刊的目錄索引,收錄時間可回溯到1770年,囊括1730餘種學術期刊,每條記錄提供完整的期刊目錄。收錄語種有英文、法文、德文、意大利語、西班牙語等多種西文語種。
數據庫在調查學術論文方面也大大拓展了研究人員的視野。學術論文指未經正式發表但擁有一定研究水準的學術性論文。一般包括在專業學術會議上提交的論文和博士、碩士學位論文。這兩部分論文雖未發表,水平參差,但卻是瞭解領域內最新國際研究動態的絕佳途徑。過去獲取會議論文或學位論文僅限於學者所能直接或間接接觸到的範圍,論文數據庫則大大拓展了可收集學術論文的範圍。目前國內外有關學術論文的數據庫主要有以下幾種:
ProQuest Digital Dissertations(博碩士論文數據庫):該庫由美國UMI公司出版,以文摘為主,收錄了1861年以來歐美1000餘所大學的160多萬篇學位論文,是目前世界上最大、最具權威性和最廣泛使用的學位論文數據庫。數據庫每年新增博士論文47,000篇、碩士論文12,000篇。其中,1980年以來的博士論文提供350字的文摘,1988年以來的碩士論文提供150字的文摘,1997年以來的部分論文收有全文。
PROCEEDINGS(會議錄索引庫):美國科學情報研究所ISI的網絡數據庫,全稱為Web of Science Proceedings,由兩大會議錄索引組成:ISTP(科學技術會議錄索引)和ISSHP(社會科學及人文科學會議錄索引)。該庫所涉及的主題是各種類型的學術會議上所討論的、比較廣泛的主題。該庫彙集了世界上最新出版的會議錄資料,包括專著、叢書、預印本以及來源於期刊的會議論文,提供了綜合、全面、多學科的會議論文資料。
PAPERSFIRST(國際學術會議論文庫):PapersFirst和Proceedings是關聯庫,它的全名是ProceedingsFirst,包括1993年至今在世界各地舉行的各種學術會議、聯合會、博覽會、專題會、專業會、學術報告會的會議目錄表。每條記錄包括在某一次會議上提交的論文列表,從中可瞭解該次活動的概貌。此外,該庫還提供了一條檢索“大英圖書館資料提供中心”的會議錄的途徑。
二、收集文獻資料
收集文獻資料旨在收集文獻的全文。目前全文數據庫的開發剛剛起步,電子手段還不能完全替代紙本書刊。儘管如此,通過全文數據庫收集已有的電子圖書、全文期刊文章和原始文獻,可以方便、快捷地拓展文獻資料範圍,其重要性是不言而喻的。
電子圖書(E-book)也稱數字圖書,是以數字形式在互聯網上出版、發行,讀者通過閱讀終端進行下載的數字化書籍。從使用的角度來看,電子圖書有如下幾個主要優點:1、提供動態、多途徑和可以隨意組配的檢索功能,方便、快捷、直觀、準確是其特點。讀者可以利用單一詞彙、相關詞彙以及模糊查找等多種檢索途徑進行檢索,幾秒鐘就可以查出自己所需要的主題資料;2、圖書內容可以是文本、圖片和聲音的綜合體,比傳統的圖書更加直觀、生動。3、同一本圖書可同時供多人隨時使用。用戶無須預約或按先來後到借閱書籍,也不必再面對圖書已借出或售完的尷尬。
國外電子圖書的製作由於受版權、費用等因素的限制,發展極為有限。一般數字圖書館如Netlibrary和Ebrary的收錄數量都只有2、3萬冊,而且費用令人瞠目。國內享有一定知名度的電子圖書網站有中國國家圖書館(
http://www.nlc.gov.cn)、中國數字圖書館(
http://www.d-library.com.cn)、超星數字圖書館(
http://www.pdg.com.cn)等。其中,超星數字圖書館的特色收藏最值得史學界同仁的注意。
超星數字圖書館具有瀏覽、檢索、在線閱讀、下載、入書簽、記讀書筆記和發表評論等功能。檢索結果可存盤、打印。該館收有全國各大圖書館、各大出版社的全文數字圖書52萬冊。除與歷史學相關的書籍之外,其文史資料和檔案收藏對史學研究人員最具吸引力。
超星的文史資料圖書館收錄了全國政協文史資料委員會編的革命史資料、工商經濟史料、人物事件專輯、文史資料選輯、文史通訊、縱橫;各地政協文史資料委員會編的華北、東北、西北、華東、中南、西南等地區的文史資料。
國家檔案文獻庫收藏有中央檔案館、中國第一歷史檔案館、中國第二歷史檔案館的館藏重要檔案文獻。內容包括自明清至1995年期間最有權威性的150多萬頁重要檔案文獻資料。該庫由以下三部分內容組成:
中國明清史檔案文獻庫:包括康熙朝漢文朱批奏摺彙編、雍正朝漢文朱批奏摺彙編乾隆朝上諭檔、清代檔案史料叢編、鴉片戰爭、中法戰爭及洋務運動、辛亥革命、歷史檔案雜誌、光緒宣統上諭檔。
民國史檔案文獻庫:包括民國史檔案資料彙編、民國史檔案資料叢書影印出版物(黃埔軍校史稿、臨時政府公報、北洋政府公報、南京國民政府外交部公報、立法院公報、汪偽國民政府公報、民國史檔案資料。)
中國革命史檔案文獻庫:包括中共中央綜合性文集、中共中央文件選集(1921-1948)建國以來重要文獻選編、中共黨史資料、中共會議、組織、紀檢、宣傳、統戰工作文集、中華人民共和國法令法規彙編、軍事、外交、群眾團體、文化、教育、衛生、知識分子、財經、國民經濟計劃、農業、工業工作文集。
此外,超星數字圖書館還收有部分考古方面的過刊全文,如《考古》(1959-2000)、《文物》(1959-2000)、《文物參考資料》(1950-1958)、《故宮博物院院刊》(1958-2000)、《考古通訊》(1955-1958)、《博物館研究》(1982-2000)、《新疆文物》(1990-2000)、《廣東文物》(1996-2000)、《革命文物》(1976-1980)、《中華文史論叢》(1979、1982、1985、1989)、《文物天地》(1981-2000)、《文獻》(1979-1980)等。
全文期刊數據庫因為能適應人們快速、準確地查找某個主題完整信息的需求而深受用戶青睞。由於全文數據庫還處於發展的起步階段,全文期刊數據除個別例外一般只回溯到了二十世紀九十年代。因此,目前只能作為傳統紙本資料的補充資料來源予以使用。
國內最常見的中文全文期刊數據庫當屬“人大複印報刊資料”。“人大複印報刊資料”是中國人民大學書報資料中心對國內公開出版的3000餘種報刊上的社會科學、人文科學文獻,按學科領域或專題進行不同層次的整理加工和編選而形成的系列專題資料。它使分散的學術資料經過精選,實現有序化,是具有較高學術參考價值的全文期刊文獻數據庫。該數據庫以其涵蓋面廣、信息量大、分類科學、篩選嚴謹、結構合理完備,成為國內最有權威的具有大型、集中、系統、連續和靈活五大特點的社會科學、人文科學專題文獻資料寶庫。“人大複印報刊資料”大部分期刊收錄的時間可回溯到1994年。
中國學術期刊全文數據庫(China Academic Journal text database,簡稱CAJ)也是國內較通用的全文庫。該庫由中國學術期刊電子雜誌社開發製作,是我國第一部、也是當今世界上最大的一部集成化全文電子數據庫,收錄的全文期刊多達5000餘種,大多可回溯到1994年。該數據庫最顯著的特點是除提供篇名、作者、關鍵詞等檢索字段外,還可進行引文檢索。每一篇來源文章的參考文獻都是一篇引文,引文文獻亦是數據庫中的來源文章。而且,每篇文章所附“相關文獻”超文本鏈接將庫中所有與該文章相同主題的文章以列表形式查找出來,同時每條查尋結果又都附帶著自己的引文檢索和相關文獻檢索鏈接,使來自5000種全文電子期刊的文章構成了強大的交互式引文和相關文獻檢索源。
此外,檢索中國學術期刊全文數據庫時還可逐級打開樹型的各學科專題目錄,由此可以檢索到全文數據庫中各學科專題包含的所有文章。“二次檢索”也是值得一提的功能。所謂“二次檢索”,即對上次的檢索結果進行限定,在檢索結果內進行第二次檢索,以便縮小檢索範圍。另外,點擊文獻的“中文刊名”鏈接,可得到該期刊本期文獻目錄,進一步點擊文獻名,可以打開本期文獻全文。
在國內常見的國外全文數據庫中,JSTOR的時間跨度最大。JSTOR全名為JournalStorage,是西文過刊全文數據庫,也是這個對過期期刊進行數字化的非營利性機構的名稱。與一般的期刊數據庫只回溯近十年的期刊明顯不同的是,JSTOR所收錄的期刊全部從創刊號開始收錄,有些過刊的年代甚至可回溯至1665年!不但如此,JSTOR中的所有文章都可進行全文查尋。此外,JSTOR的文獻採取影像表現形式,文字清晰,版面和頁碼標注完全忠實於期刊原樣。目前JSTOR的全文庫是以政治學、經濟學、哲學、歷史等人文社會學科主題為中心,兼有一般科學性主題,總計達十幾個領域。具體內容包括:
1、Arts & Sciences Ⅰ Collection人文社會主題一:收錄人類學、亞洲學、非裔美國人研究、經濟學、生態學、數學、哲學、政治學、教育學、財政、歷史、文學、人口統計學、社會學、統計學等15種人文社會學科領域117種學術性期刊全文資料。
2、Arts & Sciences Ⅱ Collection人文社會主題二:收錄非洲研究、拉丁美洲研究、中東研究等新主題的期刊,已經有110種期刊上網。
JSTOR中所收錄的歷史類過刊共39種,分別是:American Historical Review(1895-1999);American Quarterly(1949-2002);Annals of the Association of AmericanGeographers(1911-1997);Comparative Studies in Society and History(1958-1997);Economic Geography(1925-1997);Economic History Review(1927-1997);Eighteenth-Century Studies(1967-2002);English Historical Review(1886-1997);Ethnohistory(1954-2002);French Historical Studies(1958-2002);HispanicAmerican Historical Review(1918-2002);Historical Journal(1958-1997);Cambridge Historical Journal(1923-1957);History and Theory(1960-1998);History of Education Quarterly(1961-1997);History Teacher(1967-1999);International Journal of African Historical Studies(1972-1999);AfricanHistorical Studies(1968-1971);International Journal of Middle East Studies(1970-1997);Journal of African History(1960-1997);Journal of American History(1964-1999);Mississippi Valley Historical Review(1914-1964);Journal ofBritish Studies(1961-2002);Journal of Contemporary History(1966-1999);Journal of Economic History(1941-1997);Journal of Interdisciplinary History(1970-1997);Journal of Military History(1989-1999);Military Affairs(1941-1988);Journal of the American Military Institute(1939-1940);Journal of theAmerican Military History Foundation(1937-1938);Journal of Modern AfricanStudies(1963-1997);Journal of Modern History(1929-1999);Journal of NegroHistory(1916-1999);Journal of Southern African Studies(1974-1999);Journal of Southern History(1935-1997);Journal of the History of Ideas(1940-2002);Modern China(1975-1999);Past and Present(1952-1997);Renaissance Quarterly(1967-1999);Renaissance News(1948-1966);Reviews in American History(1973-2002);Russian Review(1941-1997);Sixteenth Century Journal(1972-1997);SixteenthCentury Essays and Studies(1970-1971);Speculum(1926-1997);Studies in theRenaissance(1954-1974);Wiliam and Mary Quarterly(1892-2000)。
除以上列舉的歷史類39種期刊外,JSTOR還收錄有與外國歷史相關的亞洲學、非裔美國人研究、非洲研究、拉丁美洲研究、中東研究等主題的期刊。限於篇幅,此不贅述。
EBSCO Online也是較有特色的全文數據庫。它是EBSCO Publishing公司推出的系列數據庫的統稱。EBSCO Publishing公司也是一家較大的專門經營紙本期刊、電子期刊、電子文獻數據庫出版發行業務和信息存儲開發的商業性服務機構,成立於1984年,目前全球有超過一萬家的圖書館在使用該公司提供的服務。現能提供檢索的網絡數據庫有Academic Search Elite(學術研究精粹數據庫)、Business Source Elite(商業資源精粹數據庫)、Fact On File等。EBSCO的系統提供了跨庫檢索功能,用戶在使用過程中隨時都可以重新選定多個數據庫進行檢索,其中所包括的主要數據庫如下:
Academic Search Premier(《學術研究之最》,簡稱ASP):它是世界上最大的跨學科全文數據庫,收錄了3,600多種全文學術期刊和出版物,其中有2,700多種期刊是專家評定的學術性刊物,內容包括各學術領域,時間可追溯到1975年。
Academic Search Elite(《學術研究精粹》:收錄有關社會科學、人文、綜合性科學、教育、多文化等領域的近1,700種全文期刊和近2,900種期刊的索引和文摘。全文最早回溯到1990年,索引和文摘最早回溯到1984年。)
該數據庫的特色在於其檢索方式不僅分為初級檢索和高級檢索兩大類,每一類還下設關鍵詞檢索(keyword search)、主題檢索(subject search)、出版物檢索(publications search)和圖像檢索(Images search)四種方式。其中,出版物檢索提供查詢、瀏覽各種庫存期刊的服務,並提供刊名、出版商、文摘、全文的收錄年限等信息的超文本鏈接。圖像檢索可進行特定種類的圖像的檢索,包括人物、自然科學、地址、歷史、地圖、旗幟等方面,彌補了其他數據庫忽略的圖像查詢領域的空白。
EBSCO另外一個別具特色之處是限定檢索純學術期刊(Peer Reviewed Journals(注:所謂“Peer Review”是指為了保證文章的學術水準,期刊編輯部在全國乃至世界範圍內聘請文章所涉及學術領域的權威教授或研究人員,對文章進行專家匿名評審的一種選稿方式。評審小組一般由三人組成,分別對文章提出修改和應否發表的意見。編輯部有專人負責與作者聯繫,轉達評審小組的修改意見。評審小組兩人以上通過的文章才能發表。))的功能。此檢索方式從檢索結果中排除了新聞、娛樂雜誌等非學術性內容,極大地提高了檢準率。
OCLC的全文數據庫WILSONSELECT PLUS所錄文章以HTML格式顯示,無須使用任何全文閱覽器,因此它是傳輸數據速度最快的外文全文期刊數據庫。WILSONSELECT PLUS包括聯機全文、索引和摘要記錄,收錄了從1994年以來的1300多種英文期刊和雜誌。
三、史料文獻查尋及其他
除了電子圖書和全文期刊文章數據庫,在史學研究中更為重要的原始文獻資料數據庫也在不斷發展中,並在推動史學研究深入發展方面起著越來越重要的作用。
首先,數據庫為查詢原始資料提供了新的便捷途徑。國內外檔案館都在創建完善自己的網頁,讀者通過相應檔案館網頁上提供的數據庫,就可以直接查詢他們的館藏目錄或檔案收藏指南。類似WorldCat檔案資料索引也可以在瞬間檢索到檔案收藏線索。
其次,古籍類全文數據庫的迅速發展為高效率地檢索、利用中國歷史文獻提供了條件。“傳統的史學研究在某種程度上,就是發掘史料功夫的較量,而在計算機數據庫面前,在關鍵詞確定的前提下,例如弄清楚某件事物歷史上最早於什麼時候出現,就不能再視為‘研究’,而只是技術性操作。”[3](P7)在傳統研究中,史學家花費了大量的時間來尋章摘句,“區區十數字,而研究者動費一年數月之精力”,但“往往所勞甚多,所獲甚簡,”[4](P90)漏檢亦是在所難免。古籍類全文數據庫的出現,不僅使徹底、準確檢索成為可能,而且還省卻了繁重的摘抄工作,“在很大程度上將史學家從這種重複勞動中解放出來,讓他們去進行更為複雜、更為抽象的理論分析。就某種意義而言,這是史學即將發生的一場革命。”[3](P7)
隨著中文古典文獻數字化程度的迅速提高,檢索功能很強的中國史類全文數據庫不斷推陳出新,常見的主要有:二十五史全文數據庫(
http://www.china-history.com)、漢籍電子文獻(
http://www.sinica.edu.tw/ftms-bin/ftmsw3)、文淵閣四庫全書(
http://skqs.unihan.com.cn)、先秦兩漢一切傳世文獻電腦化資料庫、魏晉南北朝一切傳世文獻電腦化資料庫、竹簡帛書出土文獻電腦資料庫(
http://www.chant.org/scripts/main.asp)、大正新修大藏經(
http://ccbs.ntu.edu.tw/cbeta/cbeta.htm)等。有關以上古籍數據庫的詳細介紹請參閱袁林的“中國古代史研究數字化文獻資源與利用”[5]一文。
再次,數據庫的出現在一定程度上彌補了研究外國史時史料不足的問題。如梁啟超先生所云:“史料為史之組織細胞,史料不具……則無復史之可言。”[4](P53)對於長期以來困擾於原始文獻缺乏的外國史研究來說,已有的相關數據庫在一定程度上彌補了原始文獻不足的問題。例如,GALE公司工具書資料數據庫之一的History ResourceCenter US(美國歷史資料中心),就不僅收錄有超過30,000篇參考文章,還包括1000多種歷史原始資料和選自65種有關美國歷史(從前殖民地時代到現在各個歷史時期)的專題、事件、人物的全文期刊。該中心還包括了美國科技信息所(Institute forScientific Information)的藝術與人文科學索引庫(Arts and Humanities CitationIndex)中180多種歷史類期刊的索引。根據史學研究的特點,該庫還提供了有史學特色的多種檢索路徑,如人物檢索、主題檢索和編年檢索等。相信伴隨數據庫的進一步發展與完善,充分利用數據庫進行外國史研究將會大大提高國內的外國史研究水平。
數據庫除能在調查研究現狀和收集全文文獻方面方便學者的研究外,還會在以下幾個方面發揮其特殊作用:
1.著作在國內外影響。在調查前人研究成果的過程中,研究人員常需要瞭解某部著作在國內外的影響。數據庫為此提供了兩條捷徑:其一為書評。美國威爾遜公司出版的Book Reviews Digest(注:該庫是國家教委CALIS中心購買的13個OCLC Firstsearch基礎組數據庫之外的產品。目前只有北大圖書館購買了此庫的使用權。)便是專門的書評文摘數據庫。它收錄了專家們就最新出版的英語小說及非文學作品所撰寫的書評。這些書評都是圖書出版後18個月內在美國、加拿大和英國近100種主要期刊上所發表的評論。其二為被引用次數統計。顯而易見,研究成果被引的次數越多,其影響力越大。利用Web of Science中“被引次數(Time Cited)”的特殊檢索功能,即可對該成果的被引用次數一目了然。
2.核對文獻引文。在史學研究工作中,核對文獻引文不可或缺。無論是書目、文摘數據庫,還是全文數據庫都可以成為核對文獻引文的工具。不過需注意的是,首先應調查該數據庫中是否收有所查書籍或刊物。顯然,就核對文獻引文而言,書目文摘庫更為理想。因為書目文摘庫收錄的文獻信息在範圍和時間跨度上往往比全文數據庫大。利用數據庫核對文獻引文簡便易行,只鬚根據現有線索鍵入相應的檢索條件,就可依據命中記錄提供的信息或補充或修改引文。
3.查找人物傳記資料。在收集材料、解釋材料的過程中,史學研究者常為搜索人名或與人名相關的材料費盡周折。GALE公司的工具書數據庫Biography Resource Center +The Complete Marquis Who's Who名人傳記資料中心為查找人物傳記資料提供了方便。此名人傳記資料庫收錄了完整的Marquis Who's Who上百萬位人物的傳記資料,以及超過250種的期刊全文資料。該數據庫操作簡單,只需鍵入人物姓名或姓氏,點擊“檢索”命令,就可以看到與該人物相關的資料。該庫提供的材料詳盡而且有深度,包括人物的簡歷及其他簡歷收錄出版物、關於人物的參考期刊文章(全文)、人物主要作品清單、相關新聞等。
目前,數據庫還處於發展的初級階段,歷史學研究所需要的許多文獻資料還沒有上網,大多數數據庫的書目文摘數據只收集到了二十世紀七十年代,全文數據庫的數據大都只製作到九十年代。顯然,數據庫還不能完全取代紙本書籍、期刊文章和文獻資料,它所起的作用是有限的。但是,以網絡時代信息技術發展之速度,上述缺憾無疑會逐漸得到解決。即使在目前數據庫建設尚有待完備的情況下,數據庫在擴大研究者視野、補充紙本研究資料方面所起的作用也是不能忽視的。因此,樹立利用數據庫的意識、掌握利用數據庫進行研究的方法,對於歷史研究工作者來說,無疑是非常重要的。
四、數據庫文獻的注釋
談到使用數據庫文獻,必然涉及其注釋規範問題。目前國內還沒有關於數據庫文獻注釋的成文規範。學界同仁可借鑒國外權威機構為數據庫的注釋與引用所制定的模式。1991年美國最具權威的三大書目注釋格式是MLA(Modern Language Association)、APA(American Psychological Association)和Chicago(University of Chicago Press)。其中,MLA注釋格式是美國現代語言學會針對人文類學科及其他相關學科所制定的書目及注釋格式。MLA在1999年版的手冊中添加了關於注釋電子資源的詳細規範,是三大格式中調整最快,最符合學者需求的注釋體例。因此,本文就以MLA的注釋格式為例,介紹數據庫的注釋格式[6]。
1.電子圖書:
基本格式:作者.書名.出版地點:出版機構,出版年.訂購單位名稱,訂購單位所在地.獲取文獻日期<數據庫網址>
例:
Norman,Richard.The Moral Philosophers.New York:Oxford UP,1998.DukeUniversity Libraries,Durham,NC.14 Aug.2002<http://www.netlibrary.com>.
2.數據庫中的全文文章:
基本格式:作者.“文章題名.”期刊題名.卷號.期號(日期):起止頁碼或總頁數.數據庫名稱.訂購單位名稱,訂購單位所在地.獲取日期<數據庫網址>.
例:
Gomel,Elana.“The Plague of Utopias:Pestilence and the Apocalyptic Body.”Twentieth Century Literature 46.4(Winter 2000):405-33.FirstSearchWilsonSelect Plus.Nankai University Library,Tianjin.17 Mar.2003<http://newfirstsearch.oclc.org/>.
3.網上檔案/原始文獻:
基本格式:作者.原始文獻名稱.出版機構,出版時間.原始文獻所屬項目名稱,項目出版單位.獲取文獻日期<文獻所在網址或數據庫網址>
例:
Eaton,Seymour.Sermons on Advertising.Seymour Adair Eaton,1907,Emergence of Advertising in America.Rare Books,Manuscript,and Special Collections Lib.,Duke U.23 Aug,2002<http://scriptorium.lib.duke.edu/dynaweb/eaa/databases/printlit/@Generic_BookTextView/1851>.
【參考文獻】
[1]Walker,Geraldene and Seven D.Atkinson.Information access in thehumanities:Perils and pitfalls[J].Library Hi-Tech,Vol.9,No.1,1991.
[2]李劍鳴.在現實關懷與學術追求之間─1989年以來中國美國史研究的成績和問題[A].胡國成 等編.透視美國[C].北京:中國社會科學出版社,2002.
[3]包偉民.論當前計算機信息技術對傳統歷史學的影響[J].杭州大學學報(哲學社會科學版),1998,(2).
[4]梁啟超.中國歷史研究法[M].上海:華東師範大學出版社,1996.
[5]袁林.中國古代史研究數字化文獻資源與利用[J].中國史研究動態,2000,(12).
[6]Gibaldi,Joseph.MLA Handbook for Writers of Research Papers[M].5th ed.New York:MLA,1999.