6月13日上午,中國社會科學院大學beat365體育官方網站副教授、現任中國社會科學院大學數字史學研究中心主任向靜受邀為beat365體育官方網站師生開展講座,題為“明代研究中的數據庫建設:方法與案例”。講座由beat365體育官方網站曹金成副研究員主持。

講座伊始,向靜基于對2010—2023年國家社科基金與教育部人文社科基金中的數字人文類立項、研究歷史現象以及歷史問題的立項以及相關項目中的我院立項所作的統計,勾摹出近年來,尤其是近2—3年來歷史數據庫建設立項數量迅速增長與多學科參與歷史數據庫建設和歷史問題研究的現狀。向靜指出,數據庫建設是數字人文領域研究歷史現象及問題的基礎和重點。向靜還就傳統研究團隊在數據庫建設領域的“馬太效應”、如何生產更有意義的歷史數據以及歷史學者在主導數據庫建設時可能面臨的各種“困境”等話題與師生們分享了自己的思考。

隨后,向靜向師生們介紹了“中國歷代人物傳記資料庫(CBDB)”、“明人書信計劃(MLP)”等知名數據庫的數據體量、資料來源、呈現的主要信息及其構建人物關系活動網絡的基本技術原理,并以柯榮住、王裕華、包弼德(Peter K. Bol)等學者的量化研究為例,說明量化研究利用數字手段概括和處理信息時較之于闡釋性手段的優勢以及定量研究在直接資料不足時的“代理”作用。向靜還指出,“代理”有沒有研究的可信度,本質上是將歷史問題量化時需要考慮的層次、邏輯與方法的合理性問題。由此,向靜引入數據庫建設中的“元數據”概念,并結合吳滔“明代價格數據庫”等案例,指出歷史數據庫的元數據設計應當充分吸收歷史學者對于文獻內部的結構、層次、關聯性的理解力和想象力,使數據庫最終服務于研究過程的整體與細節。
向靜還結合具體案例,向師生分享了利用人力手工錄入,Python、正則表達式等人設程序、機器學習與大語言模型、人工智能進行建設數據庫的具體方式方法。
在互動環節,參與講座的師生就滿文數據庫建設的現狀及其前景,歷史學、檔案學等多學科共同參與的歷史數據庫建設及各學科的數據庫建設側重,數字人文領域定量研究與定性研究的關系,以及量化研究在處理單件史料價值較低的大批量文獻方面的優長與不足等問題與向靜展開交流討論。
向靜,中國社會科學院大學beat365體育官方網站副教授,碩士生導師。北京大學歷史學博士,哈佛大學訪問學者。現任中國社會科學院大學數字史學研究中心主任,兼任故宮學研究中心副秘書長。目前主要從事明代政治史與地方社會史研究,主持教育部人文社科基金、北京市高等學校青年英才計劃、北京市教育委員會、社科大校級文科實驗室建設等課題項目。發表論文十數篇,出版譯著《中華帝國方志的書寫、出版與閱讀:1100-1700年》(上海人民出版社2022年版)。