分享 首届“数字人文论坛”面面观

 

2016年5月21日,首届“数字人文论坛”于北京大学召开。“中华经典古籍库”受到大会邀请参加,中华书局洪涛在...

2016年5月21日,首届“数字人文论坛”于北京大学召开。“中华经典古籍库”受到大会邀请参加,中华书局洪涛在会上作了“整理本古籍的数字化与移动应用”的报告。以下是敝司同事参加大会的感想心得,与诸君分享。




笔者一直在关注国内数字人文研究的动态。就目力所及,台湾大学已成功举办6届“数字典藏与数字人文国际研讨会”,相较而言,大陆高校组织“数字人文”相关会议则是近两年才逐步展开。去年,上海大学成功举办了“大数据时代下的历史研究”国际学术研讨会,产生了广泛影响。

2016年5月21日,首届北京大学“数字人文论坛”在北京大学图书馆成功举办。笔者感到十分兴奋:大陆高校终于要真正展开对“数字人文”的讨论以及相关领域的跨学科合作了。
当日上午8:30论坛正式开始。首先由美国伊利诺伊大学J.Stephen Downie教授以“美国HathiTrust项目及若干数字人文子项目”为题进行了主旨报告。随后浙江大学图书馆黄晨副馆长浙江大学图书馆黄晨副馆长系统介绍了CADAL整体情况以及合作项目。

两位专家的主旨报告结束以后,迎来了论坛的第一个主题“数字人文的概念、实践与反思”。武汉大学信息管理系王晓光教授提出了我国数字人文必经的路径,如建设数字人文研究基础设施、积极推动和参与数字人文研究中心建设、开发数字人文基础入门课程等。

哈佛大学徐力恒博士介绍了欧美高校推动数字人文的实践,讲解了各自推动数字人文的几种形式。在下午的一场报告中,徐博士详细讲解了中国历代人物传记资料库(CBDB)的发展历程,以及CBDB如何为学者提供数据支撑。

北京大学图书馆朱本军副研究馆员的报告中则强调,图书馆工作应该充分考虑人文的因素,分类整合数据库、有序推进馆藏文献数字化、提供数字人文技术与提供数字人文工具等工作,促进技术与人文的深度融合。

中华书局洪涛以“整理本古籍的数字化与移动应用”为题,介绍了中华书局在漫长的数字化历程中,如何从本体语义网的研究,到“中华经典古籍库”机构版建设,再到微信移动版的开发,不断探索用户需求。古联团队继承了中华书局传统编辑的严谨精神,把数据质量提到了极高的层次,还修订了原书存在的一些编校错误。目前中华经典古籍库里收录800余种中华书局整理本古籍。报告最后,洪涛演示了微信版“中华经典古籍库”,这是全球唯一一款整理本移动数据库,简约、轻便、随身是它最突出的三个特点。在谈到中华书局数字化的未来,我们会继续与各出版社密切合作,为读者提供更多高质量的整理本古籍数字内容。


中华书局出品

5亿字精校古籍一手掌握

长按二维码,关注“经典古籍库”



中国社科院历史研究所邱源媛副研究员以“史学数字化研究中的人文思维——以清代旗人户口册研究为例”为题,结合自己对清代旗人户口册的研究与田野调查,从多角度充分说明这类文献的复杂程度,要从制度、编纂目的等方面为这类文献做定性的研究工作,而不是直接数字化以后供量化使用。

清华大学美术学院向帆、朱舜山教授以“数据可视化与人文艺术——全国美展获奖作品视觉化分析”为题,讲述了将2000余幅获奖作品数字化的过程。目前,他们正在进行的工作是中国墓室壁画视觉化数据平台。

原本在每位专家演讲结束以后,安排了提问环节,但一天时间议程安排太紧,所以有些提问环节省去,把互动答疑集中在了“全体讨论”环节。现就参会者集中反映的问题,撮述如下。
数据开放


论坛中不止一位提问者对专家提出诸如“您演讲中提到的数据库是开放的吗”“这个数据库以后有开放给公众的计划吗”的问题,可见,大家对数据是否开放获取问题的关注。

这也是国内数字化现状的折射。相比国外以及中国台湾的数据开放程度而言,中国大陆则延续了传统的藏书模式,即便各自分散地做了完整系统的数字化工作,也没有完全发挥这部分数据的作用,一般读者很难利用。
跨界合作
此次论坛,笔者特别注意到北京大学数据分析研究中心主任助理许京奕博士的求学历程,许先生计算机专业出身,后来转向人文领域,集中做出了“全唐诗分析系统”“全宋诗分析系统”“中国历史人物传记数据库”等大型数据库,这也引发了参会者的思考。

如果人文学者没有计算机背景,一般都很难与技术人员对话,计算机对人文数据的呈现也就无法满足人文学者的需求。目前,国内高校中,人文学者与计算机领域的学者普遍存在隔膜,这是整个数字人文始终没有能够飞跃的一个极大的屏障。
人才培养
由上一个问题引申出来的另外一个问题是:新时代如何培养文理兼通的人才?能够熟练运用计算机技术充分实现人文学者对文献数据处理的要求,把“跨界”整合在一位学者身上,自立自足地研发相关软件,真正让文史研究搭上互联网的快车,碰撞出更为璀璨的火化。
反思改进
科技对人文的冲击以及这个过程出现的问题,可能传统的人文学者最能感受得到。笔者特别注意到中国科学院历史研究所副研究员邱源媛女史的演讲,她从本位的史学出发,引出了对数字人文的很多思考。

“数字人文”,传统学者将重心放在“人文”上,他们关注更多的是文献背后的东西,是什么促成文献变成了现在的样子,这涉及制度、目的等,需要将这部分文献研究透彻,才能够在此基础上做合理地统计。如果文献的性质都没有搞清楚,抽离文献的一个侧面作为量化的一份子,那么依据数据库得出的结论,并非我们想象中那样可靠。

要审视数据库的文献构成及性质,在定性与量化之间保持应有的理性,需要人文学者深入介入数据库的开发,才可以实现更为精准的“数字人文”成果。

附:各位专家提到的数据库

(因部分数据库并非开放获取,未全部列出)

01.   HathiTrust’s digital library:https://www.hathitrust.org/

02.   CADAL:http://www.cadal.zju.edu.cn/

03.   全唐诗、全宋诗电子检索系统:http://www.cibtc.com.cn/gtweb/szcb/webpage/tangsong.html

04.   中国历史人物传记 数据库:http://p.nlcpress.com/

05.   中华寻根网:http://ouroots.nlc.gov.cn/

06.   中国边疆史地数据库:http://www.cibtc.com.cn/gtweb/szcb/webpage/bianjiang.html

07.   中华经典古籍库(在线版):http://www.gujilianhe.com/

08.   中国第一历史档案馆 军机处全宗(首批录副奏折)、宫中档案全宗:http://www.lsdag.cn/dacx/index.jhtml

09.   民国文献大全:http://cadal.hytung.cn/


    关注 经典古籍库


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册