查看原文
其他

【对撞机】当历史学者谈论大数据时,究竟在谈论什么?

韩健夫 零壹Lab 2022-10-08
编者按

近来“大数据”的提法盛行,但人文学界利用大数据进行研究的尚少,对大数据相关的各个概念也未有系统的认识。面对这个牵动各界别的潮流,虽然历史学者通常面对的是故纸堆,但数据就是史料的一种,大数据的发展趋势是史学研究必须了解和回应的。近两年,有许多学术活动以“大数据”或“数字时代”为主题,“零壹Lab”请到复旦大学历史地理研究中心博士生韩健夫报道最近的一次活动,并写下反思。我们预期,数据的开放和数据科学的功用等题目在未来会有更多人讨论,史学界也会产生其自身对大数据的独特理解,而不需要完全移植其他界别的定位。

 


随着信息化时代的到来以及大数据议题的提出,历史学无疑也受到了影响。这股潮流对于历史学研究到底意味着什么?这日益引起学界的关注与讨论。本月,由南开大学与《史学月刊》联合举办的“新史学青年论坛:大数据时代的史料与史学”会议为期两天,几十位来自全球各地的青年历史学者围绕着自己的研究主题,共同展开了对大数据时代史学研究问题的讨论。本次会议共有43篇论文,研究主题涵盖“大数据与史学研究”、“大数据与史料辨析”、“大数据与专题史研究”以及“大数据与中古史研究”等。


疑惑与混沌

在本次会议的分组讨论与最后总结环节中,各位学者或多或少都对大数据与史学研究的关系问题感到困惑。从什么是“大数据”,何为“大数据时代”,到大数据在历史学中有何应用,及其对史学研究是利是弊,各位学者均持有不同看法,甚至存在极为对立的观点,并由此展开了激烈的讨论。


这种认知上的不确定性与历史学者对历史学内大数据的定义尚不明确有关。在此次会议的讨论中,有学者把数据量的巨大等同于大数据,但又有其他学者对此表示并不赞同。在这样缺乏共识的情况下,众说纷纭的情况就不可避免。另外,在数据及数据库的认知上,史学界也尚未实现明确的分类认知。来自不同史学领域的学者从自身研究的特点与视角出发,在谈及数据和数据库时往往主观性较强,未能达成基本共识。换言之,在谈论数据库时,我们所谈论的究竟是否是同样的对象,还未能确定。有些学者所理解的数据库是对史料文献进行数字化而建立的数据库,如爱如生、书同文、Gale集团等公司所制作的中外古籍数字化数据库;而另外一些学者所指的数据库则是经过史学研究机构的研究人员专门进行历史研究后所建立的史学研究成果数据库,如CHGIS和CBDB数据库。这种认识上的差异在一定程度上影响了讨论的聚焦,并由此产生了莫衷一是的情况。


同时,会议上也出现了一系列开放的议题,如:究竟是检索出大量未被前人看到的史料算是大数据研究,还是利用史料中的量化记载进行数据库建设是大数据研究的体现,抑或是运用数理统计乃至GIS等方法分析处理史学问题才算运用大数据?各位学者并未就上述问题达成明确的结论。未来对相关问题的探索仍具有很大潜力。



乐观与谨慎

对于新兴的大数据概念在历史学中应用的前景问题,学者们的态度也颇为不同。偏向乐观者认为,大数据的利用为史学研究带来了新的生机,使得史学研究可以借此更加多元化,而持谨慎态度的学人则认为,史料检索与信息爆炸可能导致研究者以偏概全,从而忽略了那些不利于己的证据。乐观者看到数据化为史学研究者带来的搜集史料的便利,但谨慎者看到的是同一时代下学者在基本史识、史料训练方面的日益缺失;乐观者体会到数据带来的准确性与客观性,而谨慎者则提醒大家尤其需要注意量化的主观性与不确定性。甚至也有学者认为,历史学中可能根本不会用得到狭义上的大数据方法。上述态度上的显著差异,不一而足。


不过,观点的差异与认知的多元,可能恰恰是历史学的魅力所在。学者应该看到,有关大数据与历史学结合前景的态度差异,根源在于对大数据认知的模糊与多元。这种现象在现阶段乃至未来一定时期内还会持续。



可能的共识

现阶段学者对大数据与史学的认识,有如下几点共识:


首先,历史学家的主体地位是不会被大数据动摇的。一切数据与分析手段均不能取代历史学人的思考,所以学者面对数据时应该积极地处于支配者的地位,而非被数据所利用。大数据可以是一种新手段、新方法、新思维、新视角,但绝不是新的研究主体。数据仅是史料的一种形式,历史学者现在乃至未来均不会成为全面掌握电脑技术的“程序员”。


其次,史家不会以大数据为业,而会继续以各自的史学领域与专长为业。立足于自己的研究领域是未来工作的基础,这一观点在会议上得到较为广泛的认可。在此基础上,加强跨学科的研究,强调研究方法上的突破,也是得到大家肯定的一个方向。


再次,对史料的严格甄别与量化的谨慎运用的认同。学者们普遍认同南开大学统计研究院院长王兆军教授所提出的“大数据研究的核心是数据分析”这一观点,在数据分析重要性的认识上也基本取得共识。学者们认为,无论是数据的产生与数据库的建立,还是史料的检索与史料数据的建立,均是为之后的数据分析与史学阐释做铺垫。史学研究的创新性与问题意识仍是学者的主要追求,而对分析所得结论加强阐释力度则是未来应该努力的方向。没有经过分析的数据只是睡眠中的数据,并不能够发挥作用;只有深入分析史料及数据,并充分诠释分析结果,才会对史学研究起到更大推动作用。


总之,随着大数据时代的到来,历史学作为最为基础的人文学科之一,已经开始对此进行尝试性的利用及理论性的反思。这种谨慎的态度或许与历史学研究自身的特点有关,也可能跟过去计量史学思潮留下的审思有关——即再次面对以大量数据为基础所可能衍生出的量化研究保持警惕心理。面对历史学与大数据的关系,今天的观念差异可能暂时会给我们带来些许迷惑,但这对于历史学的长远发展不无裨益。


(图片来自网络)


相关链接

CHGIS网址:

https://www.fas.harvard.edu/~chgis/

CBDB网址:

http://projects.iq.harvard.edu/chinesecbdb

会议日程:

http://jds.cass.cn/Item/33618.aspx

澎湃新闻的相关报道:

http://www.thepaper.cn/newsDetail_forward_1556311


END


责编 / 徐力恒 陈夏辛 顾佳蕙 彭玮 桑雨茜

美编 / 傅春妍


零壹Lab

记录数字媒介之日常

反思科技与人文精神

长按关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存