自20世纪90年代起,自然科学(即所谓硬科学)开始经历一场变革。越来越多的科学家们投身于诸如环境、恒星和星系、原子和电子、细胞和分子、人体内的微生物菌落、全球经济和人类大脑这样的复杂系统的研究,他们逐渐意识到所面临的问题太过复杂,难以用单一学科的研究方法来解决。因此,科学家们开始不再局限于用所属分支学科,而是以共同面临的复杂问题或是重大挑战来界定他们所从事的工作以及自身身份,并与本领域之外的专家合作研究复杂系统,并建立全新、共通的学术话语体系和可移植的研究方法。这种变革不能简单地将其表达为“跨学科的研究”(因为跨学科通常只是从不同学科的各自视角开展的平行研究方式),而是一种崭新的、功能交叉的整合科学研究方法。
但是在教育、心理和其他社会科学领域,科学界的这种变革还尚未展现得淋漓尽致。原因在于这些领域不是硬科学,而是比硬科学更复杂、更困难的科学。这些领域的问题之所以更复杂,正是因为人的因素牵涉其中。人类,不管是个体还是群体,其自身就是复杂系统,将人这一复杂系统放在其他复杂系统中进行研究,领域的复杂度一下子变成了指数级的。
大卫·威廉姆斯·谢弗试图通过这本著作提醒大家,教育和社会科学领域的类似变革正在到来。《量化民族志:一种面向大数据的研究方法》是关于理解为何在数字时代,定性研究和定量研究、科学和人文、数字和理解这种旧的区分方式,在某些情况下限制了我们所能提出的问题,而在另一些时候又迫使我们必须接受一些浮于表面的答案。量化民族志是在整合了数据挖掘、话语分析、心理学、统计学和民族志等方法论的基础上,提出的一种全新的科学研究方法。量化民族志方法跨越了上述非此即彼的鸿沟,是大数据时代定性研究工作者理解数据科学、统计学家理解人文科学,以及所有试图理解学习、文化和人类行为的研究者可利用的有效研究工具,可以帮助我们更好地理解这个数据日益丰富的世界。
《量化民族志:一种面向大数据的研究方法》将把量化民族志中的关键概念、工具和方法梳理成三个部分。在谈论如何在研究中整合定性和定量方法之前,我们先需要回顾一下两种方法各自的基本研究逻辑。如果不能理解两种方法本身,就无法建立沟通这两种研究方法的共同话语体系。首部分包括第2、第3和第4章,分别介绍定性研究方法和定量研究方法的基础。第2章介绍民族志的基本观点:民族志学家思考哪些研究问题,他们会利用哪些研究数据,他们关注的焦点是什么。第2章主要讨论研究中存在的偏见和主体性的问题,以及民族志学家在研究中是如何应对这两个问题所带来的挑战的。第3章探讨民族志研究的机制:民族志学家做什么,他们开展的研究实践背后的逻辑。第3章涉及的主题包括深描和编码,即民族志学家是如何发展、建立及论证关于他们所研究的群体在做什么和为什么这么做的命题的。第4章介绍一般化的概念,即研究者是如何利用统计方法得出不同群体之间相似性和差异度的结论。第4章还讨论抽样和统计意义上显著这两个概念背后的逻辑。首部分的目的是梳理定性和定量这两种截然不同的研究方法的知识基础,以便在量化民族志中着手建立两者之间的联系。
第二部分包括第5、第6和第7章,介绍了将定量和定性研究相结合的关键理论和研究实践。第5章是关于如何组织定性数据,使其能被用于定量分析。一个实践层面的问题是:如何将数据整理成文档?与之相关但是更重要的问题是,能够用于组织数据的人类交互过程的内在结构模式是什么?第6和第7章探讨建构定量模型的基本量化研究过程,并展示了如何将定量方法应用于通过第5章描述的方法所组织的数据。这两章同样也包括实践层面的问题,即定量模型是由什么构成的,以及方法论层面的问题。其中第6章是关于量化建模过程背后的逻辑;第7章是介绍如何将这一逻辑应用到民族志的情境中。
《量化民族志:一种面向大数据的研究方法》的最后一部分探讨将统计模型用于理解民族志数据的意义,即试图构建人类理解世界的模型。所讨论的内容一方面是这种特殊的统计工具使用方式背后的理论启示,另一方面介绍实际操作的具体细节。第8章关注研究者如何识别人类言谈举止背后的含义,并涉及自动编码和信度的问题。第9章是关于意义建构的结构,以及如何从人们表达对世界的理解方式中构造模型。第10章将所有这些内容联系起来,将量化民族志与分析大数据的其他方法一起讨论。