社会学研究
    主页 > 期刊导读 >

以经济社会学视角审视大数据及其应用

一、引言

2015年9月,国务院印发《促进大数据发展行动纲要》,系统部署大数据发展工作。其中提到了大数据的重要性,且明确了对其的发展和进一步推广应用。

大数据是一种信息资产,通常用于指代大量的结构化、非结构化和半结构化数据,其中非结构化数据日益占据主体且拥有较高的增长率。作为一种数据集合,它不是由常规软件或技术手段而进行的定向捕捉。大数据技术其根本目的不是掌握多么庞大的数据库,而是可以对这些数据信息进行专业化的处理和挖掘,这个处理和加工的过程赋予了“大数据”含金量,使其能够为一些决策提供思路和借鉴意义。

相较于传统数据,大数据与传统数据的区别主要涉及以下方面:第一,传统数据多采用随机抽样的方式,而大数据所捕捉的是全部数据。很多时候,我们的一些研究受限于数据的局限性,但是大数据无疑可以为此类研究提供更好的路径。第二,传统数据通常是针对具体特定的方向进行数据收集,而大数据进行数据采集的时候只有大致的方向。

大数据对精确性的要求相对较低,但其全面性更强,便于我们从更宏观的层面、更多元的角度来看待和理解问题。第三,传统研究更力图于发现因果关系,而大数据致力于发现的是相关关系。因果关系的焦点在于解释“为什么”,而相关关系重点在于描绘“是什么”。

大数据在当今社会的应用已经非常广泛,各行各业都有涉及。相信通过大数据技术的日益发展、逐渐完善,它可以为社会发展带来更多的增益作用。

二、经济社会学视角下的大数据

(一)大数据与社会学研究

社会学研究方法从宏观上可以分为质性研究和量化研究。学者谢宇(2012)提出,定量研究方法和定性研究方法都存在着一定的局限性。而大数据时代的到来可以为我们在一定程度上解决此类问题。

首先,数据的挖掘和处理可以和理论相互形塑。一方面,它可以验证现有理论发展出来的假设和创新理论(罗家德等,2018)。梅西等人(2010)在衡量社区社会资本的研究中就运用到了该地区内使用电话的通话频率这一变量,验证了有关社区资本和社区经济发展的假设。当现有的理论并不能解释大数据呈现出的结果时,也鼓励我们发展理论、创新理论。另一方面,根据理论也可以指导研究者更好的进行数据挖掘和处理。邓巴(2015)在坚持人脉根据亲疏会分为不同圈层的基础上,对社交网络的资料进行处理和分析,也由此得出了分离不同亲疏圈层的数据计算方法。

其次,在从事量化研究的时候,如何采集数据、数据的规模、数据的质量、如何处理数据是研究中至关重要的部分,处理不好会使社会学研究被人诟病,大数据在这些方面都具有一定的优势。

第一,传统的数据集规模较小,是对样本的研究,得出的结论也要通过统计学检验才能够推论到整体。而大数据在某种程度上意味着没有进行抽样的整体研究,从互联网和社交网站中就可以得到大量的信息(古德、梅西,2011;麦凯尔维等,2014)。古德和梅西(2011)的研究对社交网站的5亿多条信息进行了分析处理,得出了人们的心情变化趋势。

第二,大数据收集到的基本是自然数据,数据的采集方式更加隐秘且多来自于生活,受到的人为干扰相对较小,因此可信度更高。而在未来的研究,利用大数据的优势可以从商业行为等方面挖掘出更多的信息,使数据更加完整。

第三,在传统研究中,很多数据的采集都是为了某一具体研究项目而服务,一方面这样的数据专业性会更强,但是另一方面其应用于其他研究的可能性微乎其微,如果每一个研究都需要从头采集数据,那对时间、人力、金钱都是巨大的考验。但大数据采集的是海量的自然信息,由于其信息的完整性和多元性,可以服务于各个研究领域的多种研究。

最后,社会学互联网实验成为了一种新的研究方法。社会学互联网实验区别于传统的研究方法,是指在一种理想化的自然条件下进行社会科学的研究。对于传统的研究方法来说,在实验过程中很难实现对被试的零干扰,而社会学互联网实验可以帮助社会学突破局限性,摆脱时间和空间的限制,从而更大范围的研究人类行为与社会现象,有助于充分发挥社会学的想象力(罗玮、罗教讲,2015)。

(二)大数据与社会网络

社会网络理论及其研究方法的发展自20世纪90年代以来是非常迅速的。个体行为与社会网络结构之间具有高强度的互动且在互动中相互形塑,社会系统也是在此基础上发展。在网络理论的视角下,每个在社会中的个体,在表达态度和做出行为的时候不可避免地会受到该社会中文化、习惯等的影响。如果要分析某一企业或者某一产业,仅聚焦于其中的行动者个体是远远不够的,要着眼于企业间网络、产业网络结构,才能解释其景气或者衰败的原因,才能把握其发展方向在竞争中处于不败之地。