山东LHF娱乐文化传媒有限公司

0531-85927238

全国咨询热线



山东LHF娱乐文化传媒有限公司

联系人:刘先生

电话:0531-85927238

传真:0531-85748658 

地址:济南市历下区文化东路丰产支路16号中建大厦14层 


产业分析

网络过程与动态演化:基于计算研究的分析

更新时间:2019-12-04 07:52 点击数:


  互联网和大数据如何影响和改变着研究?本文认为,研究历史上存在两条“河流”,一条是以调查测验为代表、聚焦特定单一时间点上意见分布的“大众意见”式的研究,另一条则是强调分析发展过程与动态演化的“社会过程”式的研究。囿于理论、方法和数据的局限,研究的传统偏重前者而忽视后者。大数据和计算社会科学的出现为社会过程式研究的发展带来了新的契机,在数据、模型和方法三方面准备了资源,并以具体研究为例,讨论计算研究取向如何促进网络过程与动态演化研究的开展。

  周葆华,复旦大学 新闻学院,上海 200433 周葆华(1979- ),男,江苏南通人,复旦大学教授,武汉大学发展研究中心研究员,主要从事新,学、大数据与智能研究。

  国家社会科学基金项目“社会化对转型期中国社会的影响研究”(13CXW021);教育部重点研究重大项目“移动互联网使用与城市的生活方式”(15JJD860001);上海市科委项目“基于类脑智能的舆情系统研究”(17JC1420200);国家自然科学基金项目“社会集群行为涌现与演化的机制分析及预测”(71731004)

  大数据正在影响和改写着研究。本文认为,研究不仅需要基于特定时间点分析集群层面大众意见的分布,更重要的是深入理解发生和演化的过程。那么,研究在多大程度上被视为社会过程研究?传统的研究如何处理作为社会过程的分析面向?在大数据时代,网络过程和动态演化的研究有怎样的新契机,又有哪些可能的进展?本文将首先回溯这些理论问题,并基于学国际英文核心期刊上的研究案例,探讨计算研究取向如何推进的过程研究。

  何谓?首先是关于意见的表达,但考察的是意见表达的什么维度、什么重点。在研究的历史传统与现实实践中,存在两条不同的“河流”。其中一条可以称之为“大众意见”(mass opinion)式的研究,所关注的是在特定时间点(one-shot)上的意见分布,即基于个体各自的意见表达(通过调查等方法)获得集合层面(aggregate-level)的结果,呈现为针对某个议题或人物的意见分布百分比(如多少人赞成某种观点或支持某个人物),而并不关心这些意见及其分布是基于何种过程所生成与演变。大众意见式的研究自20世纪以来获得长足发展,专注这一取向的学者们通过不断发展和优化抽样调查方法与统计技术,努力增进大众意见调查的精度。以美国大学调查中心(NORC)、皮尤基金会(PEW)、盖洛普(Gallup)、零点等著名调查机构为代表,积累了大量关于调查的,成为研究在认知中的重要形象。就中国研究领域而言,除了偶尔回溯1930年代早期零星的调查外,常常会重点回顾中国之初到1980年代所进行的调查(如复旦大学新闻系1981年所进行的“集团”审判调查、1988年中国人民大学研究所进行的“首都知名人士龙年展望调查”等),并以之作为新时期研究的滥觞。这都表明以抽样调查为主要方法、以描述性百分比为主要形态、聚焦单一时间点大众意见分布的研究,在研究中占有重要地位。之所以重要,是因为这些结果数据成为表征、服务决策、提供性的重要来源,如选举前的民调。精确新闻或数据新闻报道中涉及的大多数内容,也主要停留于大众意见式的研究,因此得以发挥更大的社会影响力。也正是从这一视角出发,对的定义中就会包含对于“多数人意见”、“相对一致的意见”或“共识”的要求,强调是多数人相对一致的意见,甚至可以具体到比例,比如超过1/3或1/4[1]。

  研究的另一条“河流”则是将视为一种动态的社会过程(social process)(e.g.,Allport,1937;Childs,1939;Davison,1958;Noelle-Neumann,1974;Glynn,2005)[2]。这一径所关心的不仅是在某个特定时间点的分布,而且聚焦生成与演变的过程,即因何而生、何以变化,直至最终的(议题结束或被取代)或稳定(意见保持均衡不变状态)。如果说前者是静态的观,后者则是动态的观。与“大众意见”式的研究相比,“社会过程”式的研究有三个鲜明特点:

  第一,更为注重表达主体之间的联系、互动与影响。大众意见式的研究假设个体的意见表达形成并存在,因此所采用的研究方式是针对每个个体分别询问其意见或态度,并在此基础上进行叠加(计算百分比)或平均(计算均值),在这种研究方式中,表达意见的个体被区分、割裂对待,并不考察他们之间的联系、互动与讨论,这也是“大众(mass)意见”区别于“(public)意见”的重要内涵[3]。然而,正如早在20世纪初,学派社会心理学家们(如库利和米德)就强调的,个人的意见不可能是在真空状态中生成,首属群体(个体经常面对面接触的亲密群体)在影响个体认知与态度形成方面具有远超一般大众的优势;其后,学经典的“二级”(two-step flow)理论也指出,个人的信息获取除了(在当时是大众)外,很重要的是人际渠道,在劝服效果方面,人际渠道甚至具有比大众更强的影响(Katz & Lazarsfeld,1955)[4]。因此,社会过程式的研究高度关注“人”的角色,突出形成过程中人际影响的作用(包括首属群体、参考群体、他人意见等),并带有规范性的目标——意见表达的主体是围绕公共议题展开讨论的相互联系的“”,而非仅仅被割裂调查意见的分散“大众”。

  第二,社会过程式的研究强调影响的力量与因素。既然是社会过程,发生的社会条件与情境就格外重要,因此社会过程式的研究高度关注并着重考察形成过程中的各种力量与影响因素,不仅包含社会心理学因素,而且将视为运作过程的一部分,关注形成过程中的操控性力量(如精英、机构、新闻等)。如果说大众意见式的研究着重的是调查方法和统计技术,社会过程式的研究则更多与社会学、心理学、学理论发生关联,更能体现出作为一个复杂的社会过程所蕴含的多层次和跨学科特征。

  第三,社会过程式的研究高度关注生成与演变的动力学机制。如果说大众意见主要回答“是什么”(what)的问题,社会过程式的研究则重在回答“为什么”(why)和“怎么样”(how)的问题。它高度强调的特征(communicative nature),即并非分散个体意见的集合,而是相互交流互动的产物,并视之为与其他形态的群体行为(如聚众行为/crowd behavior)的重要区别。因此,与大众意见式的研究关心分布结果的倾向性(“多数人意见”)不同,社会过程式的研究更为关心意见生成、改变与演化的具体过程及作用机制。无论是早期的首属群体、参考群体概念,还是后来更为复杂的群体动力学模型、跨层次的演化模型(如“沉默的螺旋”)、意见表达同质性(homophily)过程中的选择机制(self-selection)与影响机制(social influence)等,都凸显了这一点。

  学者Glynn(2005)[5]曾回顾了过程研究的主要模式,按其时间顺序包括:(1)Kelman(1939)[6]的社会影响与行为改变模型,将定义为个体受到社会影响并改度的过程,并指出三种具体的影响机制即“遵从”(compliance)、“认同”(identification)和“内化”(internalization);(2)Foote和Hart(1953)[7]的发展模型,指出是一个分阶段的时间发展过程,并最终导向知情的(informed)决策和行动;(3)Davison(1958)[8]的与意见模型,强调过程首先依赖特定议题通过和扩散赢得注意力(只有少数议题能获得关注,而其他则在早期就烟消云散,无法进入视野),以及群体意见和意见对意见形成具有重要影响,他还较早论述了个人在意见形成过程中受到他人意见的影响;(4)Noelle-Neumann(1974)[9]的社会系统过程模型(即沉默的螺旋理论),是一个包含个体表达微观心理机制(如害怕孤立感、准统计官能、对他人意见的)到宏观社会结果(形成意见偏向与社会控制)的螺旋式社会系统过程;(5)Price和Robert(1987)[10]的与互惠(reciprocal)关系过程模型,明确将定义为通过所展开的社会组织过程,强调要超越单一(个体)层面单一时点的观,发展基于个体、群体和社会多层互惠关系的理论,其中包含大量复杂的个人、人际和机构互动;(6)Crespi(1997)[11]的度(multidimensional)过程模型,它基于Davison(1958)的与意见模型,但增加了对其中所包含的心理、社会和力量的强调。Glynn(2005)通过历史回顾强调,在大众意见式的研究获得长足发展的同时,社会过程式的研究值得学者们更多关注。

  研究的两条“河流”一静一动,静态彰显,而动态不足,如果回溯学、学的理论,放在过程的框架中则大体有如下进展:

  第一,议题的生成与演变。由于是关于特定议题的公开的意见表达过程,议题注意力及其动态演变因此是过程的重要基础。正如Glynn(2005)所说,过程的起点是议题的生成与浮现。在学视域中,媒介效果的主要理论关注到议题生成与演变的过程。例如,麦考姆斯和肖(McCombs & Shaw,1972)[12]所系统阐明和检验的议程设置理论了议程受议程影响的重要机制;祝建华(Zhu,1992)[13]的零和游戏(zero-sum)理论重点分析议题之间的相互竞争动态过程,指出在传统有限空间和注意力的有限范围内,不同议题展开竞争,以赢得和的关注;罗杰斯(Rogers,1995)[14]对“创新扩散”理论的系统总结提示关注议题和观点在社会群体中的扩散过程;关于新闻扩散的“J-曲线”(J-Curve)研究(Greenberg,1964;Greenberg & Parker,1965)[15]则发现不同类型的议题在扩散范围和渠道上存在差异,了事件重要程度、扩散总体比例与人际渠道重要性之间的关联性。

  第二,态度与表达强度的演变。首先,如果大众意见式的调查研究,可以超越单一时间点,展开针对同一问题的历时性追踪调查(如盖洛普所长期进行的“当前所面临的最重要问题”/MIP调查),随着数据的积累,进行趋势分析(trend analysis),则可以在总体层面上观测对某个共同议题的注意力和态度的变化,从而理解社会的变迁,特别是建立与时代背景、关键事件之间的关联[16];其次,关注意见表达强度的变化,如“极化”(polarization)概念既可以在静态意义上强调强度两端对立的状态,更关注意见的分布是否随着时间变化越来越呈现两极对立状态的演化过程(DiMaggio,Evans,& Bryson,1996)[17];再如“沉默的螺旋”理论则关注随着个体和局部表达的变化,总体层面的社会是否偏向单一方面的意见表达而另一方则日趋沉默的过程。

  第三,演化的影响机制和因素。过程研究不仅描述议题、意见和态度的演变,更重要的需要解释其背后的原因和机制。以态度改变与劝服研究领域为代表,研究者们分析了影响态度及其改变的诸多因素(Albarracin & Shavitt,2018)[18],如个人层面因素(包括自身的价值观、目标、生命阶段、态度体系之间的相互影响等)、社会层面因素(如针对者与受众关系所发现的休眠效应/sleeper effect,即讯息在一段时间后与信源可信度相分离从而产生劝服效果的现象等)以及社会与文化因素(包括代际差异、时代变迁、文化差异等)。在意见表达机制方面,非常关注影响态度和意见表达中的因素,特别是大众和人际渠道之间的相互关系,它们在影响个体意见表达过程中可能相互促进、整合、协同,也可能分化、抵制、冲突,这在诸多理论的影响机制研究中都有体现(如议程设置、框架效果、沉默的螺旋理论)。相对于更为静态的因素(如常规的人口统计学、人格特质等变量),社会过程式的研究关注更具动态性的因素,如群体互动(群体内与群体播、同质性与异质互)、对意见气候的、议题(issue public)及其流动等,这些变量可因议题、时间和具体情境的变化而产生更大的变异。

  尽管社会过程式的研究强调关注演变的动态性,关注议题和态度的生成、演变以及其中的影响因素与机制,但正如Price(1992)[19]和Glynn(2005)等学者所指出的,整体上过程和动态演化的研究远未得到充分的重视。就现有研究来看,社会过程式的研究不但总量不足(相对于大众意见式的调查),还存在三个明显局限:

  第一,除个别理论外,现有学视域中的学理论只关注和涉及过程中的局部环节和因素,较少提出包含具体机制的过程性模型。例如议程设置理论只涉及媒介议程对议程排序的影响(媒介议程→议程),架构效果仅提示媒介框架对受众框架的影响(媒介对特定议题的报道框架→对特定议题的思考框架),却不包含发生和演变的其他环节。像“沉默的螺旋”这样包含较长链条、跨越不同层次的过程理论或理论并不多见。

  第二,理论与经验研究的断裂。尽管有前述Glynn(2005)所回溯的六个主要的过程模型,但其主要集中在理论阐释或层次,并未落实为具体可操作的经验模型。由于更多体现为框架或原则,反映过程的动力机制和边界条件等都不甚清晰(如“创新扩散”并未给出意见扩散曲线的刻画模型或速率计算方法,“沉默的螺旋”也未交代意见气候影响个体意见表达的门槛值等),制约了其可检验性。

  第三,更具体地,现有研究受制于明显的方法缺陷:首先,由于传统研究主要采用调查方法,成本高昂,因此主要局限于单一时间点实施的横截面(cross-sectional)研究,难以做到可持续、长时段的研究,即便有研究,也多是针对同一总体所抽取的不同样本,而非基于同一样本的面板(panel)追踪调查,因此,大众意见式的研究在层面更容易操作,而社会过程式的研究因需要对表达主体、互动过程及其结果进行长期观察与追踪,数据的搜集殊为困难;其次,传统研究在方法和操作上将个体作为割裂的对象加以研究,虽然在考察个人意见表达时可以检验他人意见的影响,但在方法层面只能体现为个体报告(self-report)的中心网(ego-network)数据,而无法真正观察个体之间的联系与互动过程,因此网络思维与网络研究方法不能充分运用和展开;再次,传统研究局限于单一层次(或个体、或总体),但过程涵盖和跨越微观、中观、宏观的不同层面——如个体在微观层面的意见气候与表达门槛会影响其表达行为的发生,随着个体表达,会改变其他个体所的气候,进而逐步影响群体乃至整体层面的演变,这样的研究不但需要长时段的观察,而且需要跨层次的研究。因此,传统研究单一时点、单一个体以及单一层次的方法局限严重制约了过程研究在操作层面的有效开展。

  互联网的兴起,特别是社会化(Web2.0)、智能化(Web3.0)的勃兴,不但深刻改变了生态,也影响着生成和演变的动态过程。表达的主体更多元、空间更广阔(形成网络表达的新空间)、过程更可见(网络生成和发展的过程可以被观察①)、机制更复杂(如人际影响超越个体面对面接触的狭窄范围)。可以说,研究、特别是网络(online public opinion)研究,也进入了大数据时代。与传统研究依赖问卷调查、小样本实验、焦点小组等方法不同,大数据时代在数据、模型和方法三方面都为迈向更关注过程与动态演化的研究提供了新的契机。

  “巧妇难为无米之炊”,传统社会过程式的研究开展不足,很大程度上受制于缺少过程性动态数据。大数据时代,人类的表达在互联网上留下了大量的“自然”数据,即关于态度、意见和情绪表达的数字足迹(digital footprints),相对于传统研究所采用的问卷调查法,大数据不依赖标准化问卷的询问和被访者的报告(self-report),而是根据意见表达主体日常的表达行为记录。不仅如此,网络大数据还有三大显著优势:首先,“大数据”之所以“大”,除了因表达主体规模巨大,很重要的缘于其时间上相对于传统数据形态的打破,与传统横截面的数据采集方式相对,以在线数据为代表的网络大数据依托个体在新平台上“自然”的表达行为,除为删除,将以时间线的方式持续记录并保存下来,因此较为容易地获得原本很难获取的长时段的数据(longitudinal data),并且是弥足珍贵的个体层面面板数据(panel data);其次,大数据的核心特点在于其是网络形态的数据,而非割裂的个体数据,因此允许研究者观测表达主体之间的互动“网”,“网”(状)数据与“长”(时)数据相结合,则允许研究者观察用户互动与相互影响随着时间演变的状态及其结果,这是过程与动态演化研究所要求的数据形态;再次,跨层次的数据,无论是基于地域、群体归属还是基于时间维度,网络大数据通常都是跨层次的嵌套数据,这就为我们分析微观、中观和宏观层面的交互演变机制提供了新的契机。概言之,大数据对研究而言,固然对大众意见式的研究亦有意义(如可获得至少单一网络平台上意见表达主体的“全数据”),但最令人期待的是对社会过程式的研究提供了原本可望而不可即的跨时间、跨层次、网络化数据。

  大数据时代的社会科学正在剧烈转型,特别是计算社会科学(computational social science)的兴起,即运用大数据、云计算、机器学习等计算技术来研究社会科学问题的新思想和新方法[20],拓宽了学视域下的研究的理论资源与视野。传统社会科学取向的研究主要在学及其相近的社会科学理论层面上发展其过程研究传统,但计算社会科学则将物理学、计算机等学科对过程的研究模型带入,其中典型的是有关意见动力学(opinion dynamics,或称观点/观念动力学)的研究。根据王龙等学者的介绍[21],意见动力学是控制理论、物理学、生物学和社会科学的交叉研究领域,关心社会网络中观点的产生、扩散和聚合过程,分析不同个体意见的局部相互作用如何在宏观层面上产生复杂的涌现现象(emergence),这正是社会过程式的研究所关注的内容。意见动力学的模型可以分为宏观和微观模型,其中,宏观模型主要借助统计物理(statistical physics)方法对社会网络进行建模,应用概率统计知识分析观点的分布如何演化,如Ising模型、选举模型(voter model)、Galam模型等;微观模型则从社会个体的角度直接描述个体观点如何演化,如Degroot模型、Friedkin-Johnsen(F-J)模型、Sznajd模型、Hegselmann-Krause(HK)模型、Deffuant模型等。这些模型分别对个体意见的表达条件、状态差异(如对自身初始意见的固执程度)、交互方式(如交往范围、信任边界)、决策过程(如、博弈学习)、时变情况等提出假设,进而观察因此演变的过程及结果。

  一方面,计算社会科学、计算学中所广泛使用的主题模型、语义网络、情感挖掘等文本分析方法、社会网络分析方法等可以与时间序列分析相结合,从而动态地观测议题分布、态度和情感以及讨论网络的演变等过程问题;另一方面,计算研究中也开始借助多主体建模(Agent-based Modeling,ABM)的方法来研究过程和动态演化,尤其是考察其中的个体与局部行为如何引发整体层面的变化。

  多主体建模是20世纪90年代兴起的一种新的建模仿真范式。ABM中的“模型”指的是为了特定的研究议题而由研究者设定好参数的电脑程序,它所“模拟”的是通过程序来呈现和记录多个行为主体(agents)按照不同的行为规律而采取行动的过程及其结果[22]。ABM方法基于的是经济学、物理学、生物学和生态学中所强调的“复杂适应系统”(complex adaptive system,CAS)概念[23],致力于研究复杂现象(complexity),即行动者种类多、数量大且同步行动、长时间互动的现象。ABM方法的基本逻辑是:对现实进行模拟设定(an artificial social setting),在这个设定中包含各类主体(即模拟真实社会系统的行动单元),它们被赋予简单的行为规则(如根据邻居分布的阈值决定是否搬家或是否表达意见),随着时间变化进行互动,从而得以观察其经过一段时间的互动之后形成的样貌或形态(patterns)(如种族隔离或意见分布的结果)。与传统的量化、质化分析不同,ABM方法强调不仅要发现事物之间的相关性或性(causal relationships or causal references),还要能够呈现这些复杂的形成过程(即机制,causal mechanisms)。因此它特别适用于:(1)当研究者假定某个简单机制导致了某个复杂现象的发生,希望检查这个微观-宏观的连接是否存在;(2)当研究者观察到有趣的形态(patterns)在模拟过程中浮现;(3)当研究者要某个理论是否对某现象的发生有解释能力。由此可见,多主体建模是适合过程和动态演化研究的一种计算方法,它可以通过模拟方法观测多表达主体在设定条件下的互动过程以及微观层面上的互动如何逐步导致了宏观层面上的现象的发生(如沉默的螺旋)。

  通过在国际社会科学引用指数数据库(SSCI)学类期刊中检索和浏览(所使用的关键词为opinion,attitude,attention和sentiment,过程关键词为dynamics和evolution,两类关键词之间为并列关系),本文搜集2010年至今以网络为主题的计算研究案例,通过对文本的解读,将之归纳为三个方面:

  传统上长时段追踪式的研究,如盖洛普的MIP调查数据刻度以月为单位,已属相当不易,而由于大数据记录格式是自然式地采集,可以更为容易地获取不同时间点,并且时间刻度可以精确到天、甚至更小的时间单位(如分钟),从而能精确刻画、意见或情绪演化的过程,其中较具代表性的过程式研究是有关议程设置和框架效果的时间演化分析。例如,Russell Neuman,Guggenheim,Mo Jang,& Bae(2014)[24]指出,在线追踪数据为研究演化特别是注意力的演化提供了契机。它所关心的研究问题是:在传统和社交之间,谁设置了谁的议程、谁设置了谁的框架?通过抓取美国2012全年社交(包括推特、博客和论坛)和传统(和电视)对29个公共议题报道或讨论的内容数据,该研究以天为单位,描述并可视化展示这些议题在一年之中随着时间演化的规律,包括周内、周间、月度和随着重要事件发生而变化的特征,从而了解注意力如何在议题之间发生。不仅如此,大数据还可以分析传统和社交在报道中的议程先后顺序,从而发现其设置关系。运用时间序列分析中的格兰杰分析(granger analysis),该研究发现议题和框架在传统和社交之间并非是传统研究所预设的单向设置关系,而是呈现更复杂的形态——在所有29个议题中,仅约一半发现了单向的议程设置关系(其中10个从社交流向传统,4个从传统流向社交),另外1/4则发现两者之间相互设置、相互影响,在框架设置分析中也发现了类似的动态交替影响,表明注意力和在社交上的表达注意力两者之间的关系因议题而异。

  不同于经典议程设置(agenda setting)理论所强调的议程从大众媒介向的传递,Gruszczynski & Wagner(2017)[25]使用议程采纳(agenda uptake)概念来分析网络下主流、网络小众(niche media)以及议题之间的动态关系与流动过程。该研究认为随着大数据时代的到来,可采用新的测量方式——谷歌搜索的行为记录(Google Trends)来代表受众议程,其数据可以细化到每天层面。通过采集三类议题(大众常态议题、小众兴趣议题、短期突发事件)在三类主体(主流、小众、搜索)上的数据,可以观察议题注意力随着时间演变的情况。通过向量自回归(vector autoregression)和格兰杰分析,该研究发现:对小众兴趣议题而言,网络和受众搜索可以影响主流的报道;对大众常态议题而言,主流和网络可以影响受众搜索量,受众搜索也可以影响主流和网络的报道量;对短期突发事件而言,受众搜索可以影响主流和网络的报道,反之则不成立,这表明三类之间的议程流动关系因议题特征而异。

  上述有关网络或注意力演化的分析主要是在集合层面(aggregate-level)呈现议题或框架随时间变化的过程,社会过程式的研究在大数据时代可以更进一步,分析议题、意见或观点演化背后的在线讨论(互动)的动态演化,它的分析不仅在集合意见层面,还可以深入个体、互动对(dyadic)和网络层面。对在线讨论的文本挖掘与社会网络分析(特别是纵贯性网络分析)的结合可以在这个方面发挥重要作用。

  虽然分析态度与社会互动之间的关系及其演变在大数据时代之前已有开展,特别是回答“社会影响机制”(态度变化是社会互动的结果)与“社会选择机制”(态度相似的个体彼此连接)谁占上风的问题,但以往的研究只基于小样本和少数的时间点[26]。基于网络的大数据则为运用非报告的实际行为数据检验提供了契机。梁海(Liang,2014)的研究[27]致力于分析网络讨论和共同基础(common ground)之间的共同演化(coevolution)关系,即关心网络公共讨论是否能促进的相互理解(mutual understanding)。所谓共同基础,指的是个体在思考议题以及组织他们观念、情感和方面的相似性,也就是说在公共讨论中,即便无法获得共识/一见(consensus),也至少有共同讨论的话题基础——包括共享的知识(事实)以及知识结构(事实的关系)。传统调查研究中只能根据研究者的事先预设主观地调查对议题的讨论及其知识结构,网络大数据分析则允许观察自下而上的知识及其结构的浮现。基于文本挖掘方法,该研究采用语义相似性(semantic similarity,操作化为文本余弦相似度)来测量讨论者之间共享知识(事实)的程度,用基于词共现关系的诠释框架(interpretive framework)测量知识结构的相似程度,进而通过纵贯网络分析(longitudinal network analysis)来分析网络凝聚力(密度、集聚系数、模块度)随时间演化的情况,以及个体层面的讨论网络与内容网络、语义网络之间的影响关系——更符合社会影响机制(越讨论共同基础越多)抑或社会选择机制(共同基础的人之间更多讨论)。结果发现:在选举期的11个月之间,网络论坛上讨论所运用的概念及其关系越来越相似(即共同基础提高);在讨论的早期阶段,相互促进内容相似度的提高(讨论者使用的语言越来越相似)(后期则未必),而内容相似性对讨论网络的影响则不显著;在讨论网络与语义网络的关系上,两者之间存在相互的正向影响,网络促进语义网络共性的提高,语义网络的相似也会推动讨论的发生。该研究因此不但对在线讨论内容和结构相似性的动态演化进行了描述,而且寻求了解释讨论内容和结构相似性的影响因素。

  Medaglia & Yang(2017)的研究[28]同样聚焦网络讨论的动态性。他们以中国天涯论坛BBS上的四个公共事件讨论为例,分析在线讨论网络中同质(similar-minded)和异质(different-minded)互动随时间动态演化的情况。该研究强调,协商(public deliberation)本身是一个不断发展与变化的动态过程,其中接触和倾听不同意见是健康的协商的重要内涵和基础,而讨论者之间的网络同质性(network homophily)则可能会加剧情感极化。通过机器辅助的情感分析(划分为正面、中性、负面),研究发现,四个案例中的三个讨论都集中在同质互动(即正-正、负-负互动),但其中有的案例随着事件的发展演化同质与异质互动的程度会交错变化(如在特定时间异质观点之间的交锋会上升);当观点差异的双方规模更接近时,跨观点的异质互动更容易发生;同质互动随时间提高的情况在正面观点的群体中更加显著。

  ABM模型是一个跨越微观(个体)、中观(群体和网络)、宏观(社会)的多层次(multi-level)社会过程。复杂的动力学机制研究,涉及到过程中的跨层次动力关系,特别是个体层面局部的行为如何影响整体层面的变化。这方面的代表就是沉默的螺旋。作为一个典型的过程性理论,沉默的螺旋包含个体外部气候、形成分布印象及对于未来意见的估计,在此基础上形成其个人意见表达,进而影响相邻个体的意见和表达,并逐步影响整体层面的发展。虽然该理论勾画了从个体到整体的动态过程,但传统研究只是进行局部性的研究,如在个体层面上检验意见气候对意见表达的影响,而无法模拟整个过程。随着ABM模拟等计算方法的兴起,为理解沉默的螺旋这一跨层次模型的动力机制提供了新的契机。

  Sohn & Geidner(2015)的研究[29]指出,传统的沉默螺旋研究强调大众媒介作为提供个体意见气候信息来源的影响,但这种大众媒介偏向存在问题,因为人们实际在很大程度上通过身边的参考群体来意见和决定是否表达。更值得重视的是,随着网络和社交的兴起,人们的人际交流网络超越了狭隘的地理和社会接近性,而得以了解到大量超越他们身边群体的他者意见。在早期研究中,Noelle-Neumann(1993)[30]曾指出人们囿于其观察视野,无法准确全局层面的意见分布。如果人的网络扩大,特别是包含更多可以带来新信息和意见的弱连接,则有可能更加多元的意见。于更多元的意见反过来则可能使个体的意见更接近于整体的真实的意见分布,即他们对自己是否处于少数意见的估计会更准确。如果拥有大人际网络的个体占据多数,他们对自身处于少数意见的估计因而更稳定,会促进沉默螺旋的形成;反之,如果更多的个体主要通过有限邻居(immediate neighbors)来意见气候,其对意见气候的整体上会更分散、碎片,也不易准确是否处于少数群体,从而会沉默螺旋的形成。

  正是基于上述基本思想,该研究进行了ABM模型设定:在一个40*40的NetLogo空间内分布1000个行为主体(agents),每个主体有自己的态度值(包括强度和信心度)和表达意见的门槛阈值(指个体表达意见所需要的公共支持的最低限度),每个个体的初始态度和阈值随机设定,在第一个时间点的时候1/4的个体表达态度而其余人保持沉默,然后每个时间点每个个体随机选择方向移动一步,设定一个监测邻居意见网络的半径(按照指数分布),并根据所监测的意见气候和个体表达阈值规则运行,每次模拟重复100次。模拟结果发现:沉默的螺旋出现的情况随着人际网络规模发生变化,当平均网络规模最小时,即多数人在此种情况下只能到很小范围的意见气候,这时候整体层面的多数意见与少数意见之差最小而且保持稳定,沉默的螺旋未形成;当平均网络规模达到4,沉默的螺旋(多数意见与少数意见之差)在早期就很明显并且随着时间推移逐步上升。

  因此,沉默螺旋的发生与否与个体意见气候的范围有关。当绝大多数个人只能观测到<1%的意见气候时,整体层面的沉默螺旋不会发生;随着人际网络的规模扩大,沉默螺旋发生的可能性增大,但直至扩大到一定程度,才真正有可能发生,也就是说,螺旋的发生并不取决于有少数人特别准确地估计意见气候而另少数人不能,而取决于绝大多数人都位于全局意见气候误差的中间。该研究发现,整体层面的螺旋过程直到平均网络规模=4(即大约15%的主体可以观察到超过整体人群的10%的意见气候)时才得以发生,这样的条件在传统社会下不会发生(很难所有人的10%的意见分布),所以沉默的螺旋在大众媒介出现之前很难在现实中实现。在大众媒介时代,大众媒介是造成沉默螺旋的主要机制。但在社交时代,人们可以不依赖大众媒介,而通过自身不同规模的社交网络意见的分布,同样可造成沉默螺旋的结果。本研究不但模拟了沉默螺旋从个体意见到整体螺旋形成的动态过程,而且其得以发生的边界条件。这是运用计算方法模拟过程理论的典型体现,也再次证明了模拟研究的价值:宏观层面的社会结果不能简单地由个体特征所推断,而是个体特征与互动过程、社会情境、分布规则等高阶现象综合作用的结果。

  在沉默的螺旋理论之外,Song & Boomgaarden(2017)的研究[31]运用ABM模拟方法研究党派媒介选择性接触、人际讨论的同质和异见与态度极化效果之间的关系。该研究基于的是Slater(2007;2015)[32]所提出的媒介使用—效果之间“相互强化的螺旋”理论(mutually reinforcing spiral,RSM),该理论强调媒介接触是个体的、兴趣、或群体认同的产物(选择性接触机制),反过来又强化了个体、兴趣或认同(媒介效果),这一过程呈现反复不断的螺旋化发展。例如在态度极化的语境中,指基于党派身份与预存立场的选择性接触强化了意见的极端化发展(强化了原来的意见立场)。但是,由于经验研究的稀缺(多次的面板研究缺少),这一实际上很少被证明。不仅如此,人们的媒介接触不可能在真空中单独发挥作用,而是与人际讨论交织在一起,人际讨论既可以直接影响人们的态度与意见,也可以调节媒介接触的效果,但在传统研究中,媒介接触与人际讨论的整合研究更为稀缺。

  因此,该研究基于下列规则进行多主体建模:个体的兴趣外在于媒介接触和人际讨论,兴趣强度决定初始意见态度的强度,优先与态度相近邻居展开人际互动,只接受相似媒介信息(选择性接触),从而得以观察态度的改变结果。研究的确验证了媒介使用与效果之间相互强化的螺旋。

  本文通过回溯基本概念与历史发展过程指出:研究不应只有“大众意见”式的一花独放,“社会过程”式的研究应当大力发展和。但在传统上,囿于理论、方法与数据的多重缺陷,社会过程式的研究总体不足、滞后明显。本文认为,大数据与计算研究的兴起,为过程与动态演化研究带来了新的契机,特别在弥补理论与数据之间落差方面具有重要意义。体现在:首先,由于大数据采集自然行为的连续性,极大扩展了数据的刻度,使得原本很难采集的历时性数据得以比较便捷地获取,从而得以在集群层面观察议题、框架、情感的动态演化与发展过程;其次,“长”数据与“网”数据的结合,允许分析在线讨论的形态、特征及其时间演化规律,特别是讨论网络与互动的同质性与异质性,以及社会影响和社会选择机制之间的关系问题;再次,通过ABM模拟仿真方法,得以在观察或实验数据很难获得的条件下,通过设定个体状态和交互规则来观察演变的后果,这方面的典型案例是对沉默螺旋过程及其发生边界条件的。正因为大数据和计算研究突破了单一时点、单一层次、割裂个体的囿限,从而给迈向过程化、跨层次、重互动的过程研究带来了新的想象空间。

  当然,在拥抱大数据和计算取向给过程研究带来机遇的同时,也要注意网络数据本身的局限,如未必是代表性数据,在线网民的代表性、网络平台的代表性、数据生成过程中的和遮蔽等,都提醒我们在推论时要格外小心,谨慎对待分析的外部效度和可推广性。

  本文的分析主要从学视域出发,更多希望起到引子作用,因此并非是一个对计算取向的过程研究的系统完整性阐述。未来研究至少有几方面工作可以深化:第一,本文的分析主要集中于学视域下的过程研究,物理学、计算机等领域计算取向的过程研究同样值得我们重视,并分析不同学科领域在推进共通性学术问题上的相同与差异;第二,本文的分析依然集中于以人为表达主体的前提预设,随着智能技术的兴起,机器人作为场的重要主体,如何与人主体展开互动,进而改变整体层面的分布,将成为新的课题。大数据与计算社会科学范式的兴起,应当而且可以在研究领域激发新的学术想象力。认真发掘和过程理论、探索计算方法、凝炼研究问题、开展跨学科的合作,网络过程与动态演化的研究,正当其时。

  [1]刘建明.当代学[M].西安:陕西人民教育出版社,1990;陈力丹.学——导向研究[M].:中国电视出版社,1999.

  [21]王龙,田野,杜金铭.社会网络上的观念动力学[J].中国科学:信息科学,2018,48(1),3-23.

  [22]刘正山.代理人基模途径的学方根基[J].科学论丛(),2008,36,149-186.



地址:济南市历下区文化东路丰产支路16号中建大厦14层   电话:0531-85927238  传真:0531-85748658

   ICP备案编号:鲁ICP备15040028号-1  网站地图