唐铮 丁振球:数据新闻为什么叫好不叫座

唐铮 丁振球:数据新闻为什么叫好不叫座
2021年01月12日 18:18 新梅帮

来源:新闻记者

作者:唐铮、丁振球

本研究对国内领先的两个数据新闻微信公众号的数据新闻报道进行实证分析后发现,数据新闻微信公众号的社交化传播在技术上难以在移动端流畅转换且交互水平较低;在数据分析和呈现上有较高的阅读门槛,并出现了扩大“数据数字鸿沟”的隐患;在生产逻辑上与传统新闻的人文主义诉求存在冲突。为此,数据新闻报道团队应在技术实现上与移动端社交媒体更加适配,提升交互技术的使用水平,为用户探索新闻故事提供更多的自主性和可能性;在文本表达上展现数据新闻的人文关怀,引发用户产生共情,从而真正实现双向互动的传播效果,实现基于移动端的广泛阅读与传播。

一、研究缘起

对数据新闻概念的清晰界定最早可回溯到2010年,米尔科·劳伦兹(Lorenz)在第一届国际数据新闻圆桌会议上,将数据新闻定义为一种工作流程,即“通过反复抓取、筛选和重组深度挖掘的数据,聚焦专门信息以过滤数据,可视化地呈现数据新闻并合成新闻故事”(方洁,颜冬,2013)。

国内学者将数据新闻界定为一种基于数据的抓取、挖掘、统计和分析(方洁,颜冬,2013),从海量数据中发现新闻线索(刘义昆,2014),发掘出数据背后的关联与模式(郎劲松,杨海,2014),并通过可视化技术呈现新闻故事的新闻报道方式(刘义昆,2014)。它的萌芽从计算机辅助报道(computer-assisted reporting)和精确新闻学(precision journalism)开始,并随着大数据运算的加盟,成为一种新的新闻报道方式(陈力丹,李熠祺,娜佳,2015)。

2007年起,《纽约时报》和《卫报》等国际大型媒体率先开展数据新闻实践,国内的四大门户网站与财新、中央电视台等也紧随其后。十几年来,数据新闻在媒体的广泛应用不仅影响了新闻生产流程,还带来了全新的新闻呈现形式(转引自Tandoc, Oh,20a,2020)。

与此同时,随着移动互联网的发展,用户不断从电脑端向移动端转移,社交传播渠道成为各类型新闻转型发展的新赛道。在新形势驱动下,图文、短视频、直播等形式的新闻已经在移动端社交媒体上探索出与之契合的内容、文体、排版和风格,单篇内容的阅读量或点击量能达到“10万+”甚至几百万的量级。而发轫于PC互联网时代并以可视化呈现作为主要优势的数据新闻,在面对移动端进行转型时效果却不理想,在微信公众平台的单篇阅读量难过“10万+”,在微博平台的单篇转发、点赞和评论量也处于较低水平。

这一状况与数据新闻依靠大屏幕展示海量信息的设计逻辑有关。例如《卫报》的“数据博客”于2010年推出的关于伊拉克战争的数据新闻,用上万个红点在地图中标记出伊拉克战争的伤亡情况,用户可以点击每一个红点,了解它所代表的那个人的详细信息。这样的互动设计在电脑端可以取得令人震撼的视觉效果,但在手机端查看时,密集的红点很难准确打开,无法实现预期设计目的。

此外,对于移动平台的忽视也是原因之一。如2015年3月上线的知名数据新闻栏目澎湃新闻“美数课”,仅2018年一年就在官网上发布了145篇数据新闻,但在2019年12月25日才注册官方微信公众号,并于2020年2月23日才正式注册官方微博账号,使用社交传播渠道的时间比创立数据新闻栏目晚了四年多。而在微信公众平台单篇数据新闻推送阅读量普遍过万的“网易数读”,虽然其微博账号粉丝数量高达47.6万,但单篇原创数据新闻微博的转发、点赞和评论数量却很低,在其2020年7月份发布的15篇原创数据新闻微博中,有14篇微博的转发、点赞和评论数量低于50,这显现出数据新闻在不同平台传播效果上的显著差异。

敏锐的从业者已经意识到国内数据新闻的社交化传播困境。国内最早从事数据新闻报道的数可视创始人黄志敏从事数据新闻工作五年来,发现“操作越复杂,作品获得的回报越小”。他同时发现,H5的作品越来越少了,因为传播不出去。黄志敏将这一变化的原因归结为:用户现在获取内容的主要渠道是微信公众号、今日头条等,这类平台的共同特点是:放文字、图片、动图都好办,做交互做不了(黄志敏,2019)。部分国内学者也开始对该问题进行关注,提出当前我国的数据新闻业产品投放以本媒体为主,对社交平台重视不足,“大多将其视为渠道……没有契合社交平台的媒介属性和传播逻辑”,导致其传播效果不理想(丁园园,张超,2019)。

可见,相较于其他形式的新闻,数据新闻在国内移动端社交平台传播乏力的问题更为突出,制约了国内数据新闻的发展。但目前围绕该问题展开的研究甚少。

目前,数据新闻所面临的数据分析不规范、家长式作风、数据崇拜、人才缺乏、成本高昂、培训滞后等诸多问题已经引起了学界的关注与讨论。但其研究视角仍始终集中在数据新闻生产过程中的不同环节、要素和生产基础,较少涉及生产环节下游的传播问题。

在社交媒体成为首要新闻渠道、用户信息接受习惯发生改变的当下,我国的数据新闻作品与移动端不适配,以及在社交媒体上传播乏力等问题日益凸显,数据新闻在国内社交平台上的生产现状如何?数据新闻社交化传播中的哪些困境导致其在社交媒体上传播乏力?能从哪些可能的方向予以改进?本研究拟通过内容分析和案例分析,分析国内两个数据新闻微信公众号的推送内容,对以上问题进行分析并寻求解决方法。

二、研究设计

(一)研究对象

本研究选择“网易数读”和“财新数据可视化实验室”微信公众号作为本研究的实证研究对象,选择依据如下:

网易是第一批在国内开展数据新闻本土化实践的网络媒体。2012年1月,网易率先成立数据新闻栏目“数读”,并于2015年6月率先登录微信公众号推送数据新闻报道,且保持在每周推送2-3篇文章的频率持续更新,在报道速度、报道数量、数据来源渠道和报道选题上都有不错表现。财新传媒则是国内第一批开展数据新闻实践的专业媒体,是中国内地首家获得“全球数据新闻奖”的媒体,制作水平较高。财新数据可视化实验室也于2015年1月登录微信公众号进行推送,具有一定的用户基础。

其次,本研究通过对比发现,网易“数读”数据新闻栏目和财新“数字说”栏目在微博平台上的用户关注度显著低于微信公众平台。另外,网易“数读”所发布的数据新闻微博内容与微信公众平台一致而且更为分散,财新“数字说”栏目的微博则需要付费阅读,传播覆盖面更为狭窄,因此本研究选择两个微信公众号作为研究对象。

由于“财新数据可视化实验室”曾中途暂停更新发布数据新闻,于2019年6月以后才开始有规律地更新。为保证所选样本能代表其最新发布水平,本研究的取样时间为2019年7月1日至2019年12月31日,网易“数读”样本44个,“财新数据可视化实验室”微信公众号样本量为11个,共计55个。

(二)变量测量与编码

针对数据新闻作品的内容分析研究主要从数据新闻的数据来源、报道选题、数据处理、呈现形式、制作团队、使用技术等方面入手(方洁,高璐,2015;Tandoc, Oh,20t,20

图片来源:新闻记者

三、数据分析

本研究首先利用描述统计分析展现数据新闻微信公众号的内容分析结果。在此基础上,研究者利用负二项回归(negative binomial regression)分析影响数据新闻社交化传播的因素。

(一)数据新闻微信公众号的生产现状描述分析

1.数据来源

从数据来源的渠道来看,两个数据新闻微信公众号数据来源渠道的前三名是政府公布数据、自主调查收集和图书期刊文献,分别占52.7%、38.2%和38.2%;后三名分别是院校及科研机构、媒体和用户提供数据,分别占10.9%、7.3%和3.6%。可见两个数据新闻微信公众号对官方权威数据较为倚重。这与Loosen,Reimer和De Silva-Schmidt(2020)对全球数据新闻奖获奖作品的分析结果相当。另一方面,有38.2%的数据新闻采用了通过传统调查研究方法或爬虫技术自主调查收集的一手数据,且有3.6%的数据新闻采用了用户提供的数据,虽然占比不高,但一定程度上也体现出媒体的独立性和开放数据的运营特点。

从数据来源的个数来看,达到3个及以上的占61.8%,仅采用1个的占20%,可见其在多数据源互相印证的规范性方面基本合格,但仍有一定的完善空间。

从数据来源地域来看,主要是国内,占54.5%;而同时采用国际和国内数据的数据新闻,仅占34.5%。这一方面与数据新闻的报道主题集中于国内有关,另一方面也体现出其数据来源的地域广度和多样性仍有待提高。

2.报道内容

两个数据新闻微信公众号的主要报道范围是“全国”,占83.6%,“国际”范围内的报道仅占16.4%,该情况与其面向国内的受众定位和报道方针有关,这一点和数据来源地域多为国内的情况相互印证。

从报道的新闻议题来看,前三名是环境健康、社会民生和经济发展,分别占32.7%、27.3%和21.8%,其次是体育娱乐和文化科教,分别占16.4%和14.5%,而城市交通和法律犯罪则占比极低,分别为7.3%、3.6%,政治军事议题的报道则为0。这一点与国外数据新闻不同,Loosen, Reimer和De Silva-Schmidt(2020)调查发现2013-2016年全球数据新闻奖提名作品中政治议题占48.2%,其次是社会问题、商业问题、健康和科学,以及教育、体育和文化;Tandoc和Oh(2017)也提出了政治议题排名靠前的发现。

从报道对象的年龄分布来看,“无特定年龄段”和青年(18-34岁),分别占61.8%和29.1%,儿童(0-6岁)的占比最低,仅有1.8%,其他年龄段的报道量没有太大差距。相较而言,两个数据新闻微信公众号对青年群体的关注度稍高一些。

两个数据新闻微信公众号的数据新闻主要是对数据进行多样化的描述性统计,占65.5%,在数据挖掘基础上推断或预测的报道仅占18.2%,有16.4%的数据新闻仅仅进行了单个或多个统计量的计算,可见其数据分析的深度不够,数据背后的内在联系和新闻线索有待进一步挖掘。

3.数据呈现形式

从可视化呈现形式来看,98.2%的数据新闻都采用了静态信息图表的形式,有20%的数据新闻使用动态交互图表,且仅有18.2%的数据新闻使用多感官传递信息形式。可见静态信息图表这种生成技术更为简单的呈现形式运用广泛。交互技术和视频动画的使用能让数据新闻报道更具趣味性,令用户有更强烈的在场感,增强数据新闻与用户之间的相关性和背后联系,但目前两个数据新闻微信公众号对这两种可视化形式的使用程度不高,显示出交互技术在我国社交媒体平台的数据新闻上的使用发展较为缓慢。

从不同种类具体呈现形式的个数来看,采用三个及以上呈现形式的占80%,四个及以上的占54.5%,但仍有20%的数据新闻仅仅采用了一个或两个呈现形式。可视化具体类型的使用与数据类型和特点相关,但是丰富的可视化呈现形式可以增强数据呈现的准确性和美感,由此可见,两个数据新闻微信公众号的可视化技术仍有提高空间。

4.传播效果

从传播效果方面来看,网易“数读”的最高和平均阅读量分别达到了10万+和3.3万,高于财新的1942和812.42,网易“数读”最高和平均在看数的3041和294.93,也高于财新的65和14.83,且财新数据可视化实验室的数据新闻样本中仅有2篇有评论,占18.2%,而网易“数读”则为100%。两个样本在传播效果上的差距略大。鉴于网易“数读”阅读量达1万以上的数据新闻仅有2篇,且均带有广告推广,难以准确判断其传播效果,因此整体来看,两个具有一定代表性的数据新闻公众号的传播效果表现一般。

(二)影响数据新闻社交化传播的因素分析

本研究的因变量包括阅读量、“在看”数与评论点赞量,经描述统计分析检验,三个因变量均符合泊松分布,首先选择利用泊松回归(poisson regression),但由于存在过大离差(over-dispersion)问题,因此,选择负二项回归。自变量包括四组:报道态度、数据来源、统计分析方法与图表类型。报道态度主要测量报道内容是正面、中立或负面。通常,负面报道容易在社交媒体平台上引发大量传播,因此,报道态度在建模过程中起控制作用。此外,与报道内容相关的一组变量均不显著,由于本研究样本量较小,过多因变量会导致推断统计分析降低统计功效(statistical power),造成本应统计显著的变量非显著,因此,与报道内容相关的变量(除统计分析方法)均未进入最后模型。在描述统计分析中,数据来源渠道划分为8类,为确保统计功效,这里将8类合并为4类。

根据表2可以得到如下结论:

图片来源:新闻记者

1.数据统计分析方法与数据新闻的社交化传播有直接关联。

虽然总体而言,数据来源与数据新闻的阅读数、“在看”数、评论点赞数并无关联,但相比使用单个或多个统计量的简单数据分析方法,复杂的统计分析方法的使用与数据新闻的社交化传播呈现负相关,即复杂的统计分析方法可能造成数据新闻的社交化传播的广度与受欢迎程度降低。

2.图表的种类对数据新闻的社交化传播有直接影响。

分析显示,基于移动端的数据新闻社交化传播的广度与受欢迎程度与静态信息图表呈现负相关。基于移动端的数据新闻社交化传播的广度和受欢迎程度与动态交互图表的使用呈现负相关。多感官传递信息形式和图表个数与数据新闻的社交化传播不存在关联。

四、数据新闻社交化传播困境与破解路径

(一)交互技术:复杂的交互可视化呈现与移动端的适配困境

交互技术和视频动画的使用能让数据新闻报道更具趣味性,提升用户的在场感,增强数据新闻与用户之间的相关性和联系。但根据表2,基于移动端的数据新闻社交化传播的广度和受欢迎程度与动态交互图表的使用呈现负相关。可见,当前两个公众号发布的数据新闻的交互可视化呈现并未对其传播效果产生良好的提升作用,甚至可能在一定程度上产生负面效果。

这一现象与数据新闻的交互可视化呈现与移动端社交平台不适配有关。国内数据新闻作品在向移动端迁移时,保留了电脑端的设计习惯。结果,基于电脑端制作的数据新闻难以适应移动端的屏幕规格与用户纵向滑动阅读的接收习惯;另一方面,受限于移动终端设备不够高的运行速度与处理能力,一些采用复杂的动态交互式可视化技术的数据新闻也难以在移动端流畅播放。例如财新发布的《水平面下的阿尔兹海默病》采用了交互式数据地图呈现阿尔兹海默病患者的地域分布,但其设计的横向世界地图面积较大,超出了手机端的屏幕规格,即便将手机旋转成横屏也不能适配。而另一则数据新闻《直面乳腺癌,在致命之前》所设计的带有交互性质的圆点癌症比例图,其生成过程在电脑端非常流畅,在移动端却会出现卡顿。

与移动端的适配困境导致交互技术的使用反而降低了移动端用户的阅读体验,限制了数据新闻的社交化传播。很多时候内容生产者希望用户通过互动操作去揭示数据,但实际结果是大量的内容和数据被忽略(黄志敏,2019)。

因此,交互技术的提升尤为重要。尼基·厄舍(2016)提出了“互动新闻”的概念,它的特征是互动化、个人化和分享式,为用户提供充分的条件和自主性,让用户自己探索故事的发展路径,从而更深刻地体会到故事与用户个人的关联(陈昌凤,胡曙光,2018)。

厄舍(2016/2019:120)认为,互动新闻不一定都是由数据驱动的,而数据记者生产互动产品就成为了互动记者。可以明确的是,不管是“使用了交互技术的数据新闻”还是“互动新闻”,良好地使用交互技术将赋予用户更深刻的个性化体验,提高用户的参与度,从而真正实现双向互动的叙事效果,推动用户在社交媒体平台进行二次分享。

(二)数据分析和呈现:较高的阅读门槛和可能扩大的“数据数字鸿沟”

移动端和社交媒体的发展打破了时间和空间限制,推动用户逐渐形成了碎片化阅读的习惯。虽然数据新闻用丰富的可视化形式增强了观赏性、趣味性与可读性,但其信息容量大的特征仍与移动端用户碎片化的阅读习惯产生矛盾。此外,图表的复杂性更使数据新闻具有一定的阅读门槛,使用户难以在短时间的碎片化阅读中快速掌握和理解。因此,在一定程度上,数据新闻被视作一种“精英”阅读。Felle (2016)担忧数据新闻会在某种程度上为一个新的拥有良好技术素养的“数据精英”(data elites)阶层服务,从而扩大“数据数字鸿沟”(digital data divide)。

根据表2,相比于采用推断或预测统计分析和多样化的描述性统计的数据新闻报道,采用单个或多个统计量的计算的数据分析方法的数据新闻更受用户青睐。事实上,数据分析越有深度,数据新闻的社会价值越高,但是相应的阅读门槛和难度也会更高,不利于数据新闻的广泛传播。因此,如何在保证数据分析深度的情况下,通过一定的修辞方法让数据结果更形象、更具象,使其更容易被理解和接受,从而“让数据说话”,是数据新闻社交化传播需要解决的问题。

(三)数据驱动:人文关怀的缺失与人文价值的冲突

在强调用户体验和共情的社交媒体时代,人文关怀对推动数据新闻的社交化传播发挥着重要的作用,但数据新闻以数据为中心的实证主义生产逻辑,与传统新闻以人为中心的人文主义诉求产生了价值冲突,缺失了传统新闻所追求的人文关怀,缺少作为新闻的温度。

在本研究收集的样本中,环境健康和社会民生议题的数据新闻占比最高,达32.7%和27.3%。但这些涉及阿尔兹海默病、乳腺癌、失眠、中风、肥胖、鼻炎和家庭暴力等健康和社会问题的数据新闻多以或调侃、或理性的方式提醒用户对这些疾病引起注意,只有少部分数据新闻表达了对病人群体的担忧与关怀。从用户体验的角度来说,这些“理性”的知识向本就担忧的用户传递了一种疏离感,无法使用户产生分享的欲望,从而一定程度上限制了数据新闻在社交媒体上的传播。

在2017年全球深度报道大会(The 2017 Global Investigative Journalism Conference)上,英国《金融时报》的数据可视化记者Jane Pong指出:“我们并不是经常把数据和情感放在同一句话中……但是将数据和情感一分为二在很大程度上是错误的。”她认为,利用数据可视化技术引发用户的共情,是帮助用户更好地认识主题的不错方法(Otter,2017)。她认为在这方面做得不错的一个例子是《一条线后的故事》(Stories Behind a Line),这篇数据新闻追踪了六名寻求庇护者从巴基斯坦、几内亚等各自家乡前往意大利的具体路线,包括经过的城市、使用的交通工具、路上发生的故事、寻求庇护的原因等内容。用户可以通过点击路线上一个个闪烁的红点阅读这六名寻求庇护者路上的遭遇,感受六名寻求庇护者不同的心境和人生际遇。这篇数据新闻虽然只使用了一类数据,且量级不大,但它把数据可视化与新闻故事很好地结合在一起,为用户展现了更多的新闻细节,引发了用户的共情,还体现了这篇数据新闻对寻求庇护的人们的人文关怀。

因此,数据新闻在通过超大量级的数据,将微观个体命运累积成宏观社会问题的同时,也应脱离冰冷的事实语境,拓展数据背后的人文内涵,从而为用户提供“一种符合人文主义话语要求的接受方式和认同体验”(刘涛,2019)。这一目标的达成,需要对数据新闻的叙事系统进行重构,推进一种替代性的“数据故事”,将人文故事整合至数据新闻的视觉叙事中(刘涛,2019),从而增强数据新闻的人文关怀,缓解数据新闻与传统新闻之间的价值冲突。

五、结语

本研究以国内数据新闻在移动端社交平台传播乏力的现象为切入点,关照数据新闻生产中造成其媒介转移失败,陷入社交化传播困境的影响因素。

数据新闻报道领域出现的交互可视化呈现与移动端不适配;数据分析阅读门槛较高;生产逻辑与传统新闻的人文主义诉求冲突等问题,从实践层面看,仅仅是降低了移动端用户的阅读体验,继而限制了数据新闻的社交化传播。从发展时间线来看,这是一种先进的新闻生产手段在遭遇更先进的媒介平台后所发生的不适和碰撞。此前,媒介转移所造成的内容冲突也曾在其他新闻内容形态上发生。例如,传统新闻消息因为由纸媒这种“一次性的、线性传播的、偏于静态的”载体向网络发展,因而更为注意报道动态发展、事件的后续进展等,使得社会的新闻生产实践和话语实践由“作为‘事实’的新闻”转变为“作为‘事件’的新闻”(姜红,2017)。再如,传统广电节目(program)走入短视频平台时,呈现出的不是电视文化的复制,而是尽可能贴近用户,对传统视频生产模式进行改造(彭兰,2019)。

新媒介环境下对新闻传播学话语体系的反思与重构,某种程度上来自媒介带来的“新传播革命”的倒逼,以及新闻实践适时作出的调整。Anderson(2018)研究了19世纪晚期至今美国新闻业和政治学、社会学等社会科学交织游离的关系,发现从20世纪早期的紧密结合,到20世纪中期社会学家因新闻业过于切入公共事务且缺少经验数据将其与社会科学划清界限,再到20世纪70年代 Meyer在学界与业界争议中提出精确新闻学概念试图再次将两者统一起来,并最终促进了计算机辅助报道与数据新闻的崛起(Anderson,2018:7-11)。Anderson的观点对数据新闻提出了某种层面上的警示。新闻业在这一演变过程中是介于社会科学、政府和公众之间的主要机构实体,而数据在新闻叙事中需要实现计算思维向新闻表达的充分延伸(Anderson,2018:118)。

因此,在转战移动端社交平台的过程中,数据新闻的生产应基于移动端社交平台的传播特点,按照互动新闻的设计理念,提升交互技术的用户体验,为用户探索新闻故事提供更多的自主性和可能性;并遵循“设计轻量化”的报道原则,增强数据新闻的可读性;同时在主题选取和文本表达上回归数据新闻的“新闻”属性,使其叙事功能得到重视与发挥,并展现数据新闻的人文关怀,引发用户的共情。

在本研究中,基于现实原因,财新数据可视化实验室的样本较少,一定程度上会对数据分析结果和研究结论的科学性产生影响。不过,这也反映出数据新闻生产制作周期较长,更新频率不高的现况。同时,本研究所关注的数据新闻社交化传播困境,在一定程度上值得进一步从其他视角进行思考与补充。

(唐铮丁振球:《数据新闻的社交化传播之困——基于两个数据新闻微信公众号的定量研究》,2020年第11期,微信发布系节选,学术引用请务必参考原文)

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部