2010年,在首届国际数据新闻圆桌会议上,德国之声电视台的米尔科·劳伦兹提出:“数据新闻是一种工作流程,包括下述基本步骤:通过反复抓取、筛选和重组来深度挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事。”①我国的数据新闻实践发展迅速。2016年全球数据新闻奖评比中,我国财新网获得最佳数据新闻网站提名,是唯一获得提名的中国内地媒体。但随着数据新闻实践的迅速发展,学界关注到数据新闻生产传播中存在的问题,并谋求解决之道。
数据新闻收集与筛选过程存在的问题
数据新闻生产的第一步是收集并选择具有新闻价值或能为新闻主题服务的信息。众多数据来源反而造成了数据真实性难以保障的问题,在数据的筛选中也会因主观判断而破坏数据整体性及客观性,数据收集还有侵犯人权的问题。
1.数据真实性难以保障。大数据技术及物联网让数据收集更加便利,但“大数据不等于全数据、真数据”,②许多原始数据平台提供的数据本身就是虚假的。“知名科技咨询机构Gartner表示,全球财富1000强的企业中,超过25%的企业信息系统中数据信息不可用或不准确;在数据库项目的开发中,用于数据有效性分析的成本占企业产值的10%至20%。”③2016年5月31日,央视《朝闻天下》以长达8分钟的时间“揭秘手游数据造假”。
2.被筛掉的“隐形”数据。有时在数据选择中被筛掉的“隐形”数据才是还原真实的关键。如2016年美国总统大选中,一些权威媒体的民意调查出现巨大偏差。被调查者多数是该媒体的受众,与该媒体的主流意见持相同观点,主流媒体又与社会精英抱团,反对希拉里的声音一开始就被民调过滤了。关键数据被隐藏不仅会受数据收集方的影响,有时还与原始数据提供方有关。类似电话问答、街头访谈、问卷邀请的调查方式,很难确保人们不敷衍、不撒谎,尤其在面对特朗普这种颇具争议的人物选项时,有许多参与调查者会隐藏真实想法而选择希拉里将获胜。
哥伦比亚大学教授计算新闻学课程的Jonathan Stray教授提醒数据新闻工作者,在收集数据时问问自己:“这些数字是哪里来的?谁记录了这些数字?怎么记录的?出于什么目的收集这些数据?我们怎么才能够知道数据是完整的?……”④
3.数据收集对人权的侵犯。在大数据时代几乎没有隐秘。接入网络暴露我们的IP地址,搜索点击暴露我们的兴趣爱好,购物订单暴露我们的消费习惯。物联网与大数据技术让我们随时能找到自己的存在,又让我们随时被人窥探。2016年12月31日,Datadrivenjournalism.net网站发表了一篇Zara Rahman抨击英国最新通过的《调查权力法案》的文章。该法案要求英国网络服务商存储一年的网络浏览记录以备警方调查。这份法案被民众讽刺为“刺探者的许可证”。Zara在文中列举了卢旺达大屠杀、孟加拉国对避难者的制度化歧视等由数据收集促成的人道主义危机,警示英国这种对大众的监督是危害人权的。⑤
这也是值得数据新闻工作者反思的问题:人作为社会群体动物,如何避免一边享受自己创造出来的技术,一边保证自己不受奴役并且不去侵犯他人?
数据新闻分析与整合过程存在的问题
数据新闻不同于传统新闻的一个重要特征在于:要求生产者有专业数据分析能力。然而,我国数据新闻实践仍在初始阶段,大部分数据新闻工作者还缺乏这种能力,在数据信息的分析与整合过程中常犯主观性错误、依据相关数据轻易推断因果,这也是对新闻真实性与客观性的破坏。
1.常犯的统计学错误:相关性=因果性。“相关性不等于因果性。”这是老生常谈。但在数据新闻中依然常见与之相悖的状况。2017年1月3日,DT财经网发表了一篇数据新闻:《五道口生存指南:浪在“宇宙中心”是怎样一种体验?》,⑥该文抓取五道口周边签到微博评论,进行文本及词频分析,数据显示积极评论比例高于消极评论,因此得出结论:“从整体看来,五道口附近的人们生活过得还是比较开心的。”但是,在五道口附近微博签到的用户不一定居住在此,瞬时的积极评论无法代表个人的生活常态,数据变量和文章的结论没有直接的因果关系。因为大数据重相关不重因果,数据新闻难以进行深度报道,在探求原因的学科领域也无法引入。
2.数据分析人员专业性不够、主观性太强。专业的数据分析能力是数据新闻的高门槛。上述的五道口相关新闻例子也已经证明,专业性不够的数据新闻有失偏颇,会误导受众。国外许多新闻工作者已经意识到普及数据分析技能的重要性。2016年2月23日,Datadrivenjournalism.net网站发表了一篇对于六位来自芬兰、美国、英国的资深数据新闻工作者的采访摘录,其中美国ProPublica媒体的 Sisi Wei(2016年全球数据新闻奖DJA年度最佳个人作品奖获得者)说:“我认为不论你在做什么新闻工作,具有数据新闻的技能都能够帮助你实证你的信息来源。”⑦
数据新闻编制与推送过程存在的问题
目前有些数据新闻编制只搬运数据,丧失了新闻的叙事性;或者盲目追求花哨的可视化,而忽视内容的新闻价值。在大数据满足个体需求的技术支持下,受众获得的信息面越来越狭窄,媒体的社会引导功能在这种个体化推送模式下也被消解了。
1.单纯数据驱动,缺失叙事驱动。现在,国内许多数据新闻还处在单纯搬运数据的阶段。2016年11月28日,财新网的“数字说”栏目发表了一篇数据新闻《全球男性自杀率远高于女性 中国是例外》,用大篇幅的文字转述世界卫生组织官网上公布的全球171个国家或地区2012年的自杀率数据(测算值),没有新闻故事,更没有报道为何中国男性自杀率低于女性。这种新闻既无法吸引受众,又浪费数据资源。
美国学者约翰·H·麦克马纳斯(John H.McManus)以“信息的重要程度”和“情感的吸引力”两个维度勾勒了一个新闻坐标系,分为“有趣且重要的报道”“重要但无趣的报道”“煽情但缺乏重要性的报道”“既不有趣也不重要的报道”四个象限,并指出在“市场新闻业”的运作法则下,最受欢迎的新闻应当是“有趣且重要的报道”。⑧仅有冰冷数据的数据新闻只会推开受众,最顶尖的数据新闻一定是事实充实的深度报道。
2.耗费成本追求可视化,缺乏新闻价值。比如财新网“数字说”栏目利用谷歌地图可视化展示中国各省市政府大楼,当鼠标点击代表不同省市政府大楼的图标时,会显示该政府大楼的信息与照片,这个作品还有手机版。其时间成本及技术成本必然较高,但新闻价值不大。数据新闻工作者也应注意这个问题:用简单文字或图表就能清楚表述的新闻,是否要为了吸引点击率而耗费成本将其可视化?
3.受众丧失自由选择权和思考力,媒体丧失社会引导功能。数据新闻依托大数据技术能实现定点推送,这一方面满足了受众多样化的个体需求,另一方面却也剥夺了受众的自由选择权。一味迎合受众的推送功能让受众沉湎于自己感兴趣的世界,信息面窄化,受众会渐渐丧失对其他立场信息的思考力。同时,媒体为引导社会健康发展而进行的议程设置,也会被不关注该信息的群体屏蔽,无法起到缓解社会矛盾的作用。再者,大数据技术的开发与商业利益密不可分,数据新闻也因此会受到商业利益的影响,媒体若为推动消费而编写新闻,必然丧失社会引导功能。
数据新闻现存问题的解决之道
2016年12月14日,Datadrivenjournalism.net网站发表了对数据新闻编辑Megan Lucero的采访。他表达了对数据新闻火热形势的担忧:“我害怕的是,我们将进入一个这样的时代:人人都专注于提高做一个程序员记者所需的工具使用技能,而不是训练自己如何发现故事、如何找到真正好的线索,而且丢失了新闻专业主义。”⑨我们在数据新闻实践中不仅要解决技术和技能的问题,而且不能丢弃新闻工作者的专业精神。
笔者认为,可采取如下措施解决上述问题:第一,针对数据收集与筛选过程的问题,媒体最好有自己的数据库或固定的数据供应商,这样既节省时间,又能一定程度上保证数据的可靠性与整体性;加强跨媒体跨行业合作,与其他大媒体、互联网公司等共享数据信息;直接购买专业数据新闻生产团队的成果虽然省时省力,但要保持对数据的审慎态度。第二,针对数据分析与整合过程的问题,媒体要加强与专业数据分析团队的合作,或者更新内部人才结构,吸纳专业数据分析师,减少因果牵强的数据新闻和数据搬运式的低质量新闻;学校也要开设系统的数据新闻课程,培养专业的数据新闻人才,让新闻专业的学生更适应市场需求。第三,针对数据新闻编制与推送过程的问题,新闻工作者可以减量保质,把流于表面的搬运数据打磨成深度报道;用最合适的形式展现最触动人心的事实,才是新闻工作者应该追求的目标。总之,媒体人做数据新闻,倘若失去对新闻专业精神的坚守、对新闻社会功能与人文关怀的追求,那么除了冰冷的数据与充满商业气息的点击率之外,将一无所有。
注释:
①方洁 颜冬:《全球视野下的“数据新闻”:理念与实践》[J],《国际新闻界》,2013年第6期
②陈力丹 李熠祺 娜佳:《大数据与新闻报道》[J],《新闻记者》,2015年第2期
③李建中 刘显敏:《大数据的一个重要方面:数据可用性》[J],《计算机研究与发展》,2013年第6期
④方可成译:《记者在做报道时应如何解读数据》,http://fangkc.cn/2014/01/drawing-conclusions-from-data/,2014年1月19日
⑤“Dangerous data: The role of data collection in genocides”,http://datadrivenjournalism.net/news_and_analysis/dangerous_data_the_role_of_data_collection_in_genocides,2016年12月31日
⑥《五道口生存指南:浪在“宇宙中心”是怎样一种体验?》,http://www.dtcj.com/news/586b00e267157b05cbef6061,2017年1月3日
⑦“Is data journalism for everyone?”,http://datadrivenjournalism.net/news_and_analysis/is_data_journalism_for_everyone,2016年2月23日
⑧王强:《“数据驱动”与“叙述驱动”:数据新闻生产的双重动力》[J],《编辑之友》,2015年第3期
⑨“Getting with The Times: Lessons from the paper’s Data Journalism Editor”,http://datadrivenjournalism.net/news_and_analysis/getting_with_the_times_lessons_from_the_papers_data_journalism_editor,2016年12月14日
(罗婕:暨南大学新闻与传播学院硕士生;邓绍根:暨南大学新闻与传播学院教授)
上一篇:环境新闻传播公众意见调查 下一篇:网络新闻生产研究的四种理论取向