期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

数据新闻:大数据时代新闻生产的核心竞争力(2)

时间:2016-03-25 11:18 文章来源:http://www.lunwenbuluo.com 作者:徐锐 万宏蕾 点击次数:


  与大多数由对事实的描述或引用当事人话语构成的传统新闻不同,数据分析呈现的模式、趋势和偏值能给予新闻报道更强的可信度。[4]但并不能简单地认为数据新闻就是图形或可视化效果。数据的大规模介入只是"讲故事"的方式,而不会取代故事,只不过有时故事是用可视化效果或地图来讲述,从对人的影响角度来阐明数据的意义。从数据中发现的结果可转化为任何形式的新闻报道。视觉化有助于让数据与杜会、数据与个人的复杂关系得到更为清晰的理解。数据和故事之间的联系被看做是跨越彼此相关却知之甚少的新生事物之间的新弧线,使新闻报道变得可验证、可信赖、彼此相关又容易记忆。
  二、数据新闻的生产流程
  数据新闻项目负责人洛伦兹把数据新闻的生产流程描绘为:数据经过滤与视觉化后形成故事,在这一过程中,对于公众而言数据的价值也提升了。[5]英国《卫报》数据新闻编辑西蒙?罗格斯则认为,数据新闻既要处理数据,又要不断检验数据的信度与价值,并通过多种手段和渠道完成报道。[6]英国伯明翰城市大学教授布拉德肖依照传统新闻学"倒金字塔〃结构理论,提出数据新闻采编流程“双金字塔”结构。倒金字塔部分自上而下包括数据搜集、清洗、情境化、合并等4个环节,以传播为纽带,形成一个自上而下包括视觉化、叙事、杜交化、人性化、个性化和应用化等6个环节的正金字塔结构。他强调,数据新闻通过可视化形成新闻故事之后在各种平台发布实现杜交化,读者可根据个人的兴趣和需求对新闻作品加以应用。尽管上述说法各异,但数据新闻生产流程都离不开数据搜集、数据处理和数据呈现3个阶段。
  1.数据搜集。数据搜集是数据新闻生产流程的第一个环节,也是最重要的一环,直接影响后续阶段的可信性和有效性。随着数据分析和数据挖掘技术的发展,数据新闻分析的数据量级远超传统新闻图表的数据规模。数据新闻多采用网上公开、免费获取的数据,且搜集渠道多样:或对同类新闻或不同时期的相关新闻数据进行归类统计、整合比较,更为深入、立体、多元化地揭示新闻;或对网络搜索引擎、杜交媒体内容、用户数据进行深度挖掘,揭示个别、分散行为中蕴涵的共同规律;或从政府机构、企业等发布的公开数据中寻找可作为新闻背景的有用信息;或通过网络观察、调查或众包的形式收集数据。
  在新闻生产的外部化、开源化影响下,诸如《卫报》、ProPublica等新闻机构都已开始使用原创的“众包”数据,“传统的、昂贵的、费事的”信息搜集情形正在改变。[8]2011年8月,《卫报》启动“解读伦敦骚乱”项目,除深度访谈参与骚乱的人、警察、普通市民,搜集法庭审理骚乱案件资料及政府关于杜会经济状况的统计资料外,杜会化媒体上的内容,特别是Twitter上257万条与骚乱相关的信息成为重要的数据分析来源。大数据时代,媒体要更好地进行数据新闻报道,数据的“流动性”和“可获取性”是至关重要的因素,而政府是大规模信息的原始采集者,因此数据开源要以政府的信息公开为首要前提。
  2.数据处理。当搜集了足够多的数据之后,为保证数据的质量和数据新闻的可信度,需对数据进行全面谨慎的处理。事实上,数据本身并不是绝对客观的,用来解释这些数据的统计模型、挖掘技术也并非天然中立。因此,记者需对搜集的数据保持怀疑的态度,并建立_整套数据处理的编辑准则。
  布拉德肖把数据处理环节概括为数据清洗、情境化和综合等3个步骤。[9]其中,数据清洗通常有两种做法:其一是检查数据的一致性,将新获取的数据转换成与已使用数据相一致的形式;其二是处理无效值和缺失值等。数据库通常会存在重复条目、损坏条目、空白条目、错误格式、重复命名、数据丢失等问题,需借助Excel、GooleDocs、GooleRefine等软件工具对不完整的数据、错误的数据、重复的数据进行整理、清洗。
  数据情境化主要是将搜集的数据置于特定的语境中解释,有助于理顺数据之间的逻辑关系,不至于在数据搜集阶段丧失焦点或错过有趣的报道角度。这必然要求记者在生产数据新闻时以问题为导向,弄清数据由谁收集、何时收集、为何收集、如何收集、有何意义。
  数据综合常见的方法是信息图表的糅合混搭,即将—个数据库中的信息合并到另一信息图的数据之中,实时呈现事物的时空分布状况,实现信息的整合与导航。数据地图、时间线、交互性图表已成为不同时间、不同来源的数据信息整合的框架:或对比、叠加数据,挖掘“数据关系”;或延展时空跨度,揭示总体规律,或以超链接的形式,向用户提供原始素材的来源。通过对不同维度的数据叠加、比较、相互关联,可看到每个数据更深层的含义,加深对新闻事实真相与意义的理解。
  3.数据呈现。随着信息可视化技术的发展,“读图”时代的外延进一步扩展,从静态的新闻图片跃升到互动性更强的信息图表。信息图表是对文本型和数值型信息形象化、互动化的呈现,包括图表、图解、图形、表格、地图和列表等,用以展示数据、提示要点、梳理进程、揭示关系、表达观点等。
  目前,数据的可视化大多采用开放源代码的软件工具实现,如电子表格LibreOffice、Excel或Google文档,统计编程架构R或Pandas,地理信息系统(GIS)QuantumGIS、ArcGIS和GRASS,
可视化程序包d3.js、Prefuse和Flare,数据加工工具GoogleRefine、Datawrangler,非编程可视化软件ManyEyes和TableauPublic等等。
  数据新闻可视化的呈现方式千差万别,其主要目标是帮助读者迅速定位对自己有用的重要信息,报道重大却鲜为人知的新闻,帮助读者更好地理解复杂的问题。目前,信息图表的制作主要有三大方向:“一是数据可视化,将数据信息的量与关系等转变为直观的图形;二是看图说话,将文字信息变为形象符号;三是以图整合,在图表中集成多元信息”。在此基础上,信息图表形成四大类型,即“Flash动画型、信息查询型、问卷调查型和综合集纳型”。
  值得注意的是,数据可视化的效果高下取决于所用信息是否干净、精确和有意义。信息图表是为呈现数据、分析数据、解释数据服务的,当文本和多媒体能更好地讲述故事,当掌握的数据过少或没有明显的趋势和结论,当空间要素并不那么重要或缺乏吸引力时,当表格能更加简洁、高效地传递信息时,信息图表反而成为累赘,可以弃而不用。

  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

联系方式

  • 论文投稿客服QQ: 论文投稿2863358778
  • 论文投稿客服QQ: 论文投稿2316118108
  • 论文投稿电话:15380085870
  • 论文投稿邮箱:lunwenbuluo@126.com

热门排行

 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli