每一次新技术被应用于新闻传播领域,都会给传媒业带来巨大的变革。在大数据、人工智能等技术的驱动下,新闻生产、信息发布、用户体验以及信息反馈等被重新定义,而传媒、公众和技术也在互动中出现了异化,产生了伦理失范问题。
大数据技术应用中的新闻失实
美国斯坦福大学统计学教授特雷夫·哈斯蒂(Trevor Hastie)认为,在数据的“干草堆”中捞到有意义的“针”,其困难就是“许多干草看起来也像针”。这句话揭示的是,从数据源的角度看,在大数据应用的背后存在着不易发现的隐性失实问题。大数据显示的往往是表面现象或结果,而隐藏其后的真相必须通过深入调查才能揭示。新闻报道接近事实真相需要通过对大量数据进行科学分析,但是,有限的数据开放程度导致必要数据的缺失,大数据并不是全数据,数据体量大并不等于数据全。另外,采集数据的标准不同、互联网环境的匿名性等因素,直接影响了数据的准确性,而看似微小的误差将导致不同的运算结果,运算结论的不准确必然产生失实的新闻信息。
新闻报道是一种叙事,不仅要真实而且也要有趣,与受众密切相关。这就决定了新闻报道与统计分析在处理和展现数据方面的不同,媒体需要用文化、法律和政治等标尺来衡量哪些数据重要以及为什么重要,这就会使得同一组数据因为不同的逻辑顺序和因果关系而形成不同的解读。从数据处理的角度看,对于事实与事实之间较复杂的关系,大数据技术很难捕捉到背后隐藏的真相,以分析出错综复杂的利益链条并做出准确的价值判断,这就难免产生新闻失实问题。
被侵犯的公众个人隐私权
数据是信息社会的重要资源,为了拥有大量数据,数据的采集范围日渐广泛,采集方式也日渐隐蔽。大数据所隐含的价值及其带来的利润,增加了公众个人数据被非法收集和过度分析以及被滥用和泄露的风险。
从所有权的角度来看,法律规定,公众不仅拥有个人数据的所有权,而且有权利知道是哪些机构在收集自己的数据、收集了哪些数据、被收集的数据将用于何处等。如果公众在未被告知的情况下被收集了个人数据,这就是一种违背职业伦理和相关法规的行为。采用大数据技术对公众的原始数据进行运算、挖掘之后获得的数据属于延展性产品,这类数据的指向性更明确、价值更大,理应和原始数据一样得到法律的保护。大数据的挖掘程度越深,实现的价值就越大,大数据开发者所获得的利益也就越大,因此,对公众个人数据的过度分析和滥用的事例日渐增多。
例如,脸书的“数据门”就是对用户数据滥用的一个典型事件。英国剑桥分析公司从2014年起非法获取了5000万脸书用户的数据,通过大数据技术分析了这些用户的兴趣点和偏向,然后精准投放他们偏好的新闻和广告,潜移默化地对其政治倾向施加影响,进而左右总统选举的投票。大数据技术应用上的失范导致一些用户开始产生“被迫害臆想”,有用户怀疑有人利用手机麦克风窃取个人语义信息,有人猜测输入法也在窃取数据。用户对于大数据技术的过度担忧导致了开放数据的困难,影响了大数据技术的合理开发。
“技术中立”包裹下的偏见与歧视
随着人们的信息传播、观点交流主要借助于互联网,网络平台已经不折不扣地成为了新兴媒体。一些网络平台以“技术中立”“技术至上”“算法没有价值观”等概念模糊了其资本逐利的本质目标。在运用大数据技术进行信息生产与分发时,内容的真实、客观、公正以及舆论导向的正确与否都让位于受众的兴趣,虽然看似在满足受众的需求,但实质上是网络平台本身经济诉求的真实反映。新闻信息的生产理念、流程和把关模式,包括传统的新闻概念正逐渐被改变,原创性新闻的生产积极性也被削弱。
基于大数据运算的算法作为一种数学表达,理应抛弃人类在信息传播中的猎奇、歧视、偏见等不良因素。但是,在算法程序的研发中,不仅数据的体量、准确性、适用范围等直接关系到算法决策和运算的结果,而且研发人员所使用的训练数据的分布状况,以及对算法进行测试的过程,都会影响算法的客观公正,再加上算法黑箱的存在,使得各式各样的偏见、歧视被“技术中立”的外衣所包裹。
媒体、公众与网络平台的伦理规制
探究人和技术的关系必须在直面技术的同时观照人类,让技术和人在双向互动的过程中相互驯化,让技术更好地为人服务,也让人不断更新“技术”思维,不过分依赖技术,保持主观能动性和创造力。
当前,媒体、公众、网络平台分别承担着交叉核实信息源、建立隐私保护意识和提高数据开放程度的责任。媒体既可以依靠传统的事实核查手段,也可以利用新兴的技术工具检验信息的真实性。公众需要学习保护隐私的方法,比如要在提供个人隐私信息之前仔细阅读隐私保护政策,明确不再使用该服务时个人信息的删除和退出机制等。网络平台可以通过制定数据信托程序,设计信托程序的协议内容和框架流程来处理数据交换过程中的敏感问题,提高数据开放程度以满足新闻报道的需求。
如今很多媒体认识到“信息茧房”的问题,推出了应对“信息茧房”的程序。例如,新闻APP“跨越分歧的阅读”(Read Across the Aisle)创立了包含20个新闻品牌的图谱,图谱能够记录用户阅读新闻品牌的频率,并计算受众在每一个新闻品牌中花费的时长,当受众的阅读习惯偏向于一方时,程序会建议受众调整阅读内容。
流量逻辑本质上就是“消费者导向”原则的变种,一味遵从这种逻辑将导致媒体背离核心价值。因此,为保证新闻的权威性,媒体需要平衡公共服务与经济利益之间的关系。当下的大数据技术还不具备透彻了解社会现状与发展进程的能力,也无法在新闻的生产与发布上体现大局意识。媒体有责任在新闻信息的生产与发布过程中,把回应公众的关切与政府当前的工作重心结合起来,把服务、满足公众需求与教育引导公众、提高公众的素养结合起来。此外,受众也要带着质疑和批判精神看待基于大数据技术生成的新闻信息,而运用法律法规对网络平台进行主体问责也是避免职业伦理失范的有效途径。
大数据技术为新闻传媒业的发展提供了一条新路径,在改变原有新闻信息的生产和发布方式的同时,也需要对原有的职业伦理规制做出相应的调适。技术红利与技术缺陷是相伴相生的,因大数据技术应用不当而引发的某些问题不是技术发展的失败,而是对技术理性与价值理性能否相互协调、相互融合的考验。大数据技术推动着新闻传播业的更新和变化,同时新闻传播业也对大数据技术的应用场景和范围做出限制,这是技术与人在大数据时代相互驯化的过程。因此,从职业伦理的层面规范媒体、网络平台的传播行为,让技术更好地推进新闻传媒业的健康发展,有着深远的意义。
(本文系中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目“数据新闻可视化的产品评价指标体系研究”(17XNL003)阶段性成果)
(作者单位:中国人民大学新闻学院;新华社国内新闻编辑部)