随着越来越多新闻媒体开始采用 AI 生产新闻报导,AI 和自动化技术的日益增强正在改变整个新闻业。那么对正陷入困境的新闻业来说,AI 究竟是急迫需要的生命线,还是生存的致命威胁?
日前,数位新闻中心(the Tow Center for Digital Journalism)和布朗媒体创新研究所(the Brown Institute for Media Innovation)联合技术专家和记者召开政策交流论坛,一起讨论 AI 如何影响新闻媒体,以及如何将 AI 应用于新闻领域这议题。本次报告中,着重讨论这 4 个问题:
- 记者如何利用 AI 来辅助报导?
- AI 可替代哪些新闻室角色?
- 新闻机构还未应用 AI 技术的领域有哪些?
- AI 最终将成为新闻报导不可或缺的一部分吗?
议题一:AI 在新闻业的应用
如大家所了解,每个新闻编辑室都有一套独特的 AI 方法。经过几次案例研究,AI 在新闻机构贡献最大的活动共有以下 3 类:
- 资料量很大或很复杂的情况下,AI 可做为突破性工具,排除人身认证的外部或特殊情况──这个角色完全适用于标准的新闻编辑室流程。
- 辨识趋势(或偏离趋势):AI 的大量计算能力可帮助提供数据聚合的表征,或有可能按照时间、地理或人口统计分组。此外,它还能快速辨识离群数据。
- 检查 AI 或计算的应用程序可为故事本身的主题:算法由人类构建,所以不可避免带有人类的偏见──如何透过这些工具找到复杂的思想?当这些工具被国家或城市具体采纳并运用时,又会发生哪些不可预知的情况?
1、几大具体案例
AI 可透过以下几种方法来增强记者的工作:分类文件;辨识数据中的异常值。当然,在讨论的过程中,经验丰富的人类常会运用真实新闻来判断,以为新闻编辑室工作的重要组成部分。
虽然有许多有据可查由 AI 编写的新闻故事,例如体育赛事的总结、公司财报发布,甚至地震等数据模式,但很少有与会者认为记者的工作会完全被机器或算法取代。只有在人类的操纵和验证结果情况下,AI 才能更帮助自由作家持续不断重写相同的故事,并处理更多原始报告。
最近的一些案例,比如《洛杉矶时报》记者使用分类器检测 LAPD(洛杉矶市警局)降级犯罪分类的实例,取得显著成功;亚特兰大宪法机构对医生实施性虐待的调查;路透社的主题建模,以寻求最高法院上访问的权利中心;ProPublica(美国一家非政府、非营利的网络新闻机构)日前联合 Google 推出一个基于机器学习的工具──仇恨犯罪新闻纪录索引。它透过分析大量新闻文章,建立一个全国范围内预测仇恨犯罪发生地的预警图;《纽约时报》报导总统川普就职典礼新闻事件,使用人脸辨识技术以获取观众席资讯。
对一些记者来说,他们可能会在 GitHub 抓取示例代码,并应用于新闻报导。但是,除非这名记者对这些工具或技术很了解,不然可能会出现不法行为的风险。
2、记者在使用数据时应注意陷阱
记者在使用从社交媒体到政府机构的数据时,应小心陷阱。他们必须小心评估这些新型讯息来源的可靠性,特别是在涉及 AI 的情况下。比如,使用 Twitter 为社交媒体平台的记者,必须谨慎使用这些数据来分析社会行为。
3、出版商的挑战:包括大型和小型新闻机构
所有新工具,新闻机构都有责任和义务训练记者、编辑及开发人员如何正确使用它们。虽然像《纽约时报》这种大型新闻机构,资金可能不是问题,但对资源较少的小型新闻机构来说,这将是一个不小的挑战。
新闻媒体的领导人可能面临的一个决定在于,如何与他人建立 AI 工具使用上的合作。因为使用复杂数据集和自定义算法进行的调查分析和团队建设可能需要几个月时间,这并不是所有新闻机构都能独自完成。
与学术机构和研究人员合作可成为新闻机构在新闻编辑室开始使用 AI 工具的好方法。不过,新闻编辑室和学术实验室的文化差异很大,两者在创造 AI 工具的目标上可能会有分歧。
议题二:AI 技术如何适应新闻报导规则?
AI 技术如何适应新闻管道?如前所述,AI 在报导、内容创建、分发和受众互动起的作用越来越大。比如,近日,开发众包、脑力激荡和事实核查工具正被用来收集数据资讯,特别是用于构建相关数据。在当代的新闻编辑室中,自动化已成为竞争的关键工具,不仅是为了获取客户关注,还用于和大型平台的竞争,如 Netflix、Facebook 和亚马逊。
自动化写作和个性化推介
自动化可以在短时间内处理大量的任务,例如在几分钟甚至几秒钟内分析和汇总大量的数据,进而尽可能的减少记者负担。另一方面,许多社交媒体平台和网络公司也都实证了个性化推送是捕捉注意力的一种有力工具。如,Netflix 使用行为数据为观众提供观看建议;亚马逊的成功部分原因在于它为购物体验提供数据驱动的个性化设计。
1)案例一:Wibbitz
Wibbitz 公司和《今日美国》报的体育报导部门开始合作,该公司可以把媒体记者写作的文字报导在短短几秒钟内制作出短片。Wibbitz 公司最核心的 AI 技术是“文本转换影像技术”(Text-to-Video Technology)。一开始,Wibbitz 的 AI 技术会分析一个故事文本,然后在这个文字报导的基础上形成一个摘要,紧接着,AI 将这个文本摘要转换成一个伴随有照片、图形及其他更多媒介形式的、带有画外音的短片。实际上,整个制作过程就是利用 AI 驱动软件,将一个文字报导内容压缩为一个故事脚本,然后将一系列图像或影片串接在一起,并添加一些画外音。
2)案例二:BuzzFeed
BuzzFeed 是另一个进入 AI 领域的知名媒体。在 2016 年美国大选期间,BuzzFeed 的“新闻开放实验室”(Open Labs for Journalism)开发了一个新闻机器人(Buzzbot),这个新闻机器人可以搜集共和党全国代表大会中来自不同消息来源的新闻资讯。AI 驱动的新闻聚合器可以追踪即时选举结果和投票报导,这样媒体记者就不用靠人力来完成这些工作。有了新闻机器人,BuzzFeed 的记者可以集中精力去报导更加复杂和场景化的新闻故事,而这类新闻是机器学习解决方案技术,自身无法生产出来的。
3)案例三:路透社
路透社为了解决真假讯息辨识的问题,他们使用新的新闻追踪系统叫做 News Tracer,针对每天 5 亿则 Twitter 讯息进行演算,从假新闻、不合理的新闻、广告、杂音中找到真的新闻事件,有了算法的辅助,记者可以从社交媒体的众多讯息中脱身,把更重要的时间用来挖掘故事。News Tracer 与其他监控工具不同之处,在于其模仿的是记者的思考方式,程式人员在这套算法中植入 40 个评量指标,诸如原始贴文者的地点与身份、新闻的传播方式等,建立一个新闻可信度评分,该系统还会针对记者确定可靠的新闻进行来源交叉检查,并辨识其他潜在的消息来源。
4)案例四:美联社
美联社是最早采用 AI 技术的媒体组织之一。早在 2014 年,美联社与美国“自动化洞察”(Automated Insights)公司合作──该公司开发出了自动化写稿程式 Wordsmith,它当时是世界上唯一的公共自然语言生成平台──来程式化地写出许多上市公司公开发布的季收入报告相关新闻报导。在将人工智能技术用于处理季度收入报告之前,美联社新闻记者每季只能创作几百个新闻故事,结果导致数千个公司的收入报告没有被报导。在使用 Wordsmith 自动化写稿程式之后,美联社有关公司收入的新闻报导数量增加了 12 倍。
评论系统和观众参与
今年 6 月,《纽约时报》与 Google 母公司 Alphabet 旗下技术孵化器 Jigsaw 合作,运用后者的 Perspective 机器学习技术来过滤新闻报导的评论数量。据了解,之前《纽约时报》每天安排 14 名审查员处理约 12,000 条评论,每篇文章下方的评论有 20% 是打开的。运用该 AI 工具后,其可以把有害的评论和健康正确的评论阻隔开来,不仅可以减少修正评论人员 25% 的工作量,还能将文章下方的评论取的打开率提升至 80%。
《纽约时报》想利用该 AI 工具,建立一个平台,以便审查员和读者进行更加深入的互动。不过,这其中仍然存在一大挑战,即是如何建立共同点,且尊重不同的观点,让新闻报导和读者的区域观点保持一致。透过这一机器学习工具,审查员不仅可以提高处理评论的速度,还可以透过预测模型轻松组合相似的评论。
议题三:算法与伦理:究竟该怪人类还是算法?
在新闻编辑室使用 AI 工具,如机器学习、自然语言处理、人脸辨识和机器视觉,这个过程不可避免会带上人类伦理的思考痕迹。这里牵扯到 3 个方面的内容。
1、透明度和责任感
由于 AI 在新闻工作中可以扮演很多角色,因此在解释何时何地以及如何使用AI时,更应该谨慎解释。如涉及聊天机器人和用户的互动时,如果由 AI 来驱动,这个机器人又该如何向观众解释自己的运行原理?观众需要知道故事的构建过程,以及机器在创建过程做了哪些选择?当涉及 AI 时,最终应该追究谁的错误?如何解释由人类创建的算法引起的错误?究竟该怪人类还是算法?
据 ProPublica 的研究表明,算法偏差在数学上是不可避免的。即便如此,新闻工作者应该对这些 AI 系统负责,并鼓励在算法系统的构建流程中建立问责制。
2、编辑性决定和偏见
算法在新闻策划中的作用越来越普遍,这些代表编辑性决策的算法需要用人类的方式来编写。以聊天机器人为例,电脑就像人类一样,如果他们不了解内容,就不能进行对话。机器人能够谈论的唯一领域就是我们可以为该会话语境构建模型。
此外,为了让去偏见概念更加复杂化,通常会让数据更具中性。一些研究表明,有许多类型的机器学习,都是用来“监督学习”。算法无法重现人类的心理模型,但能重构因果关系。
3、数据的伦理使用
数据的伦理使用是每个记者需要面对的根本问题,同样的原则也适用于处理大量数据的公司。虽然有许多社交媒体平台会向记者提供数据,但数据发布商和平台之间关于开放数据获取的关系依然复杂。
许多算法的性质更像是一个“黑盒”,其掩盖了对软件正在做的决定的批判性认识。所以,记者需要尽可能的在研究和报导中使用这种批判性态度。
七大研究结论
如前所述,经过这次研究,关于 AI 究竟是对新闻业是威胁还是助力,我们可得到以下 7 大发现。
- AI 工具可以帮助记者讲述或报导之前不切实际或技术上无法实现的新故事。虽然 AI 可能会转变新闻业,但它会增强而不是取代记者的工作。事实上,为了正确使用 AI 技术,人类必须随时保持机敏状态。
- 设计 AI 的技术人员和使用 AI 技术的记者之间存在知识差距和沟通差距,这样可能导致新闻事件的不正之风。
- 读者在如何使用 AI 工具进行分析、辨识模式以及报告故事中的发现时,应该得到一种透明的方法。
- 虽然 AI 和数据的互动可以为读者参与、获利和个性化新闻推送提供新的机会,但是在创建回声室和继续致力于新闻公共服务使命之间找到平衡存在挑战。
- 数据的伦理使用和披露(如何收集、储存、使用、分析和分享用户讯息)是记者需要面对的一个根本问题。
- AI 有潜力增强记者的工作,但在开放数据获取上依然存在挑战。
- AI 是不可预知的。我们不能自信地预测哪里会出现最大的问题,所以技术专家和记者需保持警惕,以确保 AI 系统的准确性。
结语
照目前的情况来看,AI 对新闻业的助力远大于威胁。未来采用 AI 辅助报导将成为各新闻机构在竞争赛道上的一大趋势。只是,在应用 AI 的道路上,人类应尽快厘清算法伦理的追责问题,以便提前清除后患。
注:报告原文来自哥伦比亚大学新闻学院,由 Mark Hansen、Meritxell Roca-Sales、Jon Keegan 和 George King 4 位共同编写。
- Artificial Intelligence: Practice and Implications for Journalism
(本文由 雷锋网 授权转载;首图来源:pixabay)
延伸阅读:
- 美联社机器人记者多了新业务:报导 MiLB 小联盟赛事
- AI 提供快讯,日本零记者通讯社掀革命