由公视制播、探讨无差别杀人事件的影集《我们与恶的距离》,自上映后成为网络热门话题,收视率随着剧情的开展节节攀升,完结篇创下 3.4 的高收视率。这部戏能成功,金钟编剧吕莳媛功不可没,无论是不同故事主线穿插交织、剧中人物对社会事件的辩证论述,还是一波未平一波又起的冲突场面,在在都牵动着观众的情绪,也唤起台湾社会对五年前郑捷事件的集体焦虑与伤痛回忆。
《我们与恶》是一部治愈人心的戏剧,但鲜少人知道这部神剧还有一位幕后功臣——资策会数位服务创新研究所(简称服创所)。服创所由副主任徐毓良与其团队,以大数据分析为《我们与恶》的前期剧本开发奠定良好基础,拓展整部戏的深度与广度。而擅长数据沟通的分析师又如何跟金钟编剧合作,才能碰撞出台湾史上首部拥有“数据力剧情”的佳作?
“目前我们所熟知的机器学习与算法有其僵固性,以致未必能够贴近人们的真实情感,因为人的决策很复杂”资策会首席执行官卓政宏对大数据能在艺文领域发光发热颇有感触:“但即便如此,在科技急速发展下,未来的一切都有可能发生,关键是要先能明确定义需求,才能产出真正有用的资讯!”
回到剧本上,一部剧要成功需具备三元素,冲突、观点、立场,三者缺一不可。好的编剧就是能将这三个元素巧妙安排在各桥段中。戏里面有一幕是法扶律师王赦拜访网络先驱报创办人刘昭国,王赦希望借助媒体的力量,一起找出李晓明会犯下如此重刑的原因。仅就这一幕,双方一来一回的对话中,就点出了戏里错综复杂的人物关系,也呈现出各个角色因立场分歧,对同件事情所持有的不同观点与引发的冲突。
找出冲突、观点、立场,帮助编剧在“无差别杀人事件”这个主题上进行框架设计与资料探索,就是 2016 年服创所与公视开始为期五个月的大数据剧本实验时,编剧与制作人所出的第一道功课。
(图片来源:公共电视)
资料探索,挖出事件、人物、议题
徐毓良在接到这项任务时,先利用编剧所提供的 5~10 个关键字,从社群网络爬梳大量文章,并借由自然语言处理(语意分析)清洗资料,筛选出新的关键字,再重复以上爬梳、清洗、删选等步骤,直到留下真正相关的资料为止。“使用的算法不难,但整个过程非常繁琐,因为抓下来的文章并没有统一的规范格式与标签,需要经由人工与程式反复地处理”,徐毓良坦言。
筛选后的资料再给定标签,分别归属于事件、人物、议题。事件的选定较简单,只选择与无差别杀人有关的事件,而人物与议题的标定则较为困难,必须参考相关的研究资料与主观经验判断,且因为无法用程式精准地判别,还需加上人力辅助。
最终徐毓良从一年份的资料中找出 16 个事件,筛选出 40 个分属四大类的关键人物,这四大类分别是加害人、被害人、专业人士、其他人物,其中加害人的描述是毒品前科犯、精障患者、预谋随机杀人犯,后两者也是编剧选用的角色。
在议题上则浓缩到 10 个,并从中整理出 200 个关键字。以“审判过程”这个议题为例,在建立标签架构后,除了从文字云、Facebook、PTT 等热门文章进行分析外,也从不同人物立场观点,针对有被留言与分享的文章进行分析,如此一来才能反应真实的讨论声音。透过文章分析,就能找到审判过程中会出现的角色与观点,像是加害者想要逃避死刑、检察官认为犯人没有悔意、法官说精障不能判死等。
这样的过程能帮助编剧找出隐藏讯息与专业术语。例如徐毓良从资料探勘中挖掘出以下文字,
“如果判死刑就是顺应民意,民意只听它想听的、看它想看的,但民意真的是对的吗?”
这段话出自小灯泡事件发生后嫌犯的辩护律师引用的日剧经典台词;而在《我们与恶》中,法扶律师王赦也曾用类似的话为死刑进行辩证。
(图片来源:公共电视)
从关键字孵出剧情对话
《我们与恶》这部戏令人耳目一新的是剧中出现许多有意思的关键字,徐毓良表示这些关键字能帮助编剧从中孵出剧情对话,更能支撑每个角色所需的观点,因此当他给出 200 个关键字时,编剧马上眼睛为之一亮,非常兴奋。
这些关键字包含:社会安全网、思觉失调症、教化可能、挪威、矫正署、联合国两公约等。“当分析结果出来时,尚未进入剧本编写过程,人物设定都还在初期阶段”,但两年后当《我们与恶》开播时,徐毓良惊喜地发现这些关键字出现在许多对话中。
例如剧中身为受害者家属也是媒体高层的宋乔安,就以
“挪威的社会福利这么好,还不是出了随机杀人犯。我们的社会安全网,我们的教育体制,永远控制不了那些加害者”
这段话,控诉对儿子遇害的无力感。
(图片来源:公共电视)
从资料找出冲突角色
《我们与恶》这部戏的张力十足,媒体在剧中所扮演的角色可说至为关键。徐毓良在分析数据时,发现许多冲突点都来自媒体,因此在他与编剧的会议时,汤昇荣制作人就建议纳入媒体观点立场进行分析,后续也加大了分析的程度。
“可能编剧那时候就有这样的想法,但或许我们的建议让他们加重了戏份”,对于这部分的贡献,徐毓良并不邀功,然而从许多观众的回响来看,媒体这条支线的表现非常真实且细腻,确实突破了台剧过去的套路。
除此之外,编剧也希望对一些议题能更深入了解,像是酸民现象。因此徐毓良利用爬虫将社群上的讨论声音抓下来分,并与新闻风向交叉比对分析,筛出一些讨论的文字,酸民也意外成为这部戏的亮点。
(图片来源:公共电视)
大数据在影剧产业的应用
“台湾剧本能成功多是因为天才编剧,但天才毕竟少见,美国近年也闹剧本荒,好的剧本不多见,但为什么还能屡有不错的戏?这是因为美国对编剧的训练已经有一套完整系统与脉络”。徐毓良表示台湾在编剧的训练上较欠缺这一块,未来若能有好的剧本引导开发工具也许能帮助编剧建立基础脉络,再辅以这次以大数据分析的方式,建立知识图谱、带出观点、建立相关人物脉络、发现潜在剧情、探索专业议题,“也就是让新手编剧能快速找到多元与冲突观点。”
资策会首席执行官卓政宏强调,“虽然大数据、人工智能看似无所不能,但人的需求才是推动整个社会前进的动力”。《我们与恶》这部戏为影视产业带来新气象,但如果当初合作时编剧没有说出需求、双方没有那么密切的互动,服创所空有资料也无法生出这些内容,而编剧也将错失可以发展的好点子。服创所提供的数据分析结果,不仅为编剧带出新的思考角度,也让剧情更具厚实度,达成制作人对这出戏的期望“做一出能够让大家讨论的戏”。
(首图来源:公共电视)