正当大家关注候选人国外学历没有经过学历认证程序,导致无法出现在选举公报学历字段,吵得不可开交的时候,主角正巧是曾参与开放资料政策、时任行政院科技政委、副总统候选人张善政成为话题焦点。但更重要的问题是,为何在数字化时代,无法拿到数位资料,还得用人工打字或是 OCR 方式,取得候选人的学经历、政见电子档呢?
选战倒数时刻,协助候选人竞选的团队成员,来到 g0v.tw 后勤中心社团请求协助,她询问是否有办法将中选会释出的含有候选人政见的选举公报 PDF 档案,用机器可读方式整理出来。她的团队需要有格式化数字化的资料,才能减少制作文宣的复杂度,不然就得用人工方式一个个复制贴上,甚至是重新打字处理了。
洪委员的求救请求协助的讯息,吸引不少人讨论,例如长期关注开放资料的人,像是在 OpenData Taiwan Facebook 社团当中,开放文化基金会法制顾问,行政院开放资料咨询委员林诚夏,就总结先前中选会在开放资料做的事情,认为中选会曾接受过补助做资料开放的示范专案,但仍在 2020 年选举时候,释出无法机读的 PDF 格式档案,他认为中选会的开放资料咨询委员应该总结状况后能做出改善。
林诚夏在讨论区当中的评论引起一阵讨论,因为除了-定时释出的统计性质资料,选举资料是开放-资料当中的重点资料,而且在各界努力之下,过往的选举资料,例如候选人的基本资料,或是最终投票数,都有建置数据库。但问题如今是最新选举的资料,能否即时获得程式能够读取的资料格式。
▲ 中选会因应网络阅读查阅资料制作的电子选举公告,比起纸本版本少了政见资料,不过每一组候选人都有独立连结,符合开放资料标准当中的连结资料要求。(Source:中选会)
2018 年地方县市长与议员选举时,中选会首次开放候选人能上传图片到选举公报当中。文字排版,还有放图片,甚至加上 QRCode,让有兴趣的人连到候选人的网站,动态接收候选人想要传达的政见。只是对于想要用机器爬取候选人政见的人来说,为了排版方便而用图档处理,是可以理解的,但对于机器处理来说,就很痛苦了,无法轻易进行后续的分析再利用了。
▲ 不少关心选举资料的人,决定自力救济共同编辑线上版的选举公告,处理无法第一时间拿到机器可读资料的问题。(Source:2020 选举公报)
同样在 2018 年,中选会首创数位选举公报,只是内容上面不及实体选举公报,并没有放上候选人的政见资料,只有列出候选人性别、出生年月日、号次、选区、代表政党。
有人关注选举公报是否是机器可读的,也有人关心选举公报是否具备足够亲和力,是否满足各式障碍者的需求,例如视障者需求。具有听力师资格,台湾网络早期活跃的部落客 Jedi Lin,就检视 PDF 版选举公告,还有语音版本公告情形。Jedi 检视 PDF 发现多项亲和性缺失状况,并将中选会推出的语音版选举公告,比喻成像是听 CD,必须从头到尾聆听,而无法跳到有兴趣的候选人段落,方便性来说打了些折扣。
▲ 2018 年选举黄宏成台湾阿成世界伟人财神总统在政见栏放上钞票,2020 年大选则是传单资讯放到政见栏当中。(Source:中选会)
实体的选举公报会登载什么内容有其长期的历史因素,进入数位时代出现新的需求,是再自然不过的事情,而且有逐步改善的空间。选举公报除了传统文字资料,还要容纳像是图档、语音等越来越多样形态的资料,不再只有纯文字资料。如何让机器更容易读取这些资料,是关心选举还有开放-资料的人,能跟-建言和研拟适合的做法。
- 总统选举公报竟然没有“政见栏”:一段冲撞、台独、与电视机交织而成的故事
- 选举公报首度解禁可放图片,22县市长候选人政见比一比
(2020-01-04 12:23:更正在 g0v 后勤中心询问选举公报未提供机读格式相关问题发文者资讯)
(首图来源:pxhere, CC0)