由学术界力量举办的“第二届开放资料研讨会”,没有常见到的工业局、国发会,执行单位台北市电脑公会的身影。11/ 14 的这次研讨会呈现不同于政府机关和社群力量举行的活动样貌,成为学术小论文发表的场域。第一届的开放资料研讨会在圆山饭店,这次是直接在大学校园的教室或会议室举行,很学术性。
相比 g0v 年会的激列言辞争论,这边参与开放资料论坛的火花小多了,言辞温和多了。TonyQ 听打的 逐字稿记录各方的发言。
小论文发表场
虽然这次以学生的小论文为主,但也有令人惊艳的场子。网络行动创办人之一,Charles Chuang 以他社群的身份和参与的案子的经验,回顾台湾开放资料两年来的发展。Charles 曾在台北市的资料平台上线后,将一些地理性资料用 Google Fusion Table 处理呈现。由于 Charles 曾投标资料平台建置案,所以统计各机关资料平台是怎么架设的,用 Open Source 的 CKAN 或是 DKAN 占少数,而手刻自行撰写的居多。他也提醒关于开放资料的推动,要少说多做才行。
赋权与资料品质
而下午场次有高雄大学资管所的研究生叶昱琦,从他们的学术背景看开放资料政策,着重在如何让公民赋权。叶同学在发表时表示资料拿下来,公民团体常常会遇到不知道怎么运用问题。政府方面则是不知道怎么拿资料与民众互动。在台湾开放资料的推广,g0v.tw 台湾零时政府社群扮演很重要的角色,爬资料做出视觉化呈现,让不少感到惊奇赞叹。这篇论文发表与 g0v.tw 的行动遥相呼应,g0v.tw 其实做的就是赋权。
▲ 高雄大学资管所叶昱琦从赋权的角度看开放资料
而叶同学的老师林杏子则评比资料平台上的资料品质,锁定中央和地方的平台的资料。由于资料平台上有不同资料种类,所以针对医疗院所资料评比。评比采用的标准,有用到 Tim Berners-lee 的五颗星标准,评比连结资料格式标准。资料品质则用 Wang and Strong 的资料品质衡量指标。结果发现台湾的开放资料集从 2014 年 4/5 至 10/21 之间,成长率达 164.45%,资料集的星度则大都有二颗到三颗等。
▲ 高雄大学林杏子老师
社群资料的群众意识探讨
Gene Hong 食梦黑貘在多个场合谈他最有名的作品林克传说,处理社交资料来找出群众意识。Gene 虽然处理的资料来源是社群网站用户授权得来的,让我们一窥开放资料蓬勃发展后可能的资料分析潜能。
▲ Gene 谈他的作品是怎么做的
彼此相关的议题该各自谈清楚
开放资料的相关会议或研讨会,常常会看到隐私资料的讨论。这次不例外有“我国开放健康资料法制研究-由个资法修正与行政法院判决分析”,谈论个资法修法造成的影响。隐私资料一般在谈开放资料不大会放在一起,因为那是另一个大议题,牵涉甚大,而且有可能会侵犯到个人隐私。台湾的健保数据库运用,就在这一次会议不时会讨论,看中其资料数量还有完整性。先前几个开放资料的场合常常会谈到 big data 或是隐私资料,他们与开放资料有相关,像是开放资料的数量大就有可能算是 big data,隐私资料的处理技术也能处理开放资料或是 big data。但各自是大议题,不应混为一谈。
另一个面向的讨论,则是隐私资料几乎是人人有关,不相信庙堂之上的讨论就能让大部分人满意,或者能够代表多数人的意见。
由于议程关系,有些讲题会有其他有趣的题目冲到。像是高雄大学萧汉威老师谈 UAV 飞行器,全部用开源方案开发。有兴趣的人可以看他先前在台湾开放街图社群 webinar 的演讲。
2014 年的年底,有不少的开放资料活动,从 2012 年到现在,台湾开放资料政策的推广也两年时间。两年的时间政府做了不少事情,但有不少很瞎的事情,像是实价登录资料事件。各位觉得台湾开放资料的推动如何?有什么惊喜?有什么需改进的地方?