没有他的发明,我们连嘲笑微软 IE 浏览器的机会都没有;没有他的发明,Google、Amazon、百度、阿里巴巴都不会存在;没有他的发明,你苹果手机的 Siri 可能比现在还蠢。
他是提姆‧伯纳斯─李(Tim Berners-Lee),英国电脑科学家,他的发明叫万维网(World Wide Web,WWW)。
伯纳斯─李不是像“乔布斯”这种如雷灌耳的名字,但关于他最有噱头的段子又极具 10 万标题的潜力:
“网络之父”本可辗压比尔盖兹成为世界首富,但他竟没有为发明申请专利!
假如申请发明专利,世界首富不是盖兹而是他!
如果他愿意,20 年前就能成为世界首富!
▲ 本文主角伯纳斯─李年轻时。
事实上,没有人是真正的“网络之父”,因为网络并不是单独一个人的发明,说伯纳斯─李是“万维网之父”较准确。伯纳斯─李没有申请专利,不是因为他没有意识到这个发明的价值,而是出于推广万维网的考量。
很多人分不清网络(Internet)和万维网(WWW)的区别,简单理解网络就是全球性,而万维网是我们上网时最常用的入口。举一个不太恰当但容易理解的比喻:
如果把网络当成城堡里的宝石,想拥有它必须从城门进入。你有很多门可选:HTTP 之门、FTP 之门、SMTP 之门……你不用弄懂这些神符一样的英文代表什么意思,只要知道代表万维网的“HTTP 之门”是门槛最低的门,且这道门的钥匙就是浏览器。
万维网还没发明前,网络也存在了很多年,但上网并不是件轻松愉快的事。那时人们透过拨打服务器号码上网,入口不是浏览器,没有网页、没有图片、更没有影片,只有下面这种一行文字资讯。
毫无疑问,万维网是伯纳斯─李最重要的发明,但他这辈子做过的事还有很多,比如成立万维网联盟、提出语义网、呼吁数据公开、成立社交网络数据平台,但都紧紧围绕同一个主题:打破“资讯、数据之墙”,促进开放互通。
诞生万维网的福地,是个看似和电脑没关系的地方
伯纳斯─李从小就是电脑迷,父母都曾参与世上第一台商业电脑“曼彻斯特‧马克一号”(Manchester Makr I)的设计研发,让他从小就对电脑知识耳濡目染。
1973~1976 年,他在牛津大学女王学院学习物理专业。大学期间,由于违反规定被禁止使用学校电脑,他自己动手用一台电视、一个摩托罗拉旧型微处理器(Motorola 6800)、一根焊接棒,拼成一台电脑。
1976 年大学毕业后,伯纳斯─李在不同公司担任程序员,但每份工作都持续不了多久。1980 年 6~12 月,伯纳斯─李以咨询顾问的身份,在欧洲核子研究中心从事软件工程工作。欧洲核子研究中心是物理界著名的研究所,也是发现“上帝粒子”(希格斯玻色子)的地方。
1980 年的欧洲核子研究中心,是一个资讯需要高频率交换,但又充满各种“资讯围墙”的地方:1 万人在这里来来往往,其中只有 3 千名左右是研究所员工,其余都是世界各地研究院的人员。他们使用不同电脑、不同网络、不同资料格式、不同档案系统。
身为软件工程师,伯纳斯─李需要帮助这些研究人员连上不同电脑,执行不同软件程式,在不同格式的档案中找到有关联的数据,这个过程“让人充满了挫败感”。
为了改变局面,伯纳斯─李打造了基于超文件的索引系统 Enquire,帮研究人员在不同电脑里迅速找到资讯,尽管只是单机程式,还有很大的局限性。
Enquire 的底层技术“超文件”,最早于 1963 年提出,1976 年发明后投入使用。超文件如今在网络随处可见,我们可为文字加上连结,点击后跳转到网页、档案或档案的某处。某种意义上,基于超文件的 Enquire 就是万维网的原型。
伯纳斯─李很快又离开了欧洲核子研究中心,加入一家电脑公司,参与远端网络呼叫设计,因而获得网络设计经验。1984 年,他以研究员身份重返欧洲核子研究中心工作。
为什么伯纳斯─李没有申请“万维网”的专利?
回到欧洲核子研究中心的伯纳斯─李,已具备了开发万维网的条件:超文件和网络设计经验、超强的执行能力、开放的思维方式,再加上欧洲核子原子中心这个天然实验场。
外部环境也已成熟:TCP/IP 协定、域名系统等底层技术逐渐完善,降低普通人上网门槛的需求也越来越强烈。
1989 年 3 月,伯纳斯─李萌生了将超文件系统和网络结合,创造一个全球性超文件连接网络的想法:
万维网需要的技术,例如超文件系统、互联网和多种字型的文字档案,都已设计出来了。我只需要结合它们……把现在的档案系统都想像成大型虚拟档案系统的一部分。
伯纳斯─李撰写了提案,交给主管迈克‧森道尔(Mike Sendall),后者并没有非常感兴趣,只在提案封面写了简评:不太明确,但令人激动……(Vague, but exciting…)18 个月后,迈克才允许伯纳斯─李兼职做提案,但只是抱着试试看的心态。
▲ 伯纳斯─李提案的封面,右上角有当时主管的评价。
伯纳斯─李很快开始动手写程式,到 1990 年圣诞,他基本上定义了 Web 的基本概念:HTTP(超文字传输安全协定)、HTML(超文件标示语言)、URL(统一资源定位符)。你不用了解这 3 个名词的技术如何达成,只需要知道:
- HTTP 超文字传输安全协定:负责传送资讯。
- HTML 超文件标示语言:负责在网页显示资讯。
- URL 统一资源定位符:负责给每个网页一个位址,方便你找到它。
这 3 样东西结合起来,塑造了我们今天习以为常的上网方式:在位址栏输入网页位址,便能转到相应网页;如果该档案有超连接,还能点击它跳转。相互有关的资讯透过“点击─跳转”连起来了。
1991 年 8 月,伯纳斯─李开放他发明的第一个网页浏览器,并上线世界第一个网页:http://info.cern.ch/。
这个网页非常简单,抬头 3 个大字:World Wide Web。手稿介绍万维网是什么、所用的技术、参与计划的人、计划的历史等。
▲ 世上第一个网页。
值得一提的是,万维网计划参与者中,名为罗伯特·卡里奥(Robert Cailliau)的资讯工程师长期使用 Hypercard,这是苹果 1987 年发表、2004 年关停的超文件系统,透过卡里奥间接影响了万维网的设计。
▲ 苹果电脑以前的超文件系统 Hypercard。
万维网发明后,伯纳斯─李并没有申请专利,因为他很清楚,“开放”是万维网普及的前提,“你无法计划做一个宇宙一样大的空间,同时保持控制”。
万维网开放大众的 1991 年,同时诞生的还有明尼苏达大学的 Gopher。Gopher 在后来和万维网的竞争中落败,部分原因就是收费策略。
事实上,伯纳斯─李确实曾考虑为自己的发明申请专利,但不是万维网而是浏览器。最后,他还是因为自己“开放互联”的价值观放弃了这做法。
“几百万人突然发现万维网可能比性爱还棒”
诞生头两年,万维网并没有多少人用。不管伯纳斯─李怎么努力推广,每天只有 10~100 次点击率,就连技术社群也不接纳万维网。
他将万维网相关论文提交给超文件社群 Hypertext’91,但被拒绝了。万维网在他们看来太简单了,且违背社群规则。
当时,超文件社群的信仰是,连结不应指向不存在或已移除的档案,因此当时其他一些超文件系统都约束在一个单独、孤立的资料程式库里。
而万维网是全球性的开放系统,如果某个服务器坏了或某个档案(网页)被移除,连结就成了坏链。万维网的开放性在超文件社群看来,反而成了亵渎信仰。
改变出现在 1993 年,这一年 Mosaic 浏览器问世。Mosaic 浏览器是第一个可在文字中插入图片,而不是在单独网页显示图片的浏览器。它支援万维网、Gopher 等多个网络标准,且拥有友善的用户界面、简易的安装步骤、可靠的效能。
▲ Mosaic 浏览器。
Mosaic 浏览器发表时,市面有好几个竞争者如 Erwise、ViolaWWW、MidasWWW 和 tkWWW,但种种特徴使它脱颖而出、大受欢迎,并带动万维网流行,“几百万人突然发现万维网可能比性爱还棒”。
万维网真正使网络由少数精英使用的资讯传送管道,变成全世界共用的资讯共用平台。1993 年后,越来越多公司开始在万维网的基础上提供服务、做生意,万维网重塑世界经济的故事不必再述。
万维网影响力逐步增加同时,伯纳斯─李也获得了肯定:2004 年获得大英帝国爵士级司令勋章、2017 年获得电脑科学领域最负盛名的奖项──图灵奖。
对任何人来说,取得如此成就已可躺在功劳簿上睡大觉,但伯纳斯─李真是闲不下来,他对网络的贡献远不止万维网这个发明。
苹果手机的 Siri,也得益于伯纳斯─李的工作
伯纳斯─李 1989 年的提案中,万维网“不仅是文件档的网络,也是知识的网络”。
万维网首先透过超文件连结做到档案(网页)互连,到了 1998 年,伯纳斯─李正式将“知识网络”的构想命名为语义网(Semantic Web),并将工作重心放在推广语义网。
语义网是万维网的变革和延伸,目的是让电脑也能像人类一样了解网页内容。
比如,人们看到网络天气预报,会知道哪个数字是温度,哪个是湿度。语义网的目的就要透过隐藏的编码,告诉电脑哪个数字代表温度,哪个数字代表湿度,并说明 “温度” 和“湿度”的含义。
2006 年,语义网发展到了瓶颈,需要大量结构化的公开资料,伯纳斯─李提出互联资料(Linked Data)的概念,还在 2009 年 TED 大会呼吁政府和机构公开原始数据(Raw Data)。同年,白宫成立一个网站 Data.gov,要求所有部门都要有公开资料。
大量资料公开后,有机构将资料结构化,这些结构化的互联数据库默默影响着人工智能的发展。
2011 年,IBM 的人工智能 Watson 在美国电视智力竞赛节目《危险边缘》(Jeopardy!)击败人类选手,获得百万美元大奖,就是采用 DBpedia(维基百科的结构化资料程式库)、YAGO(整合 Wikipedia、WordNet 和 GeoNames 三个来源的资料程式库)等成果。
2012 年,Google 收购一家做结构化资料的公司 Metaweb,于后者资料程式库 Freebase 的基础上发起知识图谱(Knowledge Graph)计划。苹果的 Siri,也是脱胎于基于语义网的计划 CALO(Cognitive Assistant that Learns and Organizes)。
▲ 右侧红框圈起来的就是语义网应用。(Source:网络截图)
一个账号登入所有应用,不怕应用倒闭的新平台
尽管伯纳斯─李一直推动网络往开放方向发展,但“数据围墙”现象还是以另一种形式重现:科技公司借免费服务将用户控制在自己的应用产品内,用户的资料分散在各平台,更无力保护隐私。
矛盾最近几年集中爆发,标志性事件莫过于今年 Facebook 爆出 2016 年时保护隐私不力,让剑桥分析公司未经授权存取 5 千万用户资料。社会开始出现批评科技公司、将数据还给用户的声音。
在这时间点,伯纳斯─李的新计划恰逢其时。2018 年 9 月 29 日,他发表一篇名为《网络的一小步……》文章,宣布成立基于 Solid 平台的新创公司 Inrupt。
2015 年,伯纳斯─李就在麻省理工启动 Solid 计划。Solid 全称为社交互联资料(Social Linked Data),是一个去中心化的社交平台,基于 2006 年提出的互联资料技术和规格。
现在我们使用社交平台的现状是,Google 有账号、Facebook 有账号、Twitter 有账号、Instagram 有账号,此外可能还有微信、QQ、微博等。每个账号的资料都独立存在营运方的服务器,互不相通。
这有两个显而易见的弊端:1. 用户资料掌握在营运方手里,有被滥用的可能;2. 如果营运方经营不善或关停服务,那用户在这个社交平台的资料也付诸流水。Path 和 Google+ 关停,就是最好的例子。
Solid 的解决方案把用户资料和应用分开,让用户集中自己的资料,称之为“个人线上资料”(Personal Online Data,简称 POD)。然后,将 POD 存在自己建的服务器,或受信任的个人线上资料商(Personal Online Data Stores,简称 PODS)。
用户会有一个 Web ID,可登陆所有基于 Solid 平台的应用,用户能自己控制给哪个应用多少资讯。
目前,Solid 平台还处于原型阶段,主要针对开发者。伯纳斯─李用 Solid 平台的技术打造一款自己使用的应用,一家外媒看过后评价:
这款应用程序使用 Solid 的去中心化技术,允许伯纳斯─李无缝存取他的所有资料──行事历、音乐、影片、聊天纪录、研究。它就像 Google Drive、Microsoft Outlook、Slack、Spotify 和 WhatsApp 的混合体。
至于 Inrupt,是帮助 Solid 平台成长的新创公司。Inrupt 之于 Solid,好比 Mosaic 浏览器之于万维网,是领路人角色。伯纳斯─李希望 Inrupt 能为 Solid 带来“生态系统”,其中的市场机会包括 Solid App 和 Solid 资料储存等。
伯纳斯─李已向麻省理工学院请长假,专心在开发者群体推广 Solid 和 Inrupt。这是他又一次转变工作重心。过去,伯纳斯─李一直致力透过万维网、语义网网络公开资讯,现在他尝试透过 Solid 来连结个人资讯、解决科技大公司垄断用户数据的问题。
这不是短期内可看到成效的专案:社交巨头和网络公司不会将用户账号数据拱手相让,使用户个体自发迁移也需要极大的教育成本。但正如万维网刚诞生时没人关注,谁也不知道 Solid 会不会成为下一棵参天大树。
(本文由 PingWest 授权转载;首图来源:Flickr/Open Data Institute CC BY 2.0)