作者:Jason Kridner,德州仪器开放平台技术专家
因特网已经发生了巨变,从静态企业Web页面集合发展成了可即刻互动的Web。一场革命迫在眉睫,将会为人们带来使用模式和经济模型的转变。其背后的驱动因素就是新一类易于创建的用户友好型特定任务专用
电子产品,以及能够分析 Web 信息,迅速获得所需信息的设备。换句话说,设备可根据使用环境进行优化,从而产生总体上称作语境 Web 的创新产品与服务。
这类新产品与服务兴起的原因,是有必备的现成技术和提供因特网相关软件与服务的较低进入门槛两个因素共同作用的结果。在激烈的竞争中,靠技术起家的企业在激烈竞争中,不断参与到基于Web的服务的不断演进之中,并以此吸引用户,但许多企业却因为用户群已习惯于免费获取Web上的数据,无法产生收入来源而倒闭。新增一个硬件组件(信息家电)可实现完整的产品体验,让消费者感到购买它们物超所值。
消费者变成参与者
在最初的因特网繁荣期,信息一般是通过阅读Web页面或下载文件获取的,由运行给定网站的机构、公司或个人提供内容。用户享用的是单向服务,获得的是现成的信息。
几年前可供大量用户使用的互动式、参与式功能的出现,标志着向Web 2.0的重大转型。从这时起,用户就可在Web页面上进行双向交流,创建和共享内容。用户驱动型Web网站的典型实例包括YouTube、Facebook、MySpace、Wikipedia、Flickr以及Digg。在过去几年里,由于互动特性的增强,Web已经显著改变了人们与家人、朋友以及同事联系的方式。
尽管不同来源的数据量正在与日俱增,但用户仍继续在“围墙花园”中工作。“围墙花园”这一网络用语是指那些应用与信息的孤岛。例如,提供给社交网络Facebook的数据一般与提供给其它社交网站或专业网站的数据是隔离开的。用户对每个网站的管理都是分开的,登录进入私有数据、提供不同的“朋友”群体,并且一次只能访问一个站点的数据。
试图通过API来统一高墙隔离信息的努力正在受到服务提供商业务模式的限制,因为他们想控制用户界面的门户网站外观,以产生广告收入。更加独出心裁的方案是将广告稍微更醒目地放在内容中间,但对消费者有限注意力的根本性争夺实际上在消费者和对他们最有价值的信息之间形成了障碍。
目前,技术上已经可以实现那些有价值的数据在同样是内容创造者的用户之间实现自由共享。OpenStreetMap.org就是一个范例,可让消费者使用GPS日志及其Web浏览器的互动式会话对地图进行更新。随着时间的推移,其产生的数据便可提供一种有价值的资源,且无需将整个成本负担分摊给任何个人或机构。
信息家电可一方面可协助消费者对Web数据有所贡献,另一方面又让消费者能够充分利用Web上的数据。这种设备的重点是用户体验,可加速将有价值的数据创建到所提供的信息服务中。
语义Web
语义Web是用来拆除“围墙花园”高墙的根本性努力,支持所有信息的同步使用。今天,个人可以访问Web页面,迅速解读其内容,确定是否有感兴趣的信息。在查找普
通信息的时候,许多人不会耐心地在搜索引擎上完整地搜索每个Web网站,而只是查看最初的初始结果。由于只看最早的结果,消费者找到符合自己需求网站的概率受到了限制。现在这种情况已经可以避免,因为已经提供的基本技术可以让计算机按照预先确定的规范搜索整个Web,查找用户相关信息。
理想情况下,下一个重要步骤就是让网络作为一个大规模的应用运行,使其可在没有位置限制的条件下访问各种文本、影像、视频以及其它信息。这就是语义Web(也称为Web 3.0)的最终“梦想”,即Web上的所有内容有如存储在一个巨型数据库中,都可进行访问。在这一构想中,专业化搜索引擎、电子设备或电器不但可跨越所有Web站点理解所有内容,而且还能够以一种定制的用户友好型方式去分析和呈现所有在Web上散播的信息。
通过把所有因特网内容放入语义Web框架,可以让应用理解如何使用数据库条目提取信息,甚至可以使用访问控制来帮助用户排除剪切与拷贝信息等大量简单任务带来的困扰。当客户在MySpace、Facebook或者Flickr等社交Web网站上同步并发布您的相片时,所有符合条件的接收人无需使用特定的服务,便可按需收到通知和数据。并且这些照片无需手动点击下载,因为它集成了相应的照片管理应用技术。
值得一提的是,语义Web本身不是一种应用或一种物理设备;它是通过采用一套不断发展的规范所要表达的内容。它可帮助人们及设备在Web上查找和使用信息,但信息库和数据提取硬件或软件之间必须要有通用词汇。只有采用一致的词汇,才能搜索无限的资源,从而去帮助信息消费者 — 甚至机器把重点放在重要信息上,而不用去考虑它是何种来源或何种类型的素材。
通用词汇
那么为什么该语义Web的愿景还有待实现呢?最艰巨的任务是让Web出版商和信息消费应用或设备的开发商能够在共享的数据类型以及如何验证这些数据的接收人这两点上达成一致。
通用词汇这个难题是逐渐被认识到的。在当前基于HTML的Web文件中,表达信息以便机器读取的途径是有限的。为了进一步提高效率,设计了一种被称为资源描述框架属性 (RDFa) 的方案,它的特点是可一步到位的发布信息,从而淘汰了分两步的操作。有了RDFa,定制词汇在Web文件中就能够提供机器可读的数据。
RDFa方案已经在运行中。例如,雅虎近期推出了SearchMonkey工具集,开发人员便可用来创建通过Web页面提取和呈现数据的定制方法。
在RDFa的帮助下,雅虎SearchMonkey可理解多种不同的词汇,包括日历事件、联系人、地址、位置、评述、朋友、综合性更新以及简历等。此外,为了增强搜索结果的视觉外观,SearchMonkey还可帮助Yahoo!Search发现更为详细的内容,比如无需逐个访问求职和社交网站便可找到您周边众多具有RDFa体验的个人简历。通过使用SearchMonkey,开发人员和网站所有人可使用结构化数据让Yahoo! Search的结果更加实用,更具视觉吸引力,从而为其所属网站带来更大的相关访问流量。
通用词汇包含的不应该仅仅是数据,还应该包含如何验证接收人的方式。O Auth是一种应用可由用户给予访问许可,而不必与特定服务提供商绑定的协议。采用这种第三方验证方案,就不需要对所使用的每项业务进行分别登录。与其它方案不同,OAuth可针对具体确定启用哪些机器提供信息来验证身份与授权为用户提供相应的控制权。
尽管语义Web 、如RDFa等规范、实用词汇以及如OAuth等第三方验证方案综合起来预示着辉煌的前景,但要把愿景变为现实,还存在许多差距。要实现语义Web解决方案,需要花费大量的工作和时间来对Web页面进行重新编码,使之与RDFa兼容。如果没有通用词汇,就会导致一个更为严重的根本性问题,即语义Web理念不能为Web出版商带来让他们将其有价值内容进行广泛共享的充足积极性。这里涉及了一个根本性的激励因素,即经济激励。
语境Web
开发语义Web的经济动力来自于另一种信息采集和宣传的方式,即语境Web。它作为语义Web的扩展是由在特定使用案例环境中能够解决可用性需求的软硬件组成。语义Web的标准仍然适用于互操作性,但做了意义上的扩展。其目的是开发将Web服务与设备结合在一起的信息家电,从而通过用户友好型方式访问和生成信息。
语义Web带来的价值提取问题(即让RDFa信息为网站持有的数据增值,同时又在滤除支持性广告的情况下简化数据提取),可通过语境Web采用多种方式克服。正如前面所建议的,广告最好是放在内容中间,甚至是当作产品置入,或者直接放在来源素材中。
要实现这一愿景的关键在于添加专用硬件和使用开放式标准。虽然当前因特网的使用仍然以 PC机为中心,从某种程度上也围绕PDA或移动电话等其它通用设备,但是这个新愿景可将活动的中心转向一种全新类型的消费类电子设备。要实现信息共享,必须满足以下两项重要要求:网络连接和存储。这些虽然不必与PC机捆绑,但需要在用于特定目的的方便电器中实施。用户将继续为连接和存储付费,但有了语境Web,他们将会使用一种全新的付费方法。
语境Web是三大要素的结合:设备、信息和商业模式,这三者均建立在Web界面之上。专用电器经设计可执行非常具体的任务,消费者只需按几个按钮或选择几项菜单选项便可,而无需以传统方式登录Web。更值得一提的是,除了采集用户输入信息和提供结果,该机器将自动执行所有所需任务,从而可显著提高整体用户体验。
有了语境Web,门户网站不必再将其它数据源拒之门外,因为他们可充分刺激硬件收入。他们的门户网不但依然可通过Web访问,而且还将成为其硬件的广告,为其提供更加丰富高效的界面。
不符合语境Web扩展的现有服务将可继续运行,不会给语境Web硬件的购买者带来经济抑制因素。但是,与积极针对语境Web进行优化的业务相比,那些不扩展其接口的业务将不会那么受欢迎。
采集和呈现信息的新途径
该构想将产生新一类专门用于特定应用的消费类设备并最终实现简单、方便的用户体验。例如,食谱平板电脑可能会为厨师提供一个选择开胃菜、主菜或甜点的菜单,然后列出部分配料,并最终搜索Web上大量的食谱网站,而且只显示那些符合给定标准的网站。它不会只是一个连接相应Web的链路,而是直接可以显示食谱本身。这种浏览器式电器知道“我是一款食谱平板电脑,我只需要食谱信息”。这种设备进而还可显示您周边哪里可以买到与众不同的配料,或显示所需配料的打折地点。为了能够被显示在列表中,商店就必须确保其Web页面上的内容是机器可读的代码,从而可为其加入语义Web提供真正的经济激励。
下一步谈谈无线设备,比如山地远足GPS设备。它可识别徒步旅行者的位置,提取周边远足地图,提供路线建议以及之前徒步旅行者的评述,并显示附近的小屋、山顶的饭店或最近的公共交通,或者该电器开发商认为可以为该设备带来市场吸引力的其它相关信息。所有这些信息都可在Web上随时获得,但需要进行多次搜索。然而使用该设备的山地远足者,只需按几下按钮就可直接访问这些信息。
此外,还可以谈谈针对特定Web网站进行市场定位的设备。很快消费者就可买到标有“支持Flickr功能”的数字相框。只需进行几下触摸屏选择,相框便可搜索Flickr以及其它包含相片的Web网站,从而根据菜单选择将相片下载至相框本地存储器,然后开始显示相关内容。高级数字相框可能会进一步使用GPS采集的数据来提供相片拍摄时的地点,并将地图路径叠印在相片上。
许可管理
当采用机器可读格式分配信息时,许可标准就显得非常重要了。人们的行为方式在变,隐私概念也与过去大相径庭。社会正在努力解决因特网上的隐私问题,然而用户希望保持隐私的数据往往是公开的信息。例如,如果您拍了一张全家福,背景中的人有什么权利?在将该信息发布在Web上时,能否开发出一种面部识别软件来识别未知个人的位置、拍摄时间以及与其在一起的人?
最终消费者想要控制的是他们的数据,而并非拥有一种控制数据的Web业务。现在,有时需要用户为Web服务提供个人信息。但是如果可以选择,用户会选择不提供私人信息。当消费者想要确认他们通过社交网络网站联系的人是谁时,就需要第三方验证方案。
结束语
要开发这种概念性Web,开发人员必须解决一系列的问题,包括:这些新设备需要什么计算功能和存储?它们将运行什么操作系统?它们如何获得网络连接?设备将使用何种语言与多种业务进行互动?什么经济框架能够使其为消费者所接受?
但是,这些新系统的开发成本可通过使用建立在现有平台和硬件和模块上的标准Web技术来降低。能够以特定目的浏览Web的硬件/软件平台将会成为理想的开发平台。虽然启动概念Web应用与设备开发所必需的连接、存储及工具现已存在,当今最大的问题仍然是无论他们的Web知识层次如何,必须要有让该功能对各种消费群体产生吸引力的经济模式和用户体验。