10:13 AM Tuesday, December 20, 2005

Google Base与科学家数据共享

下面是Nature 11月份上一篇新闻报道的翻译,Google的数据库遍布世界各地,Google Base让人们联想到Semantic web,而这两者加起来又让人们联想到“数据网格”,也许Google将是数据网格被普通人使用的开始. 原文标题和地址:Google Makes data free to all Google在上星期启动了它的一项新服务——Google Base。它允许任何人免费上载文件到Google服务器,使得数据立即可以被检索。虽然这项服务主要定位是在线市场:比如工作和居家,科学家们说这项服务也蕴含了巨大的针对科学数据进行共享的潜力,并且可能使得整个Web变得更加具备“智能”性。 Google Base允许用户上载数据,并允许用户用简单的标签来描述数据,其他人可以在搜索中使用这些标签。它还让用户随时增加字段,以让这些非结构化的数据变为结构化的数据。一个包含一篇科学文章的网页也许会利用“作者”、“期刊”、“出版物”或者其他关于文章的元数据信息的字段。 这也许听起来并不是一项复杂的技术。但是鼓吹者认为它使得Web内容在整体上变为结构化的数据库。它开始使得科学家们共享数据、以便于搜索的形式存储数据变得更简单。 David Haussler(加利福尼亚大学生物科学与工程中心的director)说,在共享数据方面,科学家们仍处在一个“黑暗的时代”。那些存在于基因序列、蛋白质结构、天文数据等几个相对很少的大型世界级数据库之外的数据,最终以附随期刊文章的辅助表格的形式从这个世界上消失。他说,“它们以不可索引、不一致、不方便的形式存储,如果说它们真的被保存的话”。 网格概念的创始人Ian Foster说,Google Base或者类似的服务或许能够发挥它的作用。在“网格”中,很多计算机协同起来提供大量的处理能力和数据存储能力。Ian Foster认为,科学研究急需一些能够使得个人、团体创建和共享数据以及处理这些数据的程序变得更容易的东西。 提供一种简单地能够交互检查多种类、多来源数据的途径能够给科学研究带来真正的实惠,来自明尼苏达州大学生物信息学的Paul Myers说,“我认为Google在这方面是超前的,这个工具的重要性将会变得不可估量”。 Smart Systems(智能系统) Google Base也许还意味着是Web向智能网络前进的一个低调谨慎的开始。Web向智能网络发展的思想最初是由Web的创始人Tim Berners-Lee于1989年在欧洲高性能粒子物理实验室CERN提出的。 网页的设计只是为了方便人的阅读,并不包含那些计算机能够处理的附加描述信息。这种设计思想限制了它们的用处,尤其是对那些搜索网页的用户来说。例如,现在我们不能够通过Web搜索“关于蛋白质CCR5激活PYK2实验的,并被同行评论的论文”。当我们在线阅读论文时,不能够让计算机重新画一个概念图以包含一些额外的数据集。 Berners-Lee倡导一种被称为“Semantic Web(语义网)”的东西,它将网页加上标签,从而使得计算机能够理解网页的内容。这意味着计算机能够询问那些网页上的数据是否满足一定的条件,以及从不同的数据源进行数据的融合。 但是,虽然语义网在生物信息学等一些专门的领域很快建立了基础,它仍然没有广泛地推行。科学家们认为,Google Base能够改变这种局面,因为它能够将大量结构化的网页聚集起来。“最大的问题在于这样的服务是否能够对引导语义网起到作用”,Greg Tyrelle,台湾Chang Guan大学的一位生物信息科学家说。 Google power “对包括科学数据在内的任意的数据进行在线的灵活存储,是近两年一个主要的研究领域”,Leigh Dodds,Ingenta出版社的一个Web专家认为。“Google Base将其扩展到每个人,使得这项研究推进了一大步”,虽然他还说希望看到政府、大学也推动类似的服务,而不是只留给Google来作。 但是,科学家指出,Google在W3C 组织关于Semantic Web标准制定工作方面的缺席是突出的。他们还承认,和那些专业的数据库,比如GenBank, UniProt等比起来,现在Google Base服务还是相当粗糙的。你所能做的只是发布信息,搜索信息,它没有提供对这些数据实行抽取、计算的途径。 但很多研究者相信这种情况很快就会改变。Google已经对其他的服务公开了其API接口,同样,对Google Base 服务也不会例外。它将允许任何人写可以访问Google数据库的程序,将Google数据库中的数据同其他数据混合、匹配,以创造出完全不同的新产品。 “如果Google 意图将Google Base变为不再仅仅是一个查询信息的工具,而是供科学家发现数据的东西,更多的工作需要去做。”耶鲁大学生物信息学科学家Mark Gernstein说。 但是根据Foster的观察,这样的进程将会很快发生。“Google 有很多相关技术和专家,如果它组建了合适的团队并投入足够的资源,就一定能产生巨大的影响”。 “Google Base现在看起来还有点简单,而且还不清楚怎样去接入Google power,但是这毕竟已经开始了”,Myers说。 translated by Jacquette

Sent using R|mail.

通告:本站点(http://gwebread.blogspot.com)的内容系由Feeds订阅自动生成,本站不拥有任何权利,建议您通过点击文末的链接浏览原文,以获得更好的阅读体验。鉴于此处仅供个人阅读使用,恕不发送引用通告。若您拥有被订阅feeds中某些内容的权利,且不想此内容在本站发布,请留言告知。

Trackback URL: http://www.haloscan.com/tb/geneboy/113504480014082805/