数据链接

数据链接(又称:「链接数据」、「键连数据」,英文: Linked Data)在计算 (计算机科学),是一种发布「结构化数据」链接的方法,使数据间彼此相互链接。同时通过语意查找.[1] 使链接的数据更为有用。数据链接技术以万维网 标准为主,例如HTTP资源描述架构(RDF)以及统一资源标志符(URIs)。「数据链接」主要提供机器与机器间,可自动交换的一种数据分享的方式。换言之,「数据链接」关联了数据(data)、常人(human)以及机器(machine)三者在知识呈现语意处理的共有课题。[2]

蒂姆·伯纳斯-李, 万维网协会(W3C)主席,在2006年一个与语意网计划有关的设计笔记中提出了"Linked Data"/「数据链接」这个名词。[3]

「数据链接」亦可以是开放数据的一种,在此脉络下通称为开放数据链接(Linked Open Data)。

主要原则

蒂姆·伯纳斯-李在2006年提出「数据链接」四大原则,2009年更简化为三大原则:

2006年的笔记中,蒂姆·伯纳斯-李提出「数据链接」的四大原则如下[3]:

  1. 使用统一资源标志符(URIs)命名(辨识)对象。
  2. 使用HTTP URIs,因此对象得以被查找(被解释/阐释(interpreted)与区分辨识(dereferenced)。
  3. 当对象被查找时,使用开放标准如RDF, SPARQL等,针对此命名之对象提供有用的信息。
  4. 当对象被发布时,使用以HTTP URI的命名方式来指称其他对象。

2009年在TED大会中,蒂姆·伯纳斯-李重申三大「极其简单」的「数据链接」原则如下:[4]

  1. 所有概念性的事务皆有以HTTP开始的命名
  2. 倘若我查找一个以HTTP命名的对象,我将会得到一个有用的标准化格式数据。此数据报含了与此对象相关的事物与事件的描述。
  3. 当我回到此信息时,此信息不仅包括某人的身高体重、出生时间,此信息还包括了关系。有此关系后,被相关的事务则被赋予以HTTP开始命名的名称。

主要元素

  • 统一资源标志符(URIs)
  • HTTP
  • 结构化数据使用以资源描述架构(RDF)串行化之格式如 RDFa, RDF/XML, N3, Turtle, 或JSON-LD控制语汇的词汇与数据定义。
  • 数据链接平台/(Linked Data Platform)

开放数据链接 (Linked Open Data)

开放数据链接开放数据的「数据链接」。[5][6][7] 蒂姆·伯纳斯-李清楚定义了「开放数据链接」与「数据链接」的不同:


「开放数据链接」(LOD) 是以开放授权发布的「数据链接」。此发布并不阻碍数据自由的再次使用。

——Tim Berners-Lee,Linked Data[3][8]

大量的「开放数据链接」数据集包括DBpediaWikidata

历史溯源

「开放数据链接」(LOD)这个词汇至少自2007年2月LOD邮件论坛创建时即开始使用。[9] [10]此邮件论坛是由麻省理工学院SIMILE计划主导。[11]

开放数据链接计划

2014 8月LOD数据及链接情形. 此图由2017年开始的Linked Open Data Cloud 计划制作。部分数据集可能包括可自由取得的版权数据。[12]
2017年2月发布,与上图比较2年半后的快速成长情形。.

W3C Semantic Web Education and Outreach group 的开放数据链接计划,目的是借由发布RDF格式的开放知识数据集,以及创建不同数据集中数据间的RDF链接,进而以data commons扩展万维网。2007年10月, 数据集包含超过由二百万相互链接的RDF links所链接的二十亿 RDF triples。[13][14] 至2011年9月则发展至5百零4万相互链接的RDF links所链接的三十亿个RDF triples。2014年发布详细的统计数据。[15]

欧盟计划

许多欧洲联盟计划均包含「数据链接」,例如: LATC计划、[16] PlanetData 计划、[17]、DaPaaS (Data-and-Platform-as-a-Service)计划[18]以及LOD2 计划[19][20]。而数据的链接也成为欧盟开放数据入口网促使千笔数据集开放使用与链接的主要目的。

数据集(Datasets)

  • DBpedia – 自维基百科截取数据的「开放数据链接」数据集。
  • GeoNames 页面存档备份,存于 - 「开放数据链接」全球地名数据库。
  • Wikidata – 维基媒体基金会于2012 年推动以数据知识库为主而成为维基百科的知识架构基础。

参考数据

  1. Bizer, Christian; Heath, Tom; Berners-Lee, Tim. (PDF) 5. 2009 [2018-10-23]. doi:10.4018/jswis.2009081901. (原始内容存档 (PDF)于2020-12-03). |journal=被忽略 (帮助); |number=被忽略 (帮助)
  2. Huang, Andrea Wei-Ching; Lee, Cheng-Jen; Chuang, Tyng-Ruey. 43. 2017 [2018-10-23]. doi:10.6245/JLIS.2017.431/722. (原始内容存档于2020-11-24). |journal=被忽略 (帮助); |number=被忽略 (帮助)
  3. Tim Berners-Lee. . Design Issues. W3C. 2006-07-27 [2010-12-18]. (原始内容存档于2019-05-23).
  4. . [2018-10-23]. (原始内容存档于2011-04-10).
  5. . [2018-10-23]. (原始内容存档于2015-11-18).
  6. . [2018-10-23]. (原始内容存档于2015-11-18).
  7. . [2018-10-23]. (原始内容存档于2021-05-05).
  8. . [2018-10-23]. (原始内容存档于2021-05-08).
  9. . [2018-10-23]. (原始内容存档于2021-04-17).
  10. . [2018-10-23]. (原始内容存档于2020-09-27).
  11. . [2018-10-23]. (原始内容存档于2016-01-21).
  12. Linking open data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/ 页面存档备份,存于
  13. . esw.w3.org. [22 March 2018]. (原始内容存档于2009-11-16).
  14. Fensel, Dieter; Facca, Federico Michele; Simperl, Elena; Ioan, Toma. . Springer. 2011: 99. ISBN 3642191924.
  15. Max. . linkeddatacatalog.dws.informatik.uni-mannheim.de. [22 March 2018]. (原始内容存档于2021-02-24).
  16. . latc-project.eu. [22 March 2018]. (原始内容存档于2018-09-19).
  17. . planet-data.eu. [22 March 2018]. (原始内容存档于2021-04-21).
  18. . project.dapaas.eu. [22 March 2018]. (原始内容存档于2020-12-18).
  19. . European Commission. 2010-04-20 [2018-10-23]. (原始内容存档于2012-09-05).
  20. (PDF). 2010-09-01 [2010-12-18]. (原始内容 (PDF)存档于2011-07-20).

延伸阅读

外部链接

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.