Google图书
Google图书(英语:)是一个由Google研发的搜索工具,它可以自Google所扫描、经由光学字符识别(OCR)、保存的数字化数据库中搜索数据。此服务于2004年10月在法兰克福书展发布,命名为Google Print。当用户使用关键字搜索,Google图书搜索的结果索引会显示在Google网络搜索服务的上方。用户还可以在Google图书搜索搜索书籍。点击Google图书搜索的结果索引打开页面,使用户可以查看书籍中的页面以及内容相关的广告,链接到出版商的网站和书店。Google以限制网页的浏览数量,来阻止书籍被打印和保护文本内容的拷贝版权,并追踪用户使用记录,作为通过各种准入限制和保障措施的依据。[1]
![]() | |
网站类型 | 数字图书馆 |
---|---|
持有者 | |
网址 | |
推出时间 | 2004年10月 |
现状 | 营运中 |
Google图书搜索允许公有领域的作品和内容,免费全文浏览,并提供PDF的格式下载。对于在美国境外的用户,Google必须确保其没有触犯到用户所在国家的法律,根据Google图书搜索支持小组的成员说法:「一本书是否属于公有领域往往是一个棘手的法律问题,我们会谨慎处理,直到我们确定本书已进入公有领域。」[2]
关于扫描方面,许多书籍使用Elphel 323相机扫描,这种相机每小时可以照1,000页。[3]
而Google的这个计划受到极大称赞,因为它可能成为前所未有、全球最大的网上主体的人类知识,[4][5]但它仍有着有关侵犯版权上的批评。[6]
扫描数量
Google曾表示,他们目前一天可扫描三千本书籍。到2007年3月为止,Google已经数字化100万本图书。Google拒绝透露项目开支,但《纽约时报》在2008年时估算其花费了约500万美元。[8]在2008年10月28日Google说,通过此项服务,他们有700万本的图书被搜索,其中包括扫描的20,000个出版商的合作伙伴[9]。在这700万册图书当中,有100万本在出版商正式授权下提供“完全预览”服务,另外100万属于在公有领域,其余500万是绝版或商用。[10]
竞争
时间表
2004
2005
- 九月至十月间:两起对Google提出的诉讼控诉Google公司不尊重版权,未能妥善补偿作者及出版商。其一是集体作者诉讼代表(作家协会Authors Guild控诉Google,2005年9月20日);另一是五个大型出版商和美国出版商协会Association of American Publishers控诉的民事诉讼(McGraw Hill 控诉Google,2005年10月19日。)[6]
- 十一月:Google将Google Print正式改名为Google图书搜索。[14]这个方案使出版商、作者及他们在此服务中的书籍改了名,称为“Google Books Partner Program”(见Google Library Partners (页面存档备份,存于)),并且与图书馆的合作关系就成为了Google图书馆计划。
2006
2007
- 一月:得克萨斯州大学奥斯汀分校宣布将加入图书搜索数字化计划。至少有一万册数字化将是由该大学的13个图书馆定位。
- 三月:巴伐利亚州图书馆宣布与Google创建合作伙伴关系,来扫描超过100万份在公共领域,和绝版的德语以及英语、法语、意大利语、拉丁语和西班牙语作品。[17]
- 五月:一本数字化计划的书,被公告为Google及县立、洛桑大学图书馆所纳入。[18]
- 五月:根特大学的Boekentoren图书馆,将参与Google图书数字化计划,且将把19世纪的图书制成法国和荷兰的语言并上线。[19]
- 六月:合作委员会(Committee on Institutional Cooperation)宣布,其12个成员图书馆未来六年将参与扫描1,000万本书。[20]
- 七月:庆应义塾大学成为Google在日本的第一个图书馆合作伙伴,他们将数字化至少12万本公共领域的书籍。[21]
- 八月:Google宣布,它将数字化达50万本有版权的书籍,也将数字化在康奈尔大学图书馆的公共领域书籍。Google还将提供一个系统,可将数字化拷贝的所有作品扫描并纳入大学自己的图书馆。[22]
- 九月:Google添加功能,允许用户在公共领域共享片段的书籍。
- 九月:Google推出一项新功能,名为“我的图书馆”,允许用户创建个人化的图书馆。他们可以运用标签、审查、利率、或全文检索来选择图书。[23]
- 十二月:美国哥伦比亚大学成为数字化公共领域的伙伴。[24]
Google图书计划参与者

参与计划的成员人数自Google图书馆计划实行之初已成长许多[13];迈索尔大学在许多媒体的报导都提到其为此计划之合作伙伴,[27][28]但他们实际上并没有被Google列为合作伙伴。[29]
首批参与者
- 哈佛大学,哈佛大学图书馆,Harvard + Google (页面存档备份,存于)
- 密西根大学,密西根大学图书馆,Michigan + Google (页面存档备份,存于)
- 纽约公共图书馆,New York Public Library + Google (页面存档备份,存于)
- 牛津大学,博德利图书馆,Oxford + Google (页面存档备份,存于)
- 史丹佛大学,Stanford University Libraries(SULAIR), Stanford + Google
后期加入参与者
- 巴伐利亚国家图书馆,Bavaria + Google,Bayerische Staatsbibliothek + Google (in German)
- 哥伦比亚大学,Columbia University Library System,Columbia + Google (页面存档备份,存于)
- Committee on Institutional Cooperation,CIC + Google
- 马德里康普顿斯大学,Madrid + Google,Complutense Universidad + Google (in Spanish)
- 康乃尔大学,Cornell University Library,Cornell + Google (页面存档备份,存于)
- 根特大学,Ghent University Library/Boekentoren,Ghent/Gent + Google
- 庆应义塾大学,Keio Media Centers (Libraries),Keio + Google (in English),Keio + Google (in Japanese)
- 普林斯顿大学,Princeton University Library,Princeton + Google (页面存档备份,存于)
- 加利福尼亚大学,California Digital Library,California + Google
- 洛桑大学(), Cantonal and University Library of Lausanne/Bibliothèque Cantonale et Universitaire/BCU + Google (in French)
- University of Mysore,Mysore University Library,Mysore + Google (页面存档备份,存于)
- 德克萨斯州大学奥斯汀分校,,Texas + Google
- 维吉尼亚大学,,Virginia + Google
- 威斯康星大学麦迪逊分校,,Wisconsin + Google
争议
违反著作权、合理使用等争议
出版业与作家协会批评该计划列入片段的作品是侵犯版权的行为。2005年秋季,作家协会和美国出版商协会分别控诉Google。Google反驳说,该计划的每个项目皆是合理使用,并且在这数字时代,每一个字都有对应到其出版索引。[6]2006年6月,在诉讼之后,法国出版商宣布它打算控诉法国Google。[30]2006年底,德国控诉被撤回。[31]
2007年3月,Google被告侵犯著作权法的图书搜索服务。微软的副总兼法律顾问托马斯·鲁宾(Thomas Rubin)批评Google一再任意拷贝作品,并且总是直到有人出面指证才会停手。[32]2008年11月28日,作家协会、出版界和Google签订了和解协议,Google同意支付总共1.25亿美元,包括诉讼费用及创建图书权登记处。该解决方案将在2009年5月得到法院的批准。[6]解决的反应有好有坏,其中一个与Google合作的图书馆表示,如果Google无法找到“更合理的条款”,它会选择撤回与其合作的关系。[33]
弗吉尼亚大学的副教授Siva Vaidhyanathan,以法律观点研究一已出版的见解[34],之后他指出Google该计划构成了危险的理论——合理使用,因为索赔的使用其实是不合理的,它可能会导致司法限制这一权利。[35]而之后作家协会控诉Google没有去法院,导致合理使用争端得不到解决方案。
Google许可的公有领域作品也是一个令人关注的议题。[36]一些出版作业是在公有领域进行的,例如美国联邦政府创造的所有作品,但那些作品仍被视如其他版权保护的作品般对待,导致它们在1922年之后遭禁。[37]
Google图书与Google学术搜索
当Google图书大量扫描一些过期学报、杂志时产生了一个问题,就是其扫描时并没有办法将元数据(metadata)也一并扫入。这使得Google学术搜索只好开办自己的数字化计划,并放置认同这个计划的出版社的过期期刊文章。[39]
参考文献
- Greg Duffy. . Kuro5hin. March 2005 [2008-12-04]. (原始内容存档于2021-01-26).
- Ryan Sands. (blog). Inside Google Book Search. 2006年11月9日 [2008-12-04]. (原始内容存档于2011-07-21).
- Kelly, Kevin. . New York Times Magazine. 2006年5月14日 [2008-03-07]. (原始内容存档于2021-01-25).
When Google announced in December 2004 that it would digitally scan the books of five major research libraries to make their contents searchable, the promise of a universal library was resurrected. ... From the days of Sumerian clay tablets till now, humans have "published" at least 32 million books, 750 million articles and essays, 25 million songs, 500 million images, 500,000 movies, 3 million videos, TV shows and short films and 100 billion public Web pages.
- Bergquist, Kevin. . The University Record (University of Michigan). 2006年2月13日 [2007-04-11]. (原始内容存档于2007-10-12).
- Pace, Andrew K. . American Libraries. American Library Association. January 2006 [2007-04-11]. (原始内容存档于2007-04-03).
Google made instant e-book believers out of skeptics even though 10 years of e-book evangelism among librarians had barely made progress.
- Copyright infringement suits against Google and their settlement: The original lawsuits in 2005:
- Dyson, George. . Knopf Doubleday Publishing Group. 2012: 312–313 [2020-10-18]. ISBN 978-0-307-90706-6. (原始内容存档于2020-11-14) (英语).
- Hafner, Katie. . New York Times. March 10, 2007 [2008-04-10]. (原始内容存档于2020-11-22).
Google, on its own, is digitizing books at the Library of Congress, which has its hands full with other items. ... In its quest to scan every one of the tens of millions of books ever published, Google has already digitized one million volumes. Google refuses to say how much it has spent on the venture so far, but outside experts estimate the figure at at least US$5 million. The company has also been scanning and indexing academic journals to make them searchable, and is working with the Patent Office to digitize thousands of patents dating back to 1790.
- . Google. [2008-10-29]. (原始内容存档于2020-11-09).
- . PC World. October 28, 2008 [2008-10-31]. (原始内容存档于2011-12-29).
Of the 7 million books Google has scanned, 1 million are in full preview mode as part of formal publisher agreements. Another 1 million are public domain works.
- . AFP. [2008-11-24]. (原始内容存档于2018-06-18).
Microsoft launched an online library in a move that pits the world's biggest software company against Google's controversial project to digitize the world's books.
- . Wired. 2008 [2008-11-24]. (原始内容存档于2009-04-16).
- O'Sullivan, Joseph and Adam Smith. "All booked up," (页面存档备份,存于) Googleblog. December 14, 2004.
- Jen Grant. (blog). Googleblog. 2005年11月17日 [2008年12月4日]. (原始内容存档于2021年1月6日).
- . [2008-12-04]. (原始内容存档于2006-08-15).
- . [2008-12-04]. (原始内容存档于2012-05-25).
- . [2012-07-15]. (原始内容存档于2012-07-15).
- Reed, Brock. "La Bibliothèque, C'est Google" (Wired Campus Newsletter), (页面存档备份,存于) Chronicle of Higher Education. May 17, 2007.
- . [2008-12-04]. (原始内容存档于2009-01-22).
- . [2008-12-04]. (原始内容存档于2007-06-14).
- . [2008-12-04]. (原始内容存档于2013-03-09).
- . [2008-12-04]. (原始内容存档于2013-09-11).
- . [2008-12-04]. (原始内容存档于2020-11-14).
- . [2008-12-04]. (原始内容存档于2013-03-09).
- . New York Times. 2008年5月24日 [2008-05-24]. (原始内容存档于2016-11-30).
Microsoft said it had digitized 750,000 books and indexed 80 million journal articles.
- . Agence France-Presse. November 2008 [2008-11-24]. (原始内容存档于2013-03-02).
Google, one of the pioneers in this domain on the other hand, claims to have seven million books available for its "Google Book Search" project, which saw the light of day at the end of 2004.
- . [2008-12-04]. (原始内容存档于2008-12-06).
- . [2008-12-04]. (原始内容存档于2007-12-13).
- . [2008-12-04]. (原始内容存档于2012-12-18).
- John Oates. . The Register. 2006年6月7日 [2008年12月4日]. (原始内容存档于2020年5月6日).
- Danny Sullivan. . Search Engine Watch. 2006年6月28日 [2006-11-11]. (原始内容 (blog)存档于2006年10月17日).
- Thomas Claburn. . InformationWeek. 2007年3月6日 [2008年12月4日]. (原始内容存档于2007年10月12日).
- . [2008-12-04]. (原始内容存档于2009-09-21).
- Siva Vaidhyanathan,. University of California Davis Law Review volume 40 (March 2007), pp. 1207–1231, pdf (页面存档备份,存于)
- First Monday (页面存档备份,存于) Transcript September 2007
- Michael Liedtke. . Associated Press. 2005年5月24日 [2008年12月4日]. (原始内容存档于2006年2月9日).
- Robert B. Townsend, Google Books: Is It Good for History? (页面存档备份,存于), Perspectives (September 2007).
- Jean-Noël Jeanneney. (book abstract; Foreword by Ian Wilson). 2006年10月23日 [2007-02-21]. ISBN 0-226-39577-4.
- Barbara Quint : Changes at Google Scholar: A Conversation With Anurag Acharya (页面存档备份,存于) Information Today, August 27, 2007
外部链接
参见
- Google产品列表
- Google学术搜索
- 图书扫描
- 数字图书馆
- 古腾堡计划
- 中国哲学书电子化计划
- Questia Online Library
- Michigan Digitization Project
- Million Book Project
- 图书馆数字化计划参与名单
- Open Content Alliance
- Universal library
- 欧洲数字图书馆
- A9.com是Amazon.com的图书搜索引擎
- Live Search Books
- Domínio Público