Car-tech

Google: 129 Milyon Iba't Ibang Mga Libro Na-publish

Y1; WEEK 2: MGA BAHAGI NG AKLAT (MELC BASED) GRADE 3

Y1; WEEK 2: MGA BAHAGI NG AKLAT (MELC BASED) GRADE 3
Anonim

Para sa mga nag-iisip kung gaano karami ang iba't ibang mga aklat sa mundo, may sagot ang Google para sa iyo: 129,864,880, ayon kay Leonid Taycher, isang software engineer ng Google na gumagana sa proyektong Google Books.

Tinantiya ang numero ng mga libro sa mundo ay higit pa sa isang pag-uusisa sa pag-usisa para sa higante sa paghahanap: Nagbibigay din ito ng isang roadmap ng ilan sa mga gawain na natitira pa upang magawa sa pagtugon sa ambisyosong layunin ng kumpanya sa pag-oorganisa ng lahat ng impormasyon sa mundo. ikaw ay bahagi ng isang kumpanya na sinusubukang i-digitize ang lahat ng mga libro sa mundo, ang unang tanong na madalas mong makuha ay: 'Ilang mga libro ang nasa labas?', "Taycher ipinaliwanag sa isang blog post na nagpapahayag ng pagtantya.

[Karagdagang pagbabasa: Ang pinakamahusay na serbisyo sa streaming ng TV] Upang makamit ang isang makatwirang pagtatantya, ang kumpanya ay nagsimula sa pamamagitan ng paglalaman ng impormasyon ng libro mula sa maraming mga sistema ng cataloging, tulad ng International Standard Book Numbers (ISBN).

Ang mga katalogo, habang nakakatulong, ay hindi nagbibigay ng isang tiyak na bilang, gayunpaman. Halimbawa, ang mga ISBN ay itinalaga lamang sa mga aklat mula pa noong dekada 1960, at may posibilidad na magamit lamang sa mga bansa sa Kanluran.

Mayroong maraming mga libro na nakatalaga sa mga indibidwal na numero ng ISBN, at ang tagapaglathala ay nagbigay ng mga ISBN sa mga bagay maliban sa mga aklat, tulad ng mga t-shirt at DVD.

Kaya ang mga inhinyero ng Google ay may nakasulat na mga programa upang magsuklay kahit na mga 150 tulad ng mga katalogo at mga direktoryo, at alisin ang maraming mga dobleng entry na maaaring matagpuan.

Ang kumpanya ay nagkaroon din ng isang bilang ng mga Halimbawa, ang soft cover at hard cover edisyon ng isang teksto ay binibilang bilang dalawang libro, tulad ng maraming iba't ibang mga bersyon ng isang tanyag na teksto, tulad ng Shakespeare's "Hamlet," dahil sa mga pangunahin at komentaryo na maaaring maipakita nila. Ang mga serial ay maaaring mabilang bilang mga indibidwal na mga libro o bilang isang nakolektang trabaho.

Bilang ng Hunyo, ang kumpanya ay na-scan ang 12 milyong mga libro, ayon sa isang presentasyon na ibinigay ng Google Books engineering manager na si Jon Orwant sa USENIX Annual Technical Conference sa Boston. Ang mga aklat na ito ay isinulat sa halos 480 na wika (kasama ang 3 mga libro sa pinagmulang wika ng Klingon na Star Trek).

Ang kumpanya ay nagplano upang makumpleto ang pag-scan ng mga umiiral nang mga libro sa loob ng isang dekada. Ang nagresultang virtual na koleksyon ay binubuo ng apat na bilyong pahina at dalawang trilyong salita, sinabi ni Orwant.

Mga 20 porsiyento ng mga aklat sa mundo ay nasa pampublikong domain, ipinaliwanag ni Orwant. Ang mga 10 hanggang 15 porsiyento ng mga aklat na ito ay naka-print. Ang natitirang mga libro - ang karamihan sa lahat ng mga pamagat - ay nasa ilalim pa ng copyright ngunit wala sa print. Ang Google ay nasa proseso ng paghiram ng mga kopya ng mga aklat na ito upang i-digitize ang mga ito, mula sa halos 40 malalaking aklatan sa buong mundo.

Ito ang gawaing ito ng pag-scan sa mga aklat na hindi na-print ngunit saklaw pa rin ng copyright na natugunan na may ilang pagtutol sa industriya ng pag-publish.

Ang kumpanya ngayon ay naghihintay ng isang paghatol mula sa US District Court para sa Southern District ng New York, kung maaari itong i-scan ang mga aklat na ito.

Noong 2005, ang Authors Guild at ang Asosasyon ng Mga Amerikanong Tagapaglathala ay hiwalay na nagsampa ng mga tuntunin sa pagkilos ng klase laban sa higante na paghahanap, na nagpapahayag na ang kumpanya ay lumalabag sa mga copyright ng may-akda sa pamamagitan ng pag-scan sa mga libro.

Sinasabi ng Google na nais na magbenta ng mga digital na kopya ng mga ito kung hindi man ay out- mag-print ng mga libro, at magtabi ng mga royalty para sa mga may-akda upang i-claim. Umaasa din ang kumpanya na ipakita ang mga snippet ng mga aklat na ito sa mga paghahanap sa Web, at sinasabing ang paggamit na ito ay nasa ilalim ng doktrinang Paggamit sa U.S..

Ang pag-scan sa lahat ng mga aklat sa mundo ay hahantong sa ibang mga benepisyo bilang karagdagan sa pagpapabuti ng mga paghahanap, ipinaliwanag ni Orwant. Sa sandaling ang lahat ng mga volume na ito ay na-digitize, ang kanilang mga nilalaman ay maaaring sumailalim sa pag-aaral, na maaaring humantong sa mga bagong pananaw. Matutuklasan ng mga dalubhasa sa wikang ang ilang mga salita ay dumating sa malawakang paggamit, o kung sino ang unang nagsisimula gamit ang mga salitang ito.

Ang Google Book Search ay maaari ring tumulong sa pagsagot sa ilang mga natitirang tanong sa kasaysayan: Halimbawa, maaari itong ipagbigay-alam sa debate kung si Isaac Newton at Gottfried Leibniz - o ibang tao - ay nakalikha ng calculus.

"Maaari naming maghanap hindi lamang para sa isang parirala ngunit para sa isang konsepto, "ipinaliwanag Orwant. "Maaari naming gawin ang lahat ng iba't ibang paraan [na ang ideya ng] infinity ay maaaring inflected, i-translate na sa iba't ibang mga wika, at gawin ang isang paghahanap magkapareho."

"Ang aking pag-asa ay na kapag nagsisimula naming ilantad ng higit pa ng Ang koleksyon na ito ay magbibigay-daan sa mga tao na magtanong tulad ng mga ito na hindi pa nila maitatanong bago. "

Ang editor ng IDG News Service Juan Carlos Perez ay nag-ambag sa ulat na ito.

Joab Jackson ay sumasakop sa enterprise software at pangkalahatang teknolohiya ng breaking balita para sa

Ang IDG News Service

. Sundin si Joab sa Twitter sa @Joab_Jackson. Ang e-mail address ni Joab ay [email protected]