Android

Mga Target ng Google Researcher Ang Nakabalangkas na Data ng Web

All Databases Search

All Databases Search
Anonim

"Mayroong maraming nakabalangkas na data sa Web at kami hindi gumagawa ng mahusay na trabaho sa pagpapakita nito sa aming mga gumagamit, "sabi ni Alon Halevy sa isang pahayag sa New England Database Day conference sa Massachusetts Institute of Technology, Halevy ay tumutukoy sa bahagi sa tinatawag na" malalim na Web "pinagkukunan, tulad ng mga database na umupo sa likod ng mga web site na hinimok ng form tulad ng Cars.com o Realtor.com. Ang Google ay nagsusumite ng mga query sa iba't ibang mga form sa loob ng ilang panahon, pagkuha ng mga nagresultang mga pahina ng Web at kabilang ang mga ito sa index ng paghahanap nito kung ang impormasyon ay mukhang kapaki-pakinabang.

[Karagdagang pagbabasa: Ang pinakamahusay na serbisyo sa streaming ng TV]

Ngunit ang kumpanya din Nais niyang pag-aralan ang data na natagpuan sa mga nakabalangkas na mga talahanayan sa maraming mga Web site, sinabi ni Halevy, na nag-aalok bilang isang halimbawa ng talahanayan sa isang pahina ng Web na naglilista ng mga presidente ng US.

At may mga reams ng mga talahanayan - bilyon sa kanila, ayon kay Halevy. Siya ay "natanto nang napakabilis na higit sa 98 porsiyento ng mga ito ay hindi na kagiliw-giliw na," ngunit kahit na matapos ang makabuluhang pag-filter ay may nananatiling tungkol sa 154 milyon na mga talahanayan na nagkakahalaga ng pag-index, sinabi niya.

Isa sa mga layunin ng Google ang mga layunin ay upang magbigay ng mga resulta na ayusin ang "mga aspeto "ng isang query sa paghahanap, lalo na ang isang exploratory isa tulad ng" Vietnam travel, "bilang kabaligtaran sa isang query para sa isang partikular na katotohanan tulad ng" populasyon Vietnam, "sinabi Halevy. Ang dating query ay makakapagdulot ng impormasyon tungkol sa mga kinakailangan sa visa, taya ng panahon at mga tour package, halimbawa.

Ang ideya ay may mga dayandang ng serbisyo sa paghahanap na inaalok ng Kosmix, ngunit nais ng Google na sumulong, ayon kay Halevy. "Ang Kosmix ay magbibigay sa iyo ng isang 'aspeto,' ngunit naka-attach ito sa isang mapagkukunang impormasyon," sinabi niya.

Hinahanap para sa "paglalakbay sa Vietnam" sa Kosmix ay nagbibigay ng organisadong hanay ng mga resulta kabilang ang mga review ng restaurant mula sa New York Times, mga larawan mula sa Yahoo at Flickr, impormasyon sa pamimili mula sa Shopping.com at pangkalahatang mga resulta sa Web mula sa Google.

"Sa aming kaso, ang lahat ng mga aspeto ay maaaring maging resulta lamang sa paghahanap sa Web, ngunit nais naming maisaayos ang mga ito nang naiiba," sabi ni Halevy.