Komponentit

Maligayang pagdating sa Web 3.0: Mga Semantiko sa Paghahanap

Web 3.0 & Privacy - Computerphile

Web 3.0 & Privacy - Computerphile
Anonim

Habang ang paghahanap sa keyword ay nananatiling pinakasikat na paraan, karaniwang hindi tumpak, sa mga gumagamit kung minsan ay nakakakuha ng hanggang 30,000 mga hit sa isang paghahanap at pagkatapos ay may upang mag-ayos sa pamamagitan ng isang listahan ng mga mahahabang kaugnay na mga resulta ng keyword upang mahanap ang may-katuturang mga dokumento.

"Ito kung saan ang isang bagong lahi ng tinatawag na mga teknolohiya ng semantiko ay dumating sa frame. pag-ranggo ng mga algorithm tulad ng PageRank ng Google para sa predicting kaugnayan, semantiko paghahanap dips sa kahulugan sa wika upang makabuo ng mataas na may-katuturang mga resulta ng paghahanap, "ayon sa isang ulat na inilathala ng Ovum analyst Mike Davis at Madan Sheina. Ang mga tagapagbigay ng web na binibilang ng mga analyst ay kinabibilangan ng Expert System, Powerset, Yedda, Trovix at Hakia. Ayon sa mga may-akda, ang kamalayan ng semantiko na paghahanap ay tumaas nang kinuha ng Microsoft ang dalawang semantiko na mga kumpanya sa paghahanap na Powerset at Zoomix.

Sa kaso ng Expert System, ang aplikasyon nito, na tinatawag na Cogito, ay dinisenyo sa mga prinsipyo ng pag-unawa ng tao upang pahintulutan ang nilalaman maunawaan sa paraan kung saan nilayon ito ng may-akda. Ito ay isang bagay na hindi pinapansin ng paghahanap sa keyword.

"Ang isang paghahanap sa Google para sa salitang 'jaguar' ay makakukuha ng nilalaman sa paligid ng hayop at ng kotse. Ang paghahanap sa semantiko ay hindi lamang tumingin sa keyword kundi pati na rin ang iba pang mga salita sa paligid nito tulad ng 'jungle

Mas malalim na pag-aaral

Bukod sa semantiko na paghahanap, may iba pang mga anyo, kabilang ang heuristics at ontolohiya, lingguwistika at teksto ng pagmimina, at statistical. Gayunpaman, ang Expert System ay nag-aangkin na ang mga pamamaraang ito ay nagkukulang, tumutugon lamang sa mga morpolohiya at grammatical na aspeto ng pagtatasa.

Ang iba pang mga search engine ay madalas na pumasok sa isang brick wall pagdating sa malalim na pagtatasa. Halimbawa, kapag ang isang heuristically driven na search engine ay nakikita ang dalawang adjectives sa isang pangungusap na kadalasan ito ay naghuhugas ng mga ito at tinutukoy ang pangungusap bilang walang kinikilingan dahil hindi ito nauunawaan kung saan ang dalawang magkahiwalay na mga adjectives ay tumuturo.

Sa paghahambing, ang hitsura ng semantiko na paghahanap sa parehong pangungusap lohika - kung paano ang mga salita sa isang pangungusap ay may kaugnayan sa isa't isa - at semantiko na pagtatasa - nauunawaan ang konteksto ng mga keyword.

Kapag ang isang term ay hindi maliwanag, ibig sabihin ay maaari itong magkaroon ng ilang mga kahulugan, halimbawa, bark, sa iba pang mga salita na bumabalot sa paligid nito upang mabigyan ito ng tunay na kahulugan at konteksto.

Isang lexical database

Ang mga inhinyero sa Expert Systems ay nagsasabi na ang Cogito ay maaaring pumunta sa dagdag na milya dahil ito ay isang semantiko network - isang lexical database na nagbibigay ng isang kaalaman na representasyon ng mga kahulugan ng salita at ang kanilang mga relasyon. Nagbigay ang diksyunaryo ng Webster sa isang in-memory database - na binubuo ng 350,000 salita at 2.8 milyong mga relasyon.

"Ang semantiko ng Expert System ay tumutuon din sa mga karaniwang salita. Iyan ay naiiba mula sa karamihan sa mga ontolohikal na pamamaraang na nagmamalasakit sa kanilang sarili na may balot na kahulugan at konteksto sa paligid ng nagdadalubhasang nilalaman, tulad ng pang-agham na mga tuntunin, at laktawan ang karaniwang mga salita na naglalaman ng 90 porsiyento ng lahat ng nilalaman, "sabi ng mga may-akda ng Ovum.

Gayunpaman, ang paghahanap sa semantiko ay puno pa rin ng" maraming teoretikong hype ngunit maliit na tunay na substansiya o patunay na ito ay gumagana nang mas mahusay kaysa sa kasalukuyang teknolohiya ng paghahanap.

"Ang mga network ng semantiko ay nakakalito upang bumuo at hindi lahat ay pantay. Malamang na ang mga teknolohiya ng semantiko ay magagawang magbigay ng 100 porsiyento na katumpakan sa kanilang pag-aaral at mga resulta. Bukod pa rito ay may mga tanong pa rin sa paglipas ng mga potensyal na malagkit na mga isyu sa pagganap sa mga semantiko na paghahanap na kumain ng higit pang mga siklo sa pagproseso. "