Android

Google: Ginawa Natin ang isang Pagsisimula sa Paghahanap ng Imahe

Gusto Mo BUMILIS YUMAMAN? IAlamin at Isapamuhay Mo Ang Mga 15 SKILLS Na Ito!

Gusto Mo BUMILIS YUMAMAN? IAlamin at Isapamuhay Mo Ang Mga 15 SKILLS Na Ito!
Anonim

Ang mga tao ay maaaring maging excel sa pattern recognition, ngunit ang mga computer ay hindi masyadong matalino sa pagtukoy ng mga imahe. Ang aming mga utak ay maaaring agad na makilala ang mga larawan ng mga bantog na palatandaan tulad ng Statue of Liberty o Great Wall ng Tsina, ngunit ang mga computer ay karaniwang clueless na walang mga tag ng teksto bilang isang cheat sheet.

Gayunpaman, maaaring baguhin ito kung isang proyektong pananaliksik ng Google sa "computer vision" pans out. Ang search giant na Lunes ay nagpakita ng isang papel sa landmark recognition sa Computer Vision and Pattern Recognition (CVPR) conference sa Miami. Ang bagong teknolohiya ay nagpapahintulot sa mga computer na mabilis na i.D. ang mga larawan ng higit sa 50,000 mga landmark ng mundo na may 80-porsiyento na katumpakan, ang sabi ng Google.

Ang Google ay mabilis na ituro ang kanyang pattern-pagkilala sa teknolohiya ay isang proyekto sa pananaliksik at hindi isang bagong serbisyo. Na may katuturan, bilang isang tool sa paghahanap na tama lamang sa 10 sa 10 pagsusulit ay hindi handa para sa kalakasan na oras. Gayunpaman, ang konsepto ay medyo cool na at maaaring patunayan ang isang boon sa mga biyahero kung ang Google ay maaaring sa ibang araw mapalakas ang katumpakan rate. Ang kakayahang mag-snap ng isang larawan ng isang hindi kilalang palatandaan at ang iyong smartphone o Net-enable ang camera kilalanin ito agad ay magiging popular, tingin ko. Siyempre, may mga potensyal din para sa mga aplikasyon ng siyentipiko at mamimili na hindi naisip ng isa.

Kaya paano ito gumagana? Si Jay Yagnik, ang pinuno ng pananaliksik sa paningin ng Google, ay nagpapaliwanag sa isang blog post. Ang unang hakbang ay ang paggamit ng 40 milyong mga larawan na naka-tag na GPS mula sa dalawang mga serbisyo ng Google, Picasa at Panoramio, at mga webpage ng gabay sa paglilibot sa online upang itala ang isang listahan ng mga landmark. "Susunod, natagpuan namin ang mga larawan ng kandidato para sa bawat palatandaan gamit ang mga pinagmumulan at Paghahanap ng Larawan ng Google, na kung saan namin pagkatapos ay" pruned "gamit ang mahusay na imaheng pagtutugma at unsupervised clustering techniques," siya nagsusulat.

Ang huling hakbang ay upang bumuo ng isang sistema ng pag-index para sa mabilis na pagkilala ng imahe. Ngunit sa kabila ng katalinuhan ng proyekto, ang tumpak na paghahanap ng imahe ay nananatiling nakakalito. Tulad ng ipinakikita ng larawan sa ibaba, ang mga hindi nauugnay na landmark ay maaaring magbahagi ng katulad na mga katangian ng arkitektura; din, ang pagsasama ng isang napakalaking banner o bandila ay maaaring humantong sa isang maling tugma.

Sana ang pananaliksik ng proyekto ng Google ay mapabuti ang paghahanap ng imahe, na ngayon ay masyadong umaasa sa pag-tag. Ang susunod na hakbang ay upang makahanap ng isang paraan upang makilala ang hindi mabilang na bilang ng mga di-landmark na mga imahe, ngunit ang tungkuling iyon ay tila mas walang hanggan.