Windows

Hadoop ay nakakakuha ng higit pang paghahanap gamit ang MapR, Cloudera release

Cloudera Tutorial | Cloudera Manager Quickstart VM | Cloudera Hadoop Training | Edureka

Cloudera Tutorial | Cloudera Manager Quickstart VM | Cloudera Hadoop Training | Edureka
Anonim

Ang mga gumagamit ng platform ng pagpoproseso ng data ng Hadoop ay mayroon na ngayong dalawa pang mga tool upang tulungan silang pag-uri-uriin sa pamamagitan ng kanilang mga bundok ng impormasyon.

Ang bagong pamamahagi ng M7 ng MapR ay nagtanggal ng Hadoop JVM na layer upang mapalakas ang pagganap

Hadoop pinagsama ng distributor MapR ang LucidWorks Search sa sarili nitong pamamahagi. Samantala, inilunsad naman ni Cloudera ang unang full release ng open source ng Impala SQL query engine para sa Hadoop.

[Karagdagang pagbabasa: Ang pinakamahusay na serbisyo sa streaming ng TV]

"Ang paggamit ng paghahanap bilang user interface para sa malaking data ay lubhang kawili-wili. Ang paghahanap ay angkop para sa pagdaragdag ng maraming iba't ibang uri ng impormasyon, lalo na ang impormasyong walang unstructured, "sabi ni Jack Norris, punong opisyal ng marketing para sa MapR. "Nakakakita kami ng ilang mga talagang kagiliw-giliw na mga application sa mga search engine sa kanilang core, kahit na ang isang karaniwang gumagamit ay hindi iniisip ang mga ito bilang hinimok ng search engine."

LucidWorks Search ay ang komersyal na bersyon ng open source Apache Lucene / Solr buong -text search engine. Sa bagong pagsasama ng MapR, maaaring maghanap ang LucidWorks Search sa pamamagitan ng alinman sa data sa Hadoop File Systems (HDFS) o sa mga file sa iba pang mga file system.

Ang LucidWorks Search ay nag-aalok ng mga snapshot at salamin para sa mataas na availability, at inaalis ang marami sa trabaho na kinakailangan i-install ang Lucene / Solr mula sa simula. Nag-aalok din ito ng katutubong suporta para sa higit pang mga mapagkukunan ng data, isang graphical na interface ng gumagamit at balangkas ng seguridad.

Ang search engine ay maaaring magamit sa isang dynamic na application sa Web upang mabilis na makuha ang mga larawan, advertising, mga rekomendasyon sa produkto, at iba pang impormasyon na maaaring magamit upang populate ang mga Web site sa mabilisang. "Ito ay hindi isang kapalit na kapalit ng gastos para sa mga warehouses ng data. Ito ay tungkol sa pagdaragdag ng mga bagong mapagkukunan ng data at paggawa ng ilang mga bagay na may dramatikong epekto sa negosyo, "sabi ni Norris.

MapR at LucidWorks ay nagtatrabaho nang sama-sama sa pagpapares ng kanilang mga teknolohiya mula noong 2011, nang bumuo sila ng isang magkasamang kasunduan sa pagmemerkado. Sa unang bahagi ng taong ito, inilabas nila ang isang connector na ginagawang mas madaling gamitin ang Lucene / Solr sa pamamahagi ng MapR Hadoop.

Ang LucidWords Search ay gumagana sa bagong release ng M7 na ibinahagi sa MapR, sa beta form. Bilang karagdagan sa pagsuporta sa LucidWorks Search, ang M7 edisyon ay muling nai-architected upang maalis ang mga compaction o background check na pare-pareho, bilis ng pagganap.

Din sa linggong ito, ang Cloudera pinakawalan na bersyon 1.0 ng Cloudera Impala, isang open source SQL-compliant query engine para sa Hadoop. Ang SQL ay ang database ng interface ng wika na ginagamit sa pamanggit na mga sistema ng pamamahala ng database (RDMS) at kilala sa pamamagitan ng mga tagapangasiwa ng database.

Impala ay idinisenyo upang isakatuparan ang mga query nang mas mabilis kaysa sa Hadoop's Hive, dahil hindi nito ginagamit ang MapReduce framework ang mga resulta ng paghahanap ay isusulat sa disk. Sa halip, maaaring i-query ng mga user ang data na naka-imbak sa HDFS at HBase nang direkta. Ang mga gumagamit ay maaaring query ng data alinman interactively o sa pamamagitan ng mga proseso ng batch.

Cloudera unang pinakawalan ng isang bersyon ng engine na ito noong Oktubre bilang isang beta. Mula noon, ang software ay sinubukan ng mga kumpanya tulad ng 37signals at Expedia.

Impala ay ang pangunahing bahagi ng Supplemental na pakete ng Cloudera Enterprise RTQ (Real-Time Query) para sa Cloudera Hadoop platform. Maaaring i-download ang Impala nang walang bayad.

Nai-update Mayo 6 upang itama ang impormasyon tungkol sa teknolohiya ng Cloudera Impala.