Car-tech

Cloudera Preps Hadoop para sa Enterprise

Introduction to Cloudera Enterprise with Charles Zedlewski

Introduction to Cloudera Enterprise with Charles Zedlewski
Anonim

Ang Cloudera ay nagpalabas ng isang bagong hanay ng mga tool sa pamamahala ng Hadoop, na tinatawag na Cloudera Enterprise, na ang kumpanya ay nag-aalok para sa isang taunang bayad sa subscription, inihayag ito noong Martes. Na-update din nito ang open-source distribution package ng Hadoop.

Ang parehong mga bagong paglabas, pati na rin ang ilang mga bagong pakikipagsosyo sa mga provider ng mga vendor ng software management software, ay nagpapakita ng kumpanya na nagmamay-ari hanggang sa nag-aalok ng umuusbong na teknolohiya ng teknolohiya - ngayon ay kadalasang ginagamit

"Ang aming taya ay hindi lamang ang mga malalaking kompanya ng Web, ngunit ang mga bangko, mga ospital at mga kompanya ng seguro ay matutuklasan na kailangan nila upang pag-aralan ang kumplikado at nakabalangkas na data magkasama, at Hadoop ay ginawa para sa, "sinabi Cloudera CEO Mike Olson. "Hadoop ay lutasin ang isang bagong problema, sa isang bagong paraan."

Isa sa isang lumalagong bilang ng mga di-SQL, o database ng NoSQL, Hadoop ay nakabatay sa labas ng Google MapReduce, isang balangkas para sa pagpoproseso ng data nang kahanay sa maraming mga computer node. Ang Hadoop, na ngayon ay binuo bilang open-source na proyekto ng Apache Software Foundation, ay nag-aalok ng alternatibo sa mga tradisyunal na database ng pamanggit, sa hindi bababa sa mga kaso ng pag-aaral ng malalaking, mabilis na pagbabago ng mga hanay ng data.

Maaari itong gumana sa parehong SQL at hindi -SQL data, at mas nababanat sa pagkabigo ng server kaysa sa mga relational na database, sinabi ni Olson.

Ang Cloudera ay ang packaging Hadoop para sa mga midlevel na organisasyon, parehong sa pamamahagi nito ng Hadoop, at ang bagong inilabas na hanay ng mga tool sa pamamahala nito. Ang parehong mga pakete ay dapat pahintulutan ang mga organisasyon na walang maraming malalim na teknikal na karanasan sa Hadoop upang patakbuhin ang software, sinabi ni Olson. "Mayroong gawa-gawang ito na ang Hadoop ay magagamit kung mayroon kang data na naka-scale Google. Maraming mga gumagamit na may ilang mga terabytes ng data na nais nilang pag-aralan," sabi ni Olson.

Cloudera's Distribution for Hadoop (CDH) ay isang open-source na pakete ng mga pre-integrated software program na binuo sa paligid ng Hadoop Common, dating pinangalanang Hadoop Core. Kasama sa package ang: Hive, na nagbibigay ng imprastraktura ng warehouse ng data; HBase, ang database na pinagbabatayan ng Hadoop; Pig, isang tagatala para sa mapa-bawasan ang mga programa; Ang Zookeper, isang pag-iiskedyul ng pagpapatakbo ng mga application sa maraming server, at MapReduce.

Sa bagong inilabas na bersyon 3, ang pakete ay kinabibilangan ng tatlong mga programa na inilabas ng kumpanya bilang open-source na mga proyekto, sa ilalim ng lisensya ng open-source ng Apache V2. Ang isa ay Flume, na maaaring makatulong sa paglo-load ng data sa Hadoop. Ang isa pang bagong karagdagan ay Oozie, na isang software sa pamamahala ng workflow. Ang huling ay ang Hadoop User Environment (HUE) code, na nagbibigay ng isang user interface para sa pamamahala ng Hadoop.

"HUE ay nagbibigay-daan sa sinuman na bumuo ng isang application na naka-target sa mga analyst.

Ang Cloudera Enterprise pakete ay nagdudulot ng CDH na bersyon 3 na may karagdagang mga tool sa pamamahala. Ang bagong software na ito, na hindi bukas na pinagmulan, ay nagpapahintulot sa mga administrator na kontrolin ang access management sa pamamagitan ng paggamit ng Lightweight Directory Access Protocol. Ang mga programa ay ibinibigay din sa mga mapagkukunan ng pagkakaloob, upang magawa ang pagsasaayos at pagsubaybay sa pagganap.

Hindi tinatalakay ni Olson kung magkano ang ginawa ni Cloudera mula sa mga bayad sa subscription at pagkonsulta sa ngayon, ngunit ang mga unang taon ng 2010, ang ginawa ng kumpanya kung ano ang kinita nito sa pamamagitan ng kalahati ng 2009. Kabilang sa iba't ibang mga industriya, pinansiyal na serbisyo, telekomunikasyon, tingian, pamahalaan at mga kumpanya sa Web commerce ay nagpakita ng isang interes sa teknolohiya, sinabi Olson.

"Ang mga bagay na ginagawa ng mga kumpanya sa Hadoop ay nag-iiba. pangkalahatan, ang mga taong ito ay nakakakuha ng maraming data mula sa maraming lugar at kailangang ipailalim ito sa sopistikadong analytics, "sabi ni Olson. "Ang mga serbisyong pampinansya ay interesado sa paggamit ng Hadoop para sa pagtuklas ng pandaraya. Sa telekomunikasyon, may isang tunay na pangangailangan na ma-optimize ang mga network at mabawasan ang mga customer."

Bukod pa sa pag-aalok ng mga paketeng ito, ang Cloudera ay nagrali ng suporta para sa Hadoop mula sa mga provider ng business intelligence (BI) at software sa pamamahala ng data.

Olson plano upang ipahayag, sa panahon ng kanyang pangunahing tono sa Hadoop Summit 2010, na nagaganap sa Santa Clara, California sa Martes, ang BI vendor MicroStrategy ay sumusuporta sa paggamit ng Hadoop.

Ang isa pang bagong kasosyo ay Talend, isang vendor ng open source software integration software. Ang kumpanya ay pinalawig ang Talend Integration Suite nito upang mag-interface sa mga database ng Hadoop. Ang suite nito ay nagbibigay-daan sa mga administrator na pamahalaan at pinagsasama-sama ang maramihang mga mapagkukunan ng data mula sa isang solong console. Sa Hadoop, ang software ay "maaaring magpasok ng data o makuha ang data, at iproseso ang data sa loob ng arkitektura ng Hadoop," sabi ng vice president ng marketing ng Talend, Yves de Montcheuil.

Microstrategy at Talend sumali sa isang lumalagong bilang ng mga kumpanya ay prepping open source o komersyal na mga tool sa pamamahala para sa Hadoop. Noong nakaraang linggo, nagsimula ang Cloudera at Quest sa isang proyekto upang bumuo ng software na maaaring mag-link sa Hadoop sa mga database ng Oracle. Sa Mayo, bukas-source, kumpanya ng negosyo-intelligence Pentaho inihayag na ang BI suite nito ay gagana sa mga database ng Hadoop.

Sa isang hiwalay na pakikipanayam sa IDG News Service, sinabi ng Yahoo CTO na si Raymie Stata na mababawasan ng Hadoop ang pangangailangan sa pagtatayo ng supercomputers upang pag-aralan ang malalaking hanay ng data. Ayon sa kaugalian, ang mga malalaking data set ay inilipat mula sa imbakan sa supercomputer, na isang pooled na hanay ng mga server, upang ma-aralan. Sa kaibahan, ang Hadoop ay gumagalaw sa pagkalkula ng analytic kung saan nakatira ang data, inaalis ang pangangailangan para sa isang cental, giant number-crunching machine.

Bilang karagdagan sa pag-aalok ng Cloudera, ang Hadoop ay din komersyalisado sa pamamagitan ng IBM, na kamakailan ay nagsimula na nag-aalok ng isang hanay ng mga analitikong serbisyo na gumagamit ng teknolohiya.

Sinasakop ni Joab Jackson ang software ng enterpise at general Ang teknolohiya ng breaking balita para sa Ang IDG News Service. Sundin si Joab sa Twitter sa @Joab_Jackson. Ang e-mail address ni Joab ay [email protected]