Komponentit

Frontline ng Data Update ng Aster Data 'Analytic Database

Data Analytics | What is SQL Used For

Data Analytics | What is SQL Used For
Anonim

Startup Aster Data Systems inilabas ang 3.0 na bersyon ng nCluster analytic database nito sa Martes, na nagbubuong ito bilang perpekto para sa "frontline" na data warehousing.

"Ayon sa kaugalian, iniisip namin ang data warehousing bilang back-office task," sumulat si Aster CEO Mayank Bawa sa isang blog mag-post ng Martes. "Ang data bodega ay maaaring i-load sa mga hiwalay na mga window ng pag-load; mga load ay maaaring tumakbo ng late (ang net epekto ay na ang mga gumagamit ng negosyo ay makakakuha ng kanilang mga ulat huli); naglo-load, pag-backup, at scale-up ay maaaring tumagal ng data warehouses offline - kung saan ay OK dahil ang mga gawaing ito ay maaaring gawin sa mga oras na hindi pangnegosyo (gabi / katapusan ng linggo). "

Ngunit ang mga customer ng Aster, na kinabibilangan ng aCerno, isang network ng paghahatid ng Internet advertising," umaasa sa mga analytics ng data para sa kanilang kita, "sinabi ni Bawa. Nterlus 3.0 ng Aster ay kumakalat ng mga workload sa isang bilang ng mga server at ginagawang madali upang magdagdag ng mga karagdagang machine para sa higit pang lakas. Ang software ay naghihiwa-hiwalay din sa iba't ibang bahagi ng isang workload ng data-analysis sa discrete pieces.

Ang isang "loader" tier ay may kaugnayan sa pag-load ng data at pag-export sa at mula sa panlabas na pinagkukunan; ang isang "worker" layer ay nagtatabi ng data sa lokal na naka-attach na disk para sa query; at ang isang layer ng mga nodes na "queen" ay gumaganap ng intelligent na pagpaplano at pagproseso ng query.

Samantala, ang mga gumagamit ay nagtatrabaho sa kumpol na parang ito ay isang solong entity

Ang kakayahang piliin ang mga segment ng mga segment ng cluster ay nangangahulugan na ang mga user ay maaaring magdagdag ng mga mapagkukunan Sa mga pangunahing kakayahan ng mga ito, ang 3.0 release ay nagdaragdag ng isang bilang ng mga pag-andar para sa "laging-on" na paggamit, kabilang ang kakayahang magdagdag ng kapasidad, pagbabalik-balik ng data at makuha ang data habang ang

Aster din nagtrabaho upang magdagdag ng parallelization sa buong sistema, ayon sa isang opisyal ng kumpanya.

"Gusto naming bumuo ng mga system na maaaring hawakan 10x, 100x higit pang data kaysa sa anumang iba pang sistema ngayon. maraming data para sa anumang nag-iisang server ng kalakal, "sabi ng CTO Tasso Argyros sa isang post sa blog. "Kaya inilalagay namin ang maraming pagsisikap ng R & D sa pag-parallel sa bawat solong pag-andar ng system - hindi lamang sa pag-query, kundi pati na rin sa paglo-load, pag-export ng data, pag-backup, at pag-upgrade. Plus, pinapayagan namin ang aming mga user na piliin kung magkano ang gusto nilang parallelize lahat ang mga pag-andar na ito, nang hindi kinakailangang palakihin ang buong sistema. "

Kasama rin sa paglabas ang suporta para sa MapReduce, isang programming technique na orihinal na binuo ng Google na ginagawang mas madali para sa mga developer na sumulat ng mga programa para sa pagsusuri ng mga malalaking hanay ng data. Ang kakumpitensya ng Aster na Greenplum ay kamakailan inihayag ang suporta sa MapReduce.

Ang mga karagdagang tampok ay may kasamang kakayahang pumili ng mga antas ng compression ng data para sa mga indibidwal na mga talahanayan, isang tool sa pag-upgrade na "one-click"; at mas mahusay na mga tampok sa seguridad, tulad ng LDAP (Lightweight Directory Access Protocol) para sa pagpapatunay at ang kakayahang pamahalaan ang mga pribilehiyo ng gumagamit sa mga antas ng kumpol, database at talahanayan.

Marami sa mga unang customer ng Aster, na kasama rin ang MySpace, ay nakatuon sa Web, sinabi ni Curt Monash, presidente ng Monash Research.

"Ang isang napakalaking bahagi ng paglago at pagkakataon sa data warehousing ay nakasalalay sa pagharap sa medyo bagong uri ng data," sabi niya. "May mga malalaking data warehouses na nakikitungo sa tradisyunal na OLTP, transactional data, ngunit ang Aster ay hindi kinakailangang isang nangungunang kakumpitensya sa pag-aaral na. Ang matamis na lugar sa pag-aaral ng mga malalaking halaga ng data ay kasalukuyang Web data at kaugnay na mga kaganapan sa network."

Monash nabanggit pangangasiwa sa pagproseso ng parallel at suporta para sa MapReduce bilang mga pangunahing lakas ng Aster: "Ang Aster ay isang startup na may isang medyo hindi pa luma na produkto, ngunit marami ang kanilang naisip sa kung paano gumawa ng parallel processing madaling mangasiwa."

Pinupuntirya ng NCluster 3.0 sa karaniwang x86 server. Ang pagpepresyo ay batay sa kung magkano ang data ay pinamamahalaan. Ang dating kumpanya ay nagsabi na ang mga gastos ay nagsisimula sa US $ 100,000.