Mga website

Crunching Data on the Cheap

Data Crunch: How To Break Into Data Science

Data Crunch: How To Break Into Data Science
Anonim

Data-warehousing software systems Ang mga ito ay mahal, ngunit maraming mga negosyo ay gayunpaman ay handa upang maghukay malalim, pagtaya na analytics ay magbibigay ng mga bagong pananaw sa kanilang negosyo at isang competitive na kalamangan.

Sa isang ulat na inilabas mas maaga sa taong ito, pananaliksik firm IDC hinulaang ang data-warehousing platform market ay lumalaki mula sa humigit-kumulang na US $ 7.9 bilyon noong 2009 hanggang sa humigit-kumulang na $ 10.8 bilyon noong 2013. Ang magandang balita para sa mga tindahan ng IT na gustong magsimula sa analytics, ngunit wala ang badyet ngayon, ang kamakailang paglitaw ng libreng software mga opsyon na nakakonekta ng medyo malubhang data-crunching firepower.

Noong Oktubre, inihayag ng Greenplum ang Single Node Edition ng database ng MPP nito (massively parallel processing). Ang mga arkitektura ng MPP ay nagbahagi ng mga workload ng data sa maraming piraso na pinamamahalaang malaya sa isang hanay ng mga server.

Ang bersyon ng Single Node ay maaaring gamitin sa mode ng produksyon sa isang x86 server na may hanggang dalawang CPU socket at walang limitasyong mga core. Maaari rin itong i-deploy sa isang solong virtual machine na may hanggang walong virtual core. Walang takip ng imbakan. Ang Single Node Edition ay maaari ding maiugnay sa isang mas malawak na implementasyon ng Greenplum.

Gayundin sa Oktubre, inilabas ni Calpont ang InfiniDB Community Edition, isang bukas na pinagmulan, database na nakatuon sa hanay. Ang kolum na paraan ay maaaring sa maraming mga kaso lubos na mabawasan disk I / O demand na kumpara sa mga sistema na nag-iimbak ng data sa mga hilera, at din makamit ang mas mataas na antas ng compression, sinabi analyst Curt Monash ng Monash Research.

InfiniDB Community Edition ay limitado din sa isang

Ang Calpont ay mayroon ding isang komersyal na edisyon ng InfiniDB, na ngayon sa unang bahagi ng tagagamit, na nagbibigay-daan sa mga gumagamit na i-scale ang system sa maraming mga server.

InfiniDB Community Edition ay sumusunod sa paglabas noong nakaraang taon ng isa pang open-source na haligi ng data-warehousing platform mula sa Infobright. Ang huli ay maaaring magkaroon ng isang gilid para sa ngayon sa InfiniDB sa mga tuntunin ng suporta sa komunidad; Sinabi kamakailan ng Infobright na ang software ay na-download na higit sa 15,000 ulit.

Gayunpaman, sa huli, ang mga libreng data-warehousing na mga opsyon ay may mga limitasyon at malamang na mga sitwasyon sa paggamit, ayon kay Monash.

"Kung mayroon kang isang analyst o maliit ang koponan ng mga analysts na nagsasagawa ng maagang pagsaliksik na query sa ilang mga terabytes ng data o mas mababa, at pagkatapos ay ang mga produktong ito ay malamang na gawin ang trabaho, "sabi niya.

Hindi rin maaaring magkaroon ng badyet ang mga kumpanya upang gumawa ng anumang bagay, o hindi makakakuha ng pondo nang walang pagsasagawa ng isang paunang patunay ng konsepto, idinagdag ni Monash.

"May mga tiyak na mga workload na kung saan sila ay hindi sapat, at kailangan mong magbayad ng pera para sa isang produkto na gagawin ang trabaho para sa iyo," sabi niya. "Ngunit kung nais mong makakuha ng mas maraming halaga mula sa iyong data, ang mga libreng produkto ay maaaring maging isang magandang lugar upang magsimula."