Car-tech

Cloudera Preps Hadoop per l'azienda

Big Data Skills in Demand for 2020 | Big Data Architect Roles and Responsibilities | Intellipaat

Big Data Skills in Demand for 2020 | Big Data Architect Roles and Responsibilities | Intellipaat
Anonim

Cloudera ha presentato un nuovo set di strumenti di gestione Hadoop, chiamato Cloudera Enterprise, che la compagnia offrirà per una quota annuale di abbonamento, ha annunciato martedì. Ha anche aggiornato il suo pacchetto di distribuzione open source di Hadoop.

Entrambe le nuove versioni, così come diverse nuove partnership con fornitori di fornitori di software per la gestione dei dati, mostrano che la società si sta attrezzando per offrire la tecnologia emergente del database - ora utilizzata principalmente da giganti Web come Google e Yahoo - al mercato enterprise come alternativa ai database relazionali.

"La nostra scommessa non è solo le grandi società del Web, ma banche, ospedali e compagnie assicurative scopriranno che hanno bisogno di analizzare complessi e strutturati dati insieme, e Hadoop è stato fatto per questo ", ha detto il CEO di Cloudera Mike Olson. "Hadoop risolve un nuovo problema, in un modo nuovo."

Uno di un numero crescente di database non SQL o NoSQL, Hadoop si basa su Google MapReduce, un framework per l'elaborazione di dati in parallelo su un gran numero di computer i nodi. Hadoop, ora sviluppato come un progetto open-source dalla Apache Software Foundation, offre un'alternativa ai tradizionali database relazionali, almeno per quei casi di analisi di insiemi di dati grandi e in rapida evoluzione.

Può funzionare sia con SQL che non -SQL dati, ed è più resiliente al fallimento del server rispetto ai database relazionali, Olson ha detto.

Cloudera sta confezionando Hadoop per le organizzazioni di livello medio, sia con la sua distribuzione Hadoop, sia con il suo nuovo set di strumenti di gestione. Entrambi i pacchetti dovrebbero consentire alle organizzazioni senza un sacco di esperienza tecnica approfondita in Hadoop per eseguire il software, Olson ha detto. "C'è questo mito che Hadoop è utilizzabile se si dispone di dati scalati su Google. Ci sono molti utenti che hanno solo pochi terabyte di dati che desiderano analizzare", ha detto Olson.

La distribuzione di Cloudera per Hadoop (CDH) è un pacchetto open-source di programmi software pre-integrati costruiti attorno all'Hadoop Common, precedentemente chiamato Hadoop Core. Il pacchetto include: Hive, che fornisce un'infrastruttura di data warehouse; HBase, il database sottostante a Hadoop; Pig, un compilatore per programmi di riduzione delle mappe; Zookeper, una pianificazione per l'esecuzione di applicazioni su più server e MapReduce.

Nella versione 3 appena rilasciata, il pacchetto include tre programmi che la società ha rilasciato come progetti open-source, sotto la licenza open source Apache V2. Uno è Flume, che può aiutare nel caricamento dei dati in Hadoop. Un'altra novità è Oozie, che è un software di gestione del flusso di lavoro. L'ultimo è il codice Hadoop User Environment (HUE), che fornisce un'interfaccia utente per la gestione di Hadoop.

"HUE consente a chiunque di creare applicazioni mirate agli analisti e sa come parlare ai cluster Hadoop", ha detto Olson.

Il pacchetto Cloudera Enterprise aumenta la versione 3 di CDH con strumenti di gestione aggiuntivi. Questo nuovo software, che non è open source, consente agli amministratori di controllare la gestione degli accessi tramite l'uso del protocollo di accesso Lightweight Directory. Vengono inoltre forniti programmi per la fornitura di risorse, per la configurazione e il monitoraggio delle prestazioni.

Olson non discuterà di quanto Cloudera abbia fatto finora dalle commissioni di sottoscrizione e consulenza, ma rileva che il primo trimestre del 2010, la società ha realizzato ciò che ha guadagnato fino alla metà del 2009. Tra diversi settori, i servizi finanziari, le telecomunicazioni, la vendita al dettaglio, il governo e le società di web commerce hanno mostrato interesse per la tecnologia, ha detto Olson.

"Le cose che le aziende stanno facendo con Hadoop variano. In generale, queste persone stanno recuperando molti dati da molti luoghi e hanno bisogno di sottoporli a analisi sofisticate ", ha detto Olson. "I servizi finanziari sono interessati all'utilizzo di Hadoop per il rilevamento di frodi, mentre nelle telecomunicazioni è necessario ottimizzare le reti e ridurre il numero di clienti".

Oltre a offrire questi pacchetti, Cloudera ha supportato Hadoop da fornitori di software di Business Intelligence (BI) e di gestione dei dati.

Olson intende annunciare, durante il suo keynote al Hadoop Summit 2010, che si terrà a Santa Clara, Martedì, la California, MicroStrategy, vendor di BI supporterà l'uso di Hadoop.

Un altro nuovo partner è Talend, un fornitore di software di integrazione dati open source. La società ha esteso la sua Talend Integration Suite per interfacciarsi con i database Hadoop. La sua suite consente agli amministratori di gestire e aggregare più origini dati da un'unica console. Con Hadoop, il software "può in modo nativo inserire o recuperare dati ed elaborare i dati all'interno dell'architettura Hadoop", ha affermato Talend vicepresidente marketing di Yves de Montcheuil.

Microstrategy e Talend si uniscono a un numero crescente di aziende che preparano l'open source o strumenti di gestione commerciale per Hadoop. La scorsa settimana, Cloudera e Quest hanno avviato un progetto per creare software in grado di collegare Hadoop con i database Oracle. A maggio, Pentaho, azienda open source e business-intelligence, ha annunciato che la sua suite BI avrebbe funzionato con i database Hadoop.

In un'intervista separata con IDG News Service, il CTO di Yahoo Raymie Stata ha sottolineato che Hadoop potrebbe ridurre la necessità di costruire supercomputer per analizzare grandi serie di dati. Tradizionalmente, i set di dati di grandi dimensioni sono stati trasferiti dallo storage nel supercomputer, che è un insieme di server in pool, da analizzare. Al contrario, Hadoop sposta il calcolo analitico nel punto in cui risiedono i dati, eliminando la necessità di una gigantesca macchina da macinare il numero. Yahoo è stato uno dei principali contributori di Hadoop.

Oltre all'offerta di Cloudera, Hadoop viene commercializzato anche da IBM, che recentemente ha iniziato a offrire una serie di servizi analitici che utilizzano la tecnologia.

Joab Jackson copre software e informazioni generali ultime novità tecnologiche per Servizio notizie IDG. Segui Joab su Twitter all'indirizzo @Joab_Jackson. L'indirizzo e-mail di Joab è [email protected]