Windows

Red Hat, Hortonworks prep OpenStack for Hadoop

Creating Hadoop 2-Node Cluster

Creating Hadoop 2-Node Cluster
Anonim

Unendo il mondo dei big data e del cloud computing, Red Hat, Hortonworks e l'integratore Hadoop Mirantis stanno realizzando insieme un software programma, chiamato Savanna, che renderà più facile l'installazione di Apache Hadoop su un servizio cloud OpenStack.

Il software "consentirà a Hadoop di sfruttare l'architettura di storage scalabile offerta da OpenStack", ha dichiarato Adrian Ionel Mirantis CEO. "Le aziende avranno un modo molto più semplice di implementare e utilizzare Hadoop su vasta scala".

Mirantis ha lanciato il progetto all'inizio di questo mese, donando il codice alla OpenStack Foundation. OpenStack è una raccolta di software open source progettata per offrire servizi di elaborazione, storage e networking condivisi su base on-demand. E Apache Hadoop è un framework di elaborazione dati per l'analisi di grandi quantità di dati su più server in un cluster. Entrambe le serie di software vengono sempre più testate e implementate dalle organizzazioni.

[Ulteriori letture: I migliori servizi di streaming TV]

"Il cloud offre un'infrastruttura economica a basso costo che si riduce facilmente. molto importante nel mondo Hadoop, poiché molti di questi progetti si stanno rapidamente espandendo all'interno delle business unit, e non necessariamente parlano con la gente dell'IT ", ha affermato Shaun Connolly, vicepresidente della strategia di Hortonworks. Savanna funzionerà con qualsiasi distribuzione Hadoop standard, non solo con la distribuzione di Hortonworks.

Savanna fornirà un modo semplice per installare un cluster Hadoop su un cloud OpenStack. Gli amministratori possono specificare la topologia del cluster, il numero di nodi, l'hardware richiesto e altri attributi. Il progetto sta preparando Savanna ad essere un elemento della suite OpenStack, accessibile tramite una API (interfaccia di programmazione dell'applicazione) o tramite una GUI disponibile per la dashboard OpenStack.

Nel corso del tempo, il software offrirà funzionalità aggiuntive, come l'auto -scaling, la possibilità di pianificare quando viene eseguita una distribuzione Hadoop e la possibilità di gestire più cluster Hadoop. Savanna sarà anche in grado di riallocare la potenza di calcolo inutilizzata su una griglia OpenStack per i carichi di lavoro Hadoop. Savanna fornirà un punto di integrazione per il software di provisioning e gestione Hadoop di terze parti, in particolare Apache Ambari.

Il team prevede di avere dimostrazioni del software pronto per il vertice Hadoop di giugno.

Oltre a fornire un potenziale tempo- strumento di risparmio per gli amministratori, Savanna è degno di nota in quanto mostra come le aziende stiano diventando più dipendenti dal software open source. "Stiamo iniziando a vedere importanti progetti come Hadoop e OpenStack da integrare, perché c'è questa enorme spinta nell'azienda per arrivare a un'infrastruttura open source unificata", ha detto Ionel.

Joab Jackson copre il software aziendale e la rottura della tecnologia generale notizie per Servizio IDG. Segui Joab su Twitter all'indirizzo @Joab_Jackson. L'indirizzo e-mail di Joab è [email protected]