androide

Yahoo cerca Hadoop Boost con rilascio della versione interna

What is Hadoop Distributed File System (HDFS)?

What is Hadoop Distributed File System (HDFS)?
Anonim

Per far avanzare l'adozione della tecnologia Hadoop per l'elaborazione di enormi set di dati, Yahoo rilascerà una versione del software perfezionato per alimentare molti dei suoi siti e servizi chiave.

L'annuncio è stato mercoledì alla seconda edizione annuale di Hadoop Summit, organizzato da Yahoo e sponsorizzato da diversi importanti fornitori che supportano questa tecnologia, tra cui IBM, Sun e Amazon.com.

I motori di ricerca, i sistemi pubblicitari e il servizio di webmail di Yahoo utilizzano Hadoop, un'implementazione open source del modello di programmazione MapReduce per l'elaborazione di set di dati di grandi dimensioni in cluster di processori.

[Ulteriori letture: I migliori servizi di streaming TV]

A Yahoo, Hadoop utilizza più di 25.000 server per scriccolare dati su decine di miliardi di pagine Web, decine di animali domestici abili di storage e miliardi di record ogni giorno.

Rilasciando il codice sorgente della sua distribuzione Hadoop, Yahoo spera di potenziare lo sviluppo di questo progetto Apache Software Foundation.

Yahoo, che impiega il fondatore di Hadoop, Doug Cutting, contribuisce al suo Miglioramenti Hadoop al progetto Apache, ma ora sta rilasciando la sua piena implementazione Hadoop, che è la più grande al mondo ed è stata ampiamente testata e perfezionata per l'uso in sistemi di produzione dal vivo. Il codice di Yahoo arriva senza restrizioni sul suo uso commerciale.

"C'è stato un grande interesse espresso che se lo avessimo reso disponibile, sarebbe utile ad altri utenti", ha affermato Shelton Shugar, vicepresidente senior del cloud computing presso Yahoo.

Yahoo sta consolidando sempre più le piattaforme di elaborazione sui cluster Hadoop perché possono scalare meglio e fornire l'elaborazione dei dati su larga scala che richiedono i siti ei servizi dell'azienda, ha affermato.

"Siamo molto contenti di come Hadoop sia È una piattaforma favolosa ", ha affermato Shugar.

Amazon.com ha recentemente lanciato un servizio in hosting progettato per semplificare agli sviluppatori l'uso di Hadoop chiamato Amazon Elastic MapReduce, mentre aziende come le distribuzioni Hadoop commerciali del mercato Cloudera progettate per implementazioni aziendali.