Windows

Hadoop ottiene più ricerca con MapR, Cloudera rilasci

Hadoop Rack Awareness

Hadoop Rack Awareness
Anonim

Gli utenti della piattaforma di elaborazione dati Hadoop ora hanno altri due strumenti per aiutarli a ordinare attraverso le loro montagne di informazioni.

La nuova distribuzione M7 di MapR rimuove i livelli JVM di Hadoop per migliorare le prestazioni

Hadoop distributore MapR ha integrato la ricerca LucidWorks nella propria distribuzione. Cloudera, nel frattempo, ha lanciato la prima versione completa del suo motore di query SQL Impala open source per Hadoop.

[Ulteriori letture: I migliori servizi di streaming TV]

"Usare la ricerca come interfaccia utente per i big data è molto interessante. La ricerca è ideale per sfruttare molti tipi diversi di informazioni, in particolare le informazioni non strutturate ", ha affermato Jack Norris, Chief Marketing Officer di MapR. "Vediamo alcune applicazioni davvero interessanti con i motori di ricerca al loro interno, anche se un utente tipico non le considererebbe come motore di ricerca."

LucidWorks Search è la versione commerciale dell'open source Apache Lucene / Solr full -text motore di ricerca. Con la nuova integrazione MapR, LucidWorks Search è in grado di effettuare ricerche tra i dati su Hadoop File System (HDFS) o su altri file system.

LucidWorks Search offre istantanee e mirror per l'alta disponibilità ed elimina gran parte del lavoro richiesto per installa Lucene / Solr da zero. Offre inoltre supporto nativo per più fonti di dati, un'interfaccia grafica utente e un framework di sicurezza.

Il motore di ricerca potrebbe essere utilizzato in un'applicazione Web dinamica per recuperare rapidamente foto, pubblicità, consigli sui prodotti e altre informazioni che possono essere utilizzate per popolare siti Web al volo. "Questo non è un sostituto a costo inferiore per i data warehouse. Si tratta di sfruttare nuove fonti di dati e fare alcune cose che hanno un impatto drammatico sul business ", ha detto Norris.

MapR e LucidWorks hanno lavorato insieme per accoppiare le loro tecnologie dal 2011, quando hanno stipulato un accordo di marketing congiunto. All'inizio di quest'anno, hanno rilasciato un connettore che semplifica l'utilizzo di Lucene / Solr con la distribuzione MapR Hadoop.

LucidWords Search funziona con la distribuzione M7 appena rilasciata di MapR, in versione beta. Oltre a supportare LucidWorks Search, l'edizione M7 è stata riprogettata per eliminare compactions o controlli di coerenza dello sfondo, accelerando le prestazioni.

Anche questa settimana, Cloudera ha rilasciato la versione 1.0 di Cloudera Impala, un motore di query conforme SQL open source per Hadoop. SQL è la lingua dell'interfaccia del database utilizzata nei sistemi di gestione dei database relazionali (RDMS) ed è ben nota agli amministratori di database.

Impala è stato progettato per eseguire query più velocemente di Hiveop Hive, perché non utilizza il framework MapReduce, che richiede risultati di ricerca da scrivere sul disco. Invece, gli utenti possono interrogare i dati memorizzati direttamente in HDFS e HBase. Gli utenti possono interrogare i dati in modo interattivo o tramite processi batch.

Cloudera ha rilasciato per la prima volta una versione di questo motore lo scorso ottobre come beta. Da allora, il software è stato testato da aziende come 37signals e Expedia.

Impala è il componente principale del pacchetto supplementare Cloudera Enterprise RTQ (Real-Time Query) per la piattaforma Cloudera Hadoop. Impala può essere scaricato gratuitamente.

Aggiornato il 6 maggio per correggere le informazioni sulla tecnologia Cloudera Impala.