Componenti

Database analitico 'frontline' di Aster Data Update

Aaron Agius & David Allison: Big Data & the End of Demographic Stereotypes

Aaron Agius & David Allison: Big Data & the End of Demographic Stereotypes
Anonim

Startup Aster Data Systems ha rilasciato la versione 3.0 del suo database analitico nCluster martedì, inquadrandola come ideale per il data warehousing "in prima linea.

" Tradizionalmente, pensiamo al data warehousing come un'attività di back-office ", ha scritto il CEO di Aster Mayank Bawa in un blog post martedì. "Il data warehouse può essere caricato in finestre di caricamento separate, i carichi possono essere eseguiti in ritardo (l'effetto netto è che gli utenti riceveranno i loro rapporti in ritardo), carichi, backup e scalabilità possono portare i data warehouse offline queste attività possono essere svolte in orari non lavorativi (notti / fine settimana). "

Ma i clienti di Aster, che includono aCerno, una rete di distribuzione di pubblicità su Internet," si basano sull'analisi dei dati per le loro entrate ", ha affermato Bawa. Aster's nCluster 3.0 distribuisce i carichi di lavoro su un numero di server e semplifica l'aggiunta di ulteriori macchine per una maggiore potenza. Il software divide anche i vari componenti di un carico di lavoro di analisi dei dati in pezzi discreti.

Un livello "loader" si occupa del caricamento e dell'esportazione dei dati da e verso fonti esterne; un livello "lavoratore" memorizza i dati su dischi collegati localmente per l'interrogazione; e uno strato di nodi "regina" esegue una pianificazione ed elaborazione intelligente delle query.

Nel frattempo, gli utenti lavorano con il cluster come se fosse una singola entità.

La possibilità di ridimensionare selettivamente i segmenti del cluster significa che gli utenti possono aggiungere risorse nelle aree in cui sono più necessari, afferma Aster.

A queste funzionalità fondamentali, la versione 3.0 aggiunge una serie di funzioni per l'utilizzo "always-on", inclusa la capacità di aggiungere capacità, ribilanciare i dati e recuperare i dati mentre il

Aster ha anche lavorato per aggiungere la parallelizzazione in tutto il sistema, secondo un funzionario della compagnia.

"Vogliamo costruire sistemi in grado di gestire 10 volte, 100 volte più dati di qualsiasi altro sistema oggi. molti dati per ogni singolo server di merci ", ha detto il CTO Tasso Argyros in un post sul blog. "Abbiamo quindi investito molto in ricerca e sviluppo parallelizzando ogni singola funzione del sistema, non solo le query, ma anche il caricamento, l'esportazione dei dati, il backup e gli aggiornamenti, oltre a consentire ai nostri utenti di scegliere quanto vogliono parallelizzare tutti queste funzioni, senza dover scalare l'intero sistema. "

La versione include anche il supporto per MapReduce, una tecnica di programmazione originariamente sviluppata da Google che rende più facile per gli sviluppatori scrivere programmi per analizzare grandi serie di dati. Il concorrente di Aster Greenplum ha anche recentemente annunciato il supporto di MapReduce.

Altre funzionalità includono la possibilità di selezionare i livelli di compressione dei dati per le singole tabelle, uno strumento di aggiornamento "one-click"; e migliori funzionalità di sicurezza, come LDAP (Lightweight Directory Access Protocol) per l'autenticazione e la capacità di gestire i privilegi degli utenti a livello di cluster, database e tabella.

Molti dei clienti iniziali di Aster, che includono anche MySpace, sono incentrati sul Web, ha dichiarato Curt Monash, presidente di Monash Research.

"Un'enorme frazione della crescita e delle opportunità nel data warehousing sta nel trattare con tipi di dati relativamente nuovi", ha affermato. "Ci sono grandi magazzini di dati che si occupano di OLTP tradizionali, dati transazionali, ma Aster non è necessariamente un concorrente leader nell'analisi di questo, ma il punto debole nell'analisi di grandi quantità di dati sono attualmente dati Web e eventi di rete associati."

Monash citato amministrazione parallela dell'elaborazione e supporto per MapReduce come punti di forza di Aster: "Aster è una startup con un prodotto relativamente immaturo, ma ci hanno pensato molto su come rendere l'elaborazione parallela facile da amministrare."

NCluster 3.0 corre su server x86 standard. Il prezzo si basa sulla quantità di dati gestiti. La società in precedenza ha affermato che i costi partono da US $ 100.000.