Download  

Share via email
Comunicato Stampa (PDF)

Logo Cloudera

Cloudera, fornitore globale della piattaforma di analisi, gestione dei dati e apprendimento automatico più veloce, semplice e sicura basata sulle più recenti tecnologie open source, annuncia che Apache Kudu, il motore di archiviazione software open source (OSS) per analisi rapide sui dati in rapido movimento, è ora disponibile come componente all’interno di Cloudera Enterprise 5.10. Kudu, in particolare, semplifica il percorso di analisi in tempo reale, consentendo agli utenti di agire rapidamente sui dati per prendere decisioni migliori.

Cloudera, fornitore globale della piattaforma di analisi, gestione dei dati e apprendimento automatico più veloce, semplice e sicura basata sulle più recenti tecnologie open source, annuncia che Apache Kudu, il motore di archiviazione software open source (OSS) per analisi rapide sui dati in rapido movimento, è ora disponibile come componente all’interno di Cloudera Enterprise 5.10. Kudu, in particolare, semplifica il percorso di analisi in tempo reale, consentendo agli utenti di agire rapidamente sui dati per prendere decisioni migliori.

“L’analisi dei dati in tempo reale è una sfida per le imprese in quanto richiede un’architettura lambda (LA) complessa per integrare insieme l’elaborazione dei flussi e l’analisi dei batch in tempo reale. Kudu facilita notevolmente tale architettura offrendo un unico motore di storage che risolve entrambe le esigenze”, ha dichiarato Charles Zedlewski, senior vice president dei prodotti Cloudera. “I carichi di lavoro impegnati oggi esistenti, tra cui un numero crescente di nuovi modelli di apprendimento automatico, possono identificare le minacce di sicurezza informatica, prevedere problemi di manutenzione nell’Industrial Internet of Things (IIoT) e offrire una maggior precisione per qualsiasi tipo di reporting online”.

Kudu è stato progettato fin da subito per sfruttare l’innovazione nel panorama hardware, che ha visto diventare più convenienti dischi SSD, memoria e RAM. Kudu ha già dimostrato la sua validità come motore di storage stand alone per l’utilizzo in produzioni mission-critical in cluster con centinaia di nodi che gestiscono diversi milioni di inserimenti al secondo. Kudu è stato realizzato appositamente per casi d’uso che richiedono scansioni analitiche veloci e su larga scala, supportando dati che vengono aggiornati rapidamente – fondamentale per la gestione dei dati multidimensionali, per l’analisi dei dati macchina, per il reporting online o altre esigenze in termini analitici o operative dei carichi di lavoro.

“Apache Kudu è un chiaro esempio di come la piattaforma Apache Hadoop® si stia evolvendo da una serie ben definita di progetti Apache a un ‘mix and match’ di tecnologie open source e proprietarie che danno vita, in sostanza, a un ambiente operativo big data,” ha dichiarato Tony Baer, principale analista di Ovum. “Kudu aggira gli ostacoli associati alle architetture lambda complesse per affrontare i casi di utilizzo che coinvolgono dati in rapida evoluzione, dove è fondamentale la capacità di modificare e aggiornare il database in modo rapido”.

I programmi beta per i clienti Cloudera, direttamente e tramite partner, hanno portato Kudu all’interno di ambienti di produzione critici. È inoltre prevista un’ulteriore adozione tra la clientela di Cloudera per affrontare un numero sempre crescente di casi d’uso che richiedono analisi in tempo reale.

“Per ottenere reportistica a livello di conformità e operativa e analisi di successo è necessaria la capacità sia di elaborare grandi quantità di dati per individuare le tendenze, sia di rilevare e rispondere rapidamente alle anomalie”, ha dichiarato Michael Reed, direttore della gestione delle informazioni aziendali di Meridian Health. “Siamo entusiasti della possibilità che Kudu ci offre di effettuare operazioni di analisi e in tempo reale in un unico luogo al fine di semplificare i sistemi che creiamo”.

Oltre a Kudu, Cloudera 5.10 (e il rilascio di Cloudera Diretor 2.3) continua a potenziare le funzionalità di livello enterprise per distribuzioni cloud e a migliorare il rapporto costo-efficienza in tali ambienti. Le nuove funzionalità includono:

  • costi operativi ridotti per l’elaborazione batch su carichi di lavoro temporanei con prestazioni migliorate di Apache Hive su Amazon S3;
  • funzioni più complete di auditing e lineage nel cloud con il supporto single-cluster di Cloudera Navigator per Amazon S3;
  • minor tempo per la distribuzione del caso d’uso iniziale con prime implementazioni più rapide in ambienti di cloud.

Nel settembre 2015 Cloudera ha annunciato la versione beta pubblica di Apache Kudu, e due mesi dopo Cloudera ha donato Kudu alla Apache Software Foundation (ASF) per renderlo disponibile alla comunità di sviluppo più ampia e guadagnare il contributo degli ingegneri di State Farm, Xiaomi, Intel e altri. Kudu è già disponibile e fornito come componente standard di Cloudera Enterprise, offrendo ai clienti un robusto set di motori di storage – NoSQL, HDFS, archivio di oggetti e relazionale – per soddisfare le esigenze specifiche dei singoli caso d’uso.

 

Il supporto da parte del settore

Agil Data (SI)

“Apache Kudu rappresenta un importante passo in avanti nel campo della tecnologia per i database open source, poiché consente analisi dei dati in tempo reale in modi che in precedenza erano molto difficili da implementare. Osserviamo una vasta gamma di casi d’uso per Kudu, in particolare nel settore dell’InsurTech (la tecnologia per il settore assicurativo, nda), e prevediamo avrà un impatto positivo su molti dei nostri clienti e progetti nei prossimi anni”.

–Cory Isaacson, Executive Chairman

Arcadia Data

“Siamo entusiasti di integrare Apache Kudu con Arcadia Enterprise in quanto fornisce un motore di storage in tempo reale e reattivo per le applicazioni aziendali data-centric. In qualità di sviluppatore di applicazioni è fantastico disporre di una API pulita che possiamo usare per Apache Impala, Apache Spark o direttamente all’interno di Arcadia Enterprise. Con Kudu siamo finalmente giunti a un punto in cui Hadoop va oltre il mero inserimento e analisi dei dati per diventare il luogo in cui, di fatto, Arcadia è in grado di generare e aggiornare i dati senza la necessità di dover spostare i dati stessi”.

–Shant Hovsepian, co-founder and chief technology officer

Avalon Consulting, LLC

“L’obiettivo principale di un recente progetto per l’elaborazione delle carte di credito in Avalon era quello di ri-progettare il sistema di elaborazione tradizionale basato sui batch del nostro cliente per migliorare l’agilità e aggiungere avvisi in tempo reale di rilevamento delle frodi oltre a dashboard quasi in tempo reale. Utilizzando Kudu e Impala, siamo stati in grado di raggiungere il tempo di risposta inferiore ai due secondi richiesto per le query dal nuovo sistema. Se avessimo utilizzano un dataware house enteprise il costo sarebbe stato proibitivo rispetto all’utilizzo di Cloudera, e Kudu ci ha aiutato a soddisfare i nostri requisiti di latenza più critici”.

Tom Reidy, chief executive officer

Capgemini

“I clienti di Capgemini stanno maturando nell’utilizzo di big data, analisi e data science, e la necessità di maggiori carichi di lavoro di analisi in tempo reale su big data e fast data, compresi i dati in ambito IoT e streaming, è diventata un tema sempre più centrale. La disponibilità generale di Kudu è un grande passo in avanti per agevolare i nostri clienti a creare processi critici ancor più incentrati su analisi approfondite, sulla loro piattaforma di business analytics, destinati ad accelerare il loro percorso di trasformazione digitale”.

–Anne-Laure Thieullent, VP Global Big Data Solutions, Insights & Data

RCG Global Services

“RCG Global Services considera Kudu come un importante passo avanti nello storage dei dati per i big data. Fornisce bassa latenza e prestazioni elevate per leggere e scrivere dati sui cluster Cloudera per soddisfare le necessità delle applicazioni più esigenti, tra cui l’analisi in tempo reale. In RCG Global Services abbiamo incorporato Kudu all’interno delle nostre soluzioni Cloudera RCG|enableTM certificate per il settore bancario, sanitario, assicurativo, retail e ospitalità per sfruttare tali caratteristiche”.

–Rick Skriletz, Global Managing Principal

SoftServe

“Apache Kudu è un eccezionale avanzato sistema di archiviazione basato su colonne, a cui SoftServe si affida per mantenere i dati centralizzati, accessibili e sicuri. Come parte di un progetto recente di elaborazione dei pagamenti che coinvolge una tra le quattro più grandi società di servizi professionali, gli sviluppatori di SoftServe hanno scelto Kudu per la sua capacità di supportare enormi set di dati, fornendo consistenza alle transazioni. Kudu era l’unico strumento con entrambe queste caratteristiche e l’unico ad aver superato i test di prestazioni e affidabilità, permettendoci di offrire una soluzione innovativa per supportare gli obiettivi di business del nostro cliente”.

–Todd Lenox, VP, Digital Partnerships

Streamsets

“L’integrazione di Apache Kudu in CDH semplificherà notevolmente l’esecuzione dei carichi di lavoro misti che i nostri clienti utilizzano sempre più quando spostano il proprio data warehouse enterprise e i flussi in tempo reale su Hadoop. La soluzione StreamSets Data Collector certificata da Cloudera supporta Kudu in modalità nativa come destinazione del flusso di dati plug-and-play, e StreamSets Dataflow Performance Manager aiuta a garantire la disponibilità continua e l’accuratezza dei dati che fluiscono all’interno di Kudu”.

–Arvind Prabhakar, chief technology officer

TCS

“Kudu ci permette di fare un salto di qualità lavorando con i clienti che necessitano un livello di servizi veloci sui dati in quanto possono facilmente gestire la velocità elevata dei dati nei sistemi digitali moderni. Per esempio per il sistema IoT ad alte prestazioni che stiamo progettando per i nostri clienti, la combinazione di Apache Spark con Apache Kudu è essenziale per soddisfare i requisiti di sistema. Un vantaggio fondamentale per noi è che non vi è alcuna necessità di riqualificare i nostri sviluppatori, già esperti nella tecnologia Apache Hadoop HDFS, al fine di utilizzare in modo efficace Apache Kudu. Siamo felici della disponibilità generale di Apache Kudu e ci aspettiamo di poterlo utilizzare ampiamente nei nostri progetti presso i clienti”.

–Dr. Satya, vice president, TCS Digital Business

Zoomdata

“La disponibilità generale di Kudu all’interno di Cloudera Enterprise è una tappa importante del percorso dell’analisi in streaming. Zoomdata ha colto il valore di Kudu fin da subito e ha lavorato con il team di ingegneri di Cloudera per sviluppare una serie di funzionalità di analisi per i big data che sfruttano Kudu al meglio. Oggi possiamo offrire ancora più valore ai clienti comuni di Cloudera e Zoomdata grazie alla possibilità di eseguire query analitiche visive in tempo reale”.

–Ruhollah Farchtchi, chief technology officer

 

Risorse aggiuntive per Apache Kudu

 

Risorse aggiuntive per Cloudera 5.10