Download  

Share via email
Comunicato Stampa (PDF)Immagini

Logo Cloudera

Cloudera Enterprise 5.7 migliora l’elaborazione dei dati con il supporto di Hive-on-Spark e fornisce visibilità sull’utilizzo multi-tenant

Cloudera, fornitore globale della piattaforma di analisi e gestione dei dati più veloce, semplice e sicura basata su Apache Hadoop e delle più recenti tecnologie open source, annuncia oggi la disponibilità di Cloudera Enterprise 5.7. Questa nuova release offre prestazioni avanzate per i carichi di lavoro più importanti – tra cui un miglioramento medio di tre volte superiore per l’elaborazione dei dati con il supporto aggiuntivo di Hive-on-Spark, e un miglioramento medio di due volte superiore per le analisi di business intelligence con aggiornamenti per Apache Impala (in fase di progettazione). Inoltre, questa versione aggiunge visibilità sull’utilizzo multi-tenant di questi carichi di lavoro per una gestione efficiente e l’ottimizzazione delle risorse. Cloudera Enterprise 5.7 rappresenta un ulteriore significativo progresso per Hadoop e la sua crescita al fine di supportare nuovi e svariati casi d’uso, ed è rappresentativo della leadership di Cloudera nel garantire alle imprese moderne un utilizzo completo della piattaforma all’interno dell’intera struttura aziendale.

“Nel corso degli ultimi dieci anni, Hadoop si è evoluto in modo significativo e, a seguito di ogni progresso, intravvediamo il potenziale per nuove applicazioni e casi d’uso, migliorando al contempo ciò che è già stato fatto”, ha dichiarato Charles Zedlewski, vice president, Products di Cloudera. “L’avanzamento della progettazione dei dati e lo sviluppo ETL con Hive-on-Spark segna una tappa fondamentale di questa evoluzione – rafforzando ulteriormente il posizionamento di Spark quale motore standard per l’elaborazione dei dati in Hadoop. Tuttavia, l’engineering dei dati è solo una parte della storia nel mondo business di oggi e, con il rilascio 5.7, i nostri clienti possono abilitare un’ampia gamma di utenti alla piattaforma, il tutto mantenendo prestazioni veloci, facilità di gestione e compliance per la sicurezza”.

Lo sviluppo ETL e l’elaborazione in batch rimangono tra i casi di utilizzo più comuni per Hadoop. Apache Hive svolge da tempo un ruolo chiave per i carichi di lavoro, anche se tradizionalmente sfrutta MapReduce come motore di esecuzione. Tuttavia, grazie alle sue caratteristiche di facile sviluppo e prestazioni più veloci rispetto a MapReduce, Apache Spark assume un ruolo sempre più importante ed è candidato a sostituire MapReduce per i carichi di lavoro. L’anno scorso Cloudera ha lanciato One Platform Initiative come roadmap per completare il processo di transizione da MapReduce a Spark e per stimolare lo sviluppo di una migliore integrazione con Hadoop Spark, assicurando la soddisfazione dei requisiti aziendali per i carichi di lavoro di produzione anche su larga scala. Il rilascio di Hive-on-Spark in Cloudera 5.7 porta Spark più vicino agli sviluppatori che possono ora sfruttare le potenti capacità di elaborazione dei dati di Spark, pur continuando a utilizzare Hive, con prestazioni triplicate. Hive-on-Spark è un’iniziativa basata sulla community lanciata da Cloudera, IBM, Intel, MapR e altri, che coinvolge i clienti di molti settori – tra cui pubblicità, servizi finanziari e assicurazioni – come parte di un programma di accesso privilegiato per favorire un ulteriore sviluppo.

Per ulteriore coerenza, Cloudera ha lavorato con un ecosistema di oltre 2.300 partner per garantire ai clienti la possibilità di continuare a utilizzare gli strumenti principali per l’integrazione dei dati e di preparazione con Hive-on-Spark, senza interrompere l’attività aziendale. Partner tra cui BMC, ClearStory Data, Elastic, NGDATA, Solix, Trillium Software, Zementis e altri stanno collaborando con Cloudera per certificare le loro tecnologie per una transizione ottimale.

Essere in grado di supportare molteplici casi d’uso attraverso gli stessi dati condivisi all’interno di un singolo cluster è un vantaggio fondamentale per Hadoop. Con Cloudera Enterprise, gli amministratori possono facilmente fornire agli utenti e alle applicazioni le risorse corrette da utilizzare per soddisfare gli accordi Service Level Agreements (SLAs) più critici. Con quest’ultima release, gli amministratori ottengono piena visibilità sull’utilizzo passato e sull’efficienza per utenti, tenant e applicazioni. La nuova funzionalità di reporting di utilizzo del cluster, incorporata in Cloudera Manager, garantisce operazioni efficienti e la corretta allocazione delle risorse tra gruppi e tipologie di carico di lavoro; questo aiuta a soddisfare gli accordi SLA e fornisce una semplice risoluzione delle problematiche legate alle prestazioni di lavoro e alle query.

Di seguito, alcune delle altre caratteristiche di Cloudera 5.7:

  • Raddoppio delle prestazioni per le analisi di BI: Impala continua a mantenere la sua leadership in termini di prestazioni come il più veloce motore analitico SQL per Hadoop attraverso il partizionamento dinamico, un più veloce avvio delle query, filtri di runtime e altro ancora
  • Percorso semplificato per la produzione: Cloudera Manager include modelli di cluster che forniscono un semplice flusso di lavoro per replicare facilmente le impostazioni di configurazione di nuovi cluster – che lo rende facile da dislocare da un ambiente di test ottimizzato alla produzione, scalare tra le diverse aree geografiche o ripristinarlo rapidamente a una configurazione conosciuta in caso di problemi
  • Governance dei dati ottimizzata: Cloudera Navigator si apre alla gestione dei dati e alla governance per l’utente business con funzionalità di derivazione semplificate per stabilire l’affidabilità e la provenienza dei dati, e aggiunge metadati gestiti per migliorare la reperibilità e la coerenza tra i sistemi.

Cloudera 5.7 è ora disponibile al link www.cloudera.com/downloads

 

Ulteriori risorse su Cloudera 5.7

 

Le immagini sono disponibili qui.

 

Il supporto dei partner per Cloudera 5.7

BMC

“L’investimento di Cloudera in Hive-on-Spark è un valore significativo per le tecnologie Hive esistenti e per gli utenti. Siamo lieti di sostenere quest’ennesima innovazione con la soluzione leader di settore Control-M per Hadoop. Unitamente alla pianificazione dei processi di Hive-on-Spark, i clienti di CONTROL-M possono inoltre ottenere il supporto per SQL Spark, Spark Streaming, Shell Scripting e molto altro ancora. La nostra partnership con Cloudera continua a portare nuovo valore aggiunto per gli utenti Hadoop in tutto il mondo”.

– Tim Eusterman, senior director of Solutions Marketing di BMC Workload Automation

ClearStory Data

“Siamo entusiasti di consolidare ulteriormente il nostro impegno verso Spark con il supporto di Hive-on-Spark all’interno della nostra soluzione di analisi dei dati basata su cloud. L’integrazione di Hive con il motore di esecuzione Spark permette un’esperienza perfetta in termini di inserimento, query e di inferenza dei dati per una rapida analisi del ciclo quando si uniscono e armonizzano dati diversi su larga scala per ottenere informazioni di business amplificate”.

– Tim Howes, Chief Technology Officer

Elastic

“Elastic abilita un’opzione di ricerca in tempo reale per la più recente innovazione di Cloudera Enterprise, Cloudera Hive-on-Spark, a beneficio degli utenti che stanno passando da MapReduce a Spark e che desiderano utilizzare Elasticsearch. Questa integrazione certificata estende la continua collaborazione tra Elastic e Cloudera per Elasticsearch Hadoop e le distribuzioni Spark”.

– Costin Leau, Engineering Lead di Elastic

NGDATA

“NGDATA fornisce una soluzione completa per l’analisi dei clienti e l’ottimizzazione della customer experience per stimolare nuove offerte per banche, media company e aziende di telecomunicazioni. Poiché la nostra pipeline di NBO è progettata e ottimizzata per l’esecuzione in tempo reale sui dati comportamentali dei clienti, i responsabili aziendali hanno aspettative di performance simili anche per la reportistica ad-hoc. Grazie a Hive-on-Spark ora possono godere di un notevole aumento della velocità di tali attività di reporting, senza alcuna necessità di riconfigurazione. Siamo entusiasti di lavorare con Cloudera nella promuovere l’adozione di Spark all’interno dell’ecosistema, in quanto offre vantaggi di business tangibili ai nostri clienti”.

– Steven Noels, CTO e co-fondatore

Solix

“La certificazione su Cloudera 5.7 significa ottenere migliori prestazioni e fruibilità per i clienti di Solix Big Data Suite. Con Hive-on-Spark la maggior parte dei carichi di lavoro di dati strutturati possono ora essere eseguiti su Apache Hadoop”.

– Sai Gundavelli, CEO

Trillium Software

“Le aziende fanno sempre più affidamento su Hadoop per elaborare grandi volumi di dati complessi, e desiderano anche accelerare il time-to-value delle iniziative basate sui dati. Il rilascio di Cloudera Enterprise 5.7 dimostra l’impegno di Cloudera nel fornire soluzioni innovative in grado di ottimizzare la velocità e l’efficienza per la migrazione dei dati, l’integrazione dei dati e l’elaborazione dei dati operativi con Hadoop, semplificando anche la gestione e la supervisione di Hadoop. Con Hive-on-Spark che alimenta Trillium Perfeziona ™, le aziende possono accelerare la preparazione e l’elaborazione dei dati per consentire una migliore analisi e un processo decisionale più rapido per stimolare la crescita aziendale”.

— Keith Kohl, vice president, product management

Zementis

“Con l’aggiunta del supporto Hive-on-Spark al proprio ecosistema Hadoop, Cloudera consente agli utenti di applicare le tecniche di gestione e analisi dei dati in modo più efficiente. Tale capacità è un elemento chiave di differenziazione per applicazioni aziendali più intelligenti, per questo siamo orgogliosi di collaborare con Cloudera e fornire Zementis Universal PMML Plug-in (UPPI) come comune motore di esecuzione basato su standard al fine di rendere operativi l’apprendimento automatico e analisi predittive avanzate attraverso Hive, Spark e Storm”.

–Dr. Michael Zeller, CEO