EY aiuta i clienti a generare valore a lungo termine per tutti gli stakeholder. Potenziati dall'analisi dati e dall'innovazione tecnologica, i nostri servizi e soluzioni offrono sicurezza tramite la verifica e supportano i clienti nel loro percorso di trasformazione, crescita e gestione operativa.
In EY, il nostro purpose è quello di costruire un better working world. Gli insight e i servizi che forniamo contribuiscono a generare valore a lungo termine per i clienti, le persone e la società e a creare fiducia nei mercati dei capitali.
L’elevata mole di dati da processare e analizzare porta spesso a problemi di performance. Sulla base dell’esperienza maturata in contesti complessi che analizzano grandi moli di dati, EY ha individuato alcune tecniche applicabili ai Big Data finalizzate all’ottimizzazione delle performance:
Partizionamento: Distribuire i dati su più tabelle, dischi o partizioni per migliorare le prestazioni di elaborazione delle query o aumentare la gestibilità del database
Hashing: Creare id interi sintetici applicando tecniche di hashing alla chiave primaria originale (di solito una combinazione di più colonne e tipi di dati)
Caching: Utilizzo dello storage in-memory per ridurre i tempi di interrogazioni
Materializzazione: Persistere i risultati di trasformazioni complesse dei dati per evitare calcoli troppo lunghi on the fly
Ottimizzazione del codice: Riformulare parte del codice per renderlo più efficiente
Ottimizzazione dei data type: Alcuni tipi di dati occupano meno spazio o sono molto più efficienti di altri quando si tratta di relazioni o filtri (ad esempio, numeri interi o stringhe)
Ottimizzazione dei cluster: Sfruttare l'elaborazione multiparallela di Spark con una corretta configurazione del cluster
Pulizia dei dati: Rimuovere i dati inutilizzati per ridurre i tempi di trasferimento e di calcolo