L’IA? È il nuovo paradigma per la gestione delle operation! Con Kyndryl Bridge

di Piero Macrì ♦︎ La piattaforma gestisce un milione di server nel mondo: visibilità real time e d’insieme dell’IT in ambienti ibridi, on premise e in cloud. AiOps: risoluzione criticità per garantire continuità operativa. Algoritmi di intelligenza artificiale per una conoscenza incrementale: capacità previsionale basata sull’apprendimento. Ne parliamo con Raffaele Pullo

L’intelligenza artificiale come tecnologia per la gestione delle operation in ambiente It. E’ con questa logica che è stata sviluppata Kyndryl Bridge, la piattaforma di delivery services per gli operatori dell’information technology. Tra le prime soluzioni rese disponibili, AiOps, il servizio applicativo di decision making, supportato da algoritmi di AI che abilita l’observability ovvero la capacità di monitorare, misurare e comprendere in modo completo e dettagliato il funzionamento e le prestazioni di sistemi informatici complessi, multicloud e ibridi. La soluzione, che Kyndryl utilizza per conto di oltre 500 clienti a livello globale, gestisce quasi un milione di server. Secondo le stime, grazie alla prevenzione di migliaia di incidenti (ridotto del 74% il numero di fault per server al mese) e all’immediatezza degli interventi manutentivi, ha fatto risparmiare alle aziende una cifra prossima a 1 miliardo di dollari all’anno. «La logica con cui è stata progettata la soluzione va oltre il semplice monitoraggio delle risorse e dei componenti. Offre una vista real time end-to-end del sistema It, informazioni dettagliate per la risoluzione dei problemi e un aggiornamento continuo e dinamico delle prestazioni», afferma Raffaele Pullo, chief technology officer di Kyndryl Italia. Una giornata grigia è la migliore per gli utilizzatori di AiOps.

Nella dashboard i numeri che appaiono in grigio sono infatti indice di buona salute mentre tutto quello che richiede attenzione è evidenziato in rosso. Server che hanno un uptime inferiore al target previsto appaiono quindi in rosso. In grigio, invece, quelli che funzionano nel range di valori preventivato. Il tutto è accompagnato da indicatori di forecasting con descrizione di quello che potrà avvenire nel caso non si intervenga per la risoluzione dei problemi. «Le informazioni elaborate da algoritmi permettono di lavorare con automatismi di manutenzione, dice Pullo. E’ il nuovo paradigma per la gestione delle operation in ambienti ibridi ad alta complessità. Si avvale dell’Ai per ottenere suggerimenti di ordine tattico e strategico. E’ possibile rilevare quali sono le applicazioni critiche, quelle che presentano problemi reali o potenziali. Insomma, attraverso la console i team operativi hanno tutte le indicazioni per svolgere al meglio il proprio lavoro. Per ogni ticket manutentivo gli algoritmi raccomandano la possibile automazione, che viene poi propagata a tutti i sistemi e dispositivi che hanno quello stesso tipo di problema».







La piattaforma è poi la base da cui partire per creare soluzioni personalizzate, che vengono progettate e sviluppate dal team di consulenza Kyndryl su specifiche esigenze del cliente. L’evoluzione futura prevede il rilascio di nuovi moduli servizi, per la compliance e la sostenibilità, per il consumo energetico. Prevista anche l’integrazione di servizi di query basati su intelligenza generativa. «Si potranno fare interrogazioni in linguaggio naturale, racconta Pullo. Quale i server in un determinato intervallo di tempo ha avuto problemi di un certo tipo? Gli operatori avranno il loro co-pilot o assistente virtuale per accedere con immediatezza alle informazioni di cui necessitano. Sarà una funzione che renderemo presto disponibile».

 

Visibilità d’insieme di tutte le interconnessioni presenti in ambienti ibridi, on premise e in cloud

Raffaele Pullo, chief technology officer di Kyndryl Italia

Secondo una recente indagine effettuata da Kyndryl solo il 20% delle aziende dichiara di monitorare e gestire efficacemente le operazioni It in un’ottica end-to-end. I maggiori problemi che vengono menzionati sono la mancanza di una visione d’insieme, la complessità, i costi eccessivi, l’inadeguatezza delle informazioni, la non sufficiente automazione nella risoluzione degli incidenti. «AiOps è pensata per garantire la continuità operativa delle infrastrutture It, ridurre i rischi di interruzioni fornendo soluzioni di remediation, dice Pullo. La usiamo per gestire le infrastrutture di gran parte dei clienti in tutto il mondo. E’ diventato lo strumento indispensabile per gestire ambienti distribuiti, ibridi, che integrano risorse on premise e in cloud. Offre una visione olistica dell’infrastruttura evitando che gli operatori debbano ricorrere a più strumenti per garantire l’uptime e la continuità di servizio del patrimionio It».

Monitorare e tenere traccia dei dati di tutte le applicazioni software, infrastrutturali e aziendali attraverso un’unica dashboard; prendere decisioni informate, ridurre la complessità e agire in modo proattivo; sviluppare capacità di rilevare e risolvere i problemi prima che si verifichino. «AiOps risolve le maggiori criticità con cui si confrontano le organizzazioni It nella gestione di infrastrutture complesse, spiega Pullo. Le soluzioni di gestione multi-cloud delle risorse esterne al perimetro aziendale sono ormai fondamentali per modernizzare le tradizionali architetture It, afferma David Tapper, vice president outsourcing and managed cloud services di Idc. L’utilizzo di una piattaforma come Kyndryl Bridge permette di allineare i consumi con le esigenze specifiche degli utenti, mappare i costi per le diverse business unit e raggiungere le previsioni di budget»

 

Risoluzione preventiva di problemi ordinari e straordinari che possono verificarsi all’interno dei sistemi monitorati e informazioni per una trasformazione dell’esistente

Kyndryl Bridge, la piattaforma di delivery services per gli operatori dell’information technology

«AiOps fa ingestion di dati on premise e in cloud grazie all’integrazione con i tool di monitoraggio cloud nativi (cloud watch o azure monitor) forniti dai provider delle rispettive piattaforme, spiega Pullo. In questo modo si ha una visione olistica di tutta l’infrastruttura. Lavora su grandi data lake dove vengono riversati i dati che provengono da tutti gli asset. Funziona in maniera proattiva suggerendo le azioni che devono essere intraprese per garantire una continuità di servizio e performance elevate, a bassa latenza, risolvendo e prevenendo problemi ordinari e straordinari che possono verificarsi all’interno dei sistemi monitorati». AiOps offre, quindi, insight a partire dalle sorgenti dati disponibili. Ci sono dei certificati digitali in scadenza? Il sistema esegue una scansione evidenziando gli interventi di aggiornamento necessari. L’indicatore Mtbf segnala invece agli operatori il tempo medio con cui accade un problema. E’ inoltre in grado di creare un quadro prospettico con il quale analizzare se gli attuali server sono adatti per supportare workload moderni.

«Applicazioni sviluppate 10, 20 anni fa subiscono nel tempo un degrado fisiologico. Non sono progettate per far fronte alle attuali sollecitazioni. Basi dati vengono oggi interrogate attraverso smartphone o altri dispositivi mobili da migliaia di consumatori il carico di lavoro dei singoli sistemi aumenta di conseguenza in modo esponenziale. Le informazioni rilasciate da AiOps hanno, quindi, un valore strategico: mettono i responsabili It nella condizione di poter valutare eventuali modifiche strutturali per rendere quelle applicazioni adatte a supportare carichi moderni. Una soluzione potrebbe essere trasformare quelle applicazioni in una logica a microservizi, operazione che renderebbe la manutenzione più efficiente perché semplifica l’individuazione dei problemi».

 

Algoritmi di intelligenza artificiale per una conoscenza incrementale. La capacità previsionale basata sull’apprendimento

Tra le prime soluzioni rese disponibili, AiOps, il servizio applicativo di decision making, supportato da algoritmi di AI che abilita l’observability ovvero la capacità di monitorare, misurare e comprendere in modo completo e dettagliato il funzionamento e le prestazioni di sistemi informatici complessi, multicloud e ibridi

Sistemi prossimi all’end of life che non verranno più supportati con aggiornamenti? Ecco la segnalazione delle criticità cui prestare attenzione. Scadono i certificati digitali? Viene eseguita in automatico una scansione delle azioni da intraprendere entro e non oltre un periodo definito. E poi indicatori di best practice. In questo caso viene espressa la percentuale dei sistemi che sono stati configurati secondo policy aziendali. Best practice all’80%? Significa che il 20% dei sistemi non è compliant, che vanno aggiornate le patch di security o reingegnerizzate le configurazioni per ripristinare le prestazioni ottimali.

«Sono segnalazioni che emergono incrociando i dati dei sistemi con le informazioni del vendor di riferimento dello specifico sistema. In questo modo la remediation viene fatta in automatico, dice Pullo. Abbiamo sviluppato una vera fabbrica di procedure di automazione che possono essere attivate in funzione delle criticità che si evidenziano in una qualunque area del sistema informativo. Tutto questo grazie all’intelligenza artificiale, che diventa una sorta di co-pilot per l’organizzazione It responsabile della gestione dell’infrastruttura. E’ frutto degli algoritmi che lavorano all’interno della piattaforma». Probabilità di failure su orizzonte a 30 giorni, quali le azioni raccomandate? Sospetto sovraccarico di un server che potrebbe portare a un’interruzione del servizio? «L’Ai produce in automatico una conoscenza incrementale. Il valore delle informazioni è tanto più potente quanto più l’algoritmo è nelle condizioni di apprendere. La capacità di forecasting di AiOps si affina, quindi, nel tempo», osserva Pullo.

 

Upskill e reskill degli algoritmi. L’intelligenza artificiale che si adatta in modo dinamico ai cambiamenti dell’It

Quando si inizia a utilizzare la console l’applicazione lavora con algoritmi che sono stati in precedenza allenati, che quindi devono stabilizzarsi in funzione delle informazioni acquisite di giorno in giorno. Gli algoritmi sono quindi soggetti ad upskill e reskill: a mano a mano che aumentano i dati su cui lavorare aumenta la loro precisione in termini previsionali. «La qualità del servizio reso dall’Ai dipende dai dati, se non sono sufficienti o adeguati le informazioni non saranno più di tanto attendibili, dice Pullo. Con AiOps i team sono in grado di identificare rapidamente la fonte di un problema invece di condurre una lunga ricerca attraverso un intero set di dati per ricercare e interpretare le anomalie».

Servizi Kyndryl Bridge possono infine essere utilizzati per attività di assesment finalizzate alla modernizzazione e trasformazione dell’infrastruttura It, per identificare possibili migrazioni in cloud di workload on premis o riconfigurazione di sistemi esistenti. «Queste ultime sono tutte attività in carico alla consulting che insieme al cliente sviluppa soluzioni ad hoc», spiega Pullo. AiOps, quindi, come tecnologia abilitante la new wave della gestione dell’It. Secondo la ricerca cui abbiamo già accennato in precedenza, il 45% dei responsabili It aziendali è convinto che l’utilizzo di piattaforme ibride e multi-cloud siano indispensabili per favorire la visibilità sullo stato di funzionamento di ogni singola componente interconnessa nel framework informatico, dai mainframe, al middleware, server, dallo storage al networking in un report unico e di facile accesso.














Articolo precedenteEvent Propagation Simulator, il software di Baia che aiuta le Pmi nelle analisi di geopolitica
Articolo successivoDigital health, agrifood, smart cities e non solo: le 50 start-up italiane protagoniste del Ces 2024






LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui