Blogg

3 anledningar att införa automatisering & maskininlärning för IT-operations

Klart vi ska automatisera!

Automatisering och effektivitet går hand i hand och är något som varit omtalat inom IT sedan 70-talet. Trots detta är det fortfarande väldigt många som önskar att de kommit mycket längre än vad de gjort.

Den växande mängden enheter som skall övervakas i kombination med högre krav på tillgänglighet gör det mer angeläget att se över sina interna processer. Särskilt nu när digitaliseringen införs med mer och mer kritiska e-tjänster som förväntas vara tillgängliga dygnet runt.

Att införa automatisering innebär kort och gott att ta bort manuella processer som enkelt kan utföras av en maskin enligt förbestämda rutiner - på kortare tid och på samma sätt, varje gång.

Vissa processer har redan kommit väldigt långt inom detta. Bland annat beställningar av utrustning, uppsättning av användare eller uppdatering av servrar, tillsammans med mycket administrativt arbete.

På driftavdelningen inom IT finns det tre intressanta områden med stor potential att automatisera manuella processer för att bli mer effektiv, få kortare ledtider och reducera repetitivt arbete.


Vad kan maskininlärning tillföra?

Maskininlärning har tidigare uppfattats som inte är direkt relevant för traditionell övervakning och incidenthantering. Men fler och fler inser att det är ett ämne av högsta relevans för att förenkla vardagen, i alla led.

Istället för att manuellt eskalera incidenter eller skicka ut notifieringar på beredskap via komplexa och trubbiga regelverk kan maskininlärning appliceras.

Vi kan relativt enkelt träna en maskin att automatiskt identifiera mönster och sedan utföra de åtgärder vi önskat på väldigt kort tid.

Vi har redan börjat med automatisering. 

Troligtvis har ni redan börjat att implementera automatisering på flera områden. Eftersom automatisering är ett så pass brett område fokuserar denna artikel på aktiviteter som ökar värdet av det som övervakningen levererar och som är mer relevanta för er inom IT-operations.

Tre viktiga automatiseringsområden

Eskalering 

Eskalering anses vid första anblick som en ganska enkel process att automatisera. Men desto mer komplex regelverket blir för att olika typer av larm ska distribueras till olika grupper beroende på vissa kriterier, desto svårare blir det också att enkelt styra dessa rätt via ett statiskt regelverk.

Istället för att bygga komplexa script eller program kan man istället titta på ett larm och träna den vart de skall skickas. Hur den sedan kommer fram till slutsatsen är var maskininlärning kommer på sin rätta plats. Den hittar mönster vi själva inte visste fanns.

Stora tidsbesparingar kan göras genom att korta handläggningstiden tack vare att ärenden skickas till rätt gruppering utan att behöva vänta på ett manuellt beslut.

EZalert1.png

Återställning

Många fel som inträffar på operativsystemsnivå eller kring tjänster som stoppas oavsiktligt kan enkelt återställas.

Även om det finns möjlighet att på en windows-tjänst konfigurera att den startas upp om den stannas så är det bättre att låta ett övervakningssystem fånga upp felet. Då ett övervakningssystem kan både återställa och föra statistik blir det enklare att följa upp eventuella återkommande störningar. Denna statistik blir även ett bra underlag för problemprocessen med leverantör – dialogen blir baserad på data istället för rykten och magkänsla.

Många återställningar behöver vara klart definierade men det finns också möjlighet att via maskininlärning träna en modell som lär sig vilka återställningar som skall köras för att minimera komplexiteten.

EZalert2.png

Diagnostik

Många fel som inträffar kan vara svårt att automatiskt återställa, men detta innebär inte att vi ska utesluta automatisering.

Om en disk indikerar att den får slut på utrymme så kan den mänskliga faktorn behövas för att avgöra vad som kan rensas. Men det förhindrar oss inte från att samla information via diagnos till den som ska utföra uppgiften.

Automatisering av diagnostik kan vara att titta på vilka de största katalogerna är, största filerna eller att föra in en graf över diskutnyttjande över längre period direkt i ärendet.

Även här kan vi utnyttja Maskininlärning för att avgöra vad som skall köras eller ej.

Hur påvisar vi resultat?

Att införa automatisering och maskininlärning inom IT-operations innebär många fördelar. Eftersom många saker inträffar utan att någon ens upptäcker det är uppföljning en av de viktigaste delarna för att påvisa resultat efter införandet.

Det finns många viktiga nyckeltal att titta på innan och efter införandet men det viktigaste är självklart "Mean Time To Repair", förkortat MTTR. Kort och gott - tiden det tar från att larmet genererats till att det stängts.

Eftersom vi kan dela upp automatiseringarna i tre olika kategorier så kan vi bland annat mäta:

  • Återställningstid övergripande på de larm som är automatiserade jämfört med de som inte är det
  • Automatiseringsgrad övergripande - Hur många procent av alla larm är automatiserade
  • Automatiseringsgrad per kö - Hur många procent av alla larm är automatiserade per destination
  • Återställningstid automatiskt eskalerade larm jämfört med manuellt
  • Återställningstid per eskalerad destination
  • Återställningstid automatiska återställningar jämfört med manuell hantering
  • Återställningstid automatiserad diagnostik jämfört med manuell hantering

Detta är bara några viktiga nyckeltal som ger stor effekt för att påvisa resultatet av införd automatisering och maskininlärning.

Nedan ser ni ett exempl från vårt operationella analysverktyg "IT Service Analytics" som med data från Microsoft System Center Operations Manager kan påvisa resultat efter införandet av automatisering.

Automation Grade Chart IT Service Analytics

Sammanfattning

Automatisering av IT operation ett ämne man inte kan blunda för om man inte vill riskera att bli omsprungen. Utmaningen i början brukar vara att avgöra hur och var att börja. Att bygga nedifrån och upp och analysera vart man skall lägga insatserna är en vanlig taktik. Med automatisering i grunden får man helt plötsligt åtgärder som körs 24/7 på alla era leveranser vilket minskar behovet av beredskap.

Vi hoppas att du fått en bra introduktion till varför just ni behöver titta på automatisering och maskininlärning i er organisation.

Läs gärna mer kring vårt koncept "Digital Operations" som är en av byggklossarna för morgondagens digitala IT-drift.

 

Ämnen: Digital Operations Automatisering Maskininlärning