Nedetid, strømbrudd og feil - å forstå deres sanne kostnader
- 11. april 2019
- Skrevet av: Gad Cohen
Om
Dette innholdet er brakt til deg av Evolven. Evolven Change Analytics er en unik AIOps-løsning som sporer og analyserer alle faktiske endringer utført i bedriftens skymiljø. Evolven hjelper ledende virksomheter med å kutte antall hendelser, kutte feilsøkingstiden og eliminere uautoriserte endringer.Lære mer
Når det gjelder oppdragskritiske applikasjoner eller datasentre resultatkvalitet, er bedrifter villige til å gjøre enorme investeringer.Dessverre leverer ikke disse investeringene alltid fullt ut.
Konfronterer nedetid av systemet
Til tross for innsatsen som er investert i robust infrastruktur, fortsetter mange IT-organisasjoner å håndtere nedetidshendelser i databaser, maskinvare og programvare som varer fra bare noen få minutter til flere dager, noe som gjør virksomheten fullstendig ufør og forårsaker enorme tap.
Nedetid forventet
En verden av IT-svikt kan noen ganger virke vanskelig.
Til tross for mangfoldet av avanserte løsninger og monteringsdata samlet inn av store leverandører av bedriftsprogramvare og IT -avdelinger (fra ERP til CRM og mer), er strømbrudd fortsatt en gyldig og en skremmende trussel for industrien.
På den annen side har IT-feil på en eller annen måte blitt en iboende akseptert, til og med forventet, del av bedriftslivet.
Dette er mot intuitivt ...
Det revurdert nedetid
Mens IT-fagfolk opplever å konfrontere nedetider fra tid til annen, og deretter er fullt fokusert på å prøve å komme på toppen av dem, lider forretningsorganisasjonen som helhet av den "økonomiske smerten" av effekter, som har en tendens til å være svært betydelige.
Tidligere har vi tatt en grundig titt på de mange måtene IT-nedetid kan påvirke bedrifters bunnlinje (du kan lese mer om det her -Kostnad og omfang av uplanlagte strømbrudd). Vi så på ulike aspekter, fra direkte tap av inntekter gjennom skade på omdømme til indirekte effekter som produktivitetsnedgang.
Nå ønsker jeg å se på problemet på nytt og undersøke hvordan organisasjoner bør adressere og vurdere trusler mot IT-driften deres, inkludert systemer, applikasjoner og data, ved å analysere solide (og etablerte) benchmarks som representerer de potensielle kostnadene bak nedetid og driftsstans.
Systemutbrudd:
Måling av store merkevaresvikt
Når bør bransjen begynne å måle den økonomiske effekten av store merkevarebrudd, som den som nylig rammetFacebook, TheEn som rammet hundretusener av Lloyds bankkunder, ellerJetstar-bruddDet resulterte i hundrevis av forsinkelser?
Med andre ord, på hvilket tidspunkt er et strømbrudd ‘betydelig nok’ slik at en kostnadsanalyse blir verdifull for industrien for å lære av den og forutsi virkningen av fremtidige strømbrudd?
Vel, tilsynelatende på et tidspunkt skaper strømbrudd en innvirkning som ikke kan ignoreres, PR Wise.Det er poenget med ingen retur, som blir fulgt av estimater av økonomisk påvirkning.
Nedetidskostnadene varierer betydelig mellom bransjer. Den berørte virksomhetsstørrelsen er åpenbart en kritisk faktor, men det er ikke den eneste store. IT-systemenes rolle i virksomheten er også sentral.
Å sette en numerisk verdi bak et IT-brudd betyr å forhåndsdefinere implikasjonene på tvers av flere forretnings- og organisasjonsaspekter, slik at hele bransjen kan lære og optimalisere deretter.
En svikt i en kritisk applikasjon kan føre til to forskjellige typer tap:
- Tap av applikasjonstjenesten – virkningen av nedetid varierer i henhold til applikasjonen og virksomheten;
- Tap av data – potensielt tap av data på grunn av et systembrudd kan ha betydelige juridiske og økonomiske implikasjoner.
Nå er jeg sikker på at du er enig i at dagens datasentre aldri skal gå ned; applikasjoner må være tilgjengelige 24/7, og interne (for ikke å si eksterne) sluttbrukere over hele verden må kunne stole på datasentrenes tilgjengelighet (for kritiske data og applikasjonstilgjengelighet) til enhver tid.
Vel, virkeligheten biter. I backoffice (som betyr inne i datasenteret) er dette ikke tilfelle. Ingen organisasjoner nyter 100 % oppetid. Bør du strebe etter å nå 100%? Sikker. Men du bør også utvikle en dyp forståelse av nedetidsimplikasjoner og måter å minimere den på.
Det verste avbruddsmarerittet noensinne? Sannsynligvis den som skjedde med deg...
Noen tidligere strømbrudd ble til PR -katastrofe, som den mytologiske jomfrublå debakten fra 2010, eller den nylige som påvirket Facebook.
Hvorfor? Massepåvirkningen hadde nok noe med det å gjøre.
Som en påminnelse forhindret Virgin Blue-bruddet passasjerer fra å gå ombord på fly i 11 dager (!!), noe som resulterte i negativ presse, skadet omdømme og millioner av dollar tapt.
For å være mer nøyaktig: Virgin Blues reservasjonsadministrasjonsselskap, Navitaire, endte opp med å kompensere Virgin Blue for mer enn $20 millioner (Navitaire Booking Glitch tjener jomfru $ 20 millioner i kompo).
Det er mange andre hendelser som fremdeles klarer å fange oppmerksomheten til media.Her er bare en nyligartikkel av USA Today om strømbruddet i Wells Fargosom hindret kunder i å få tilgang til kontoene sine i mange timer.
Jeg kan trygt si at alle i IT -bransjen vil være enige om at strømbrudd eller nedganger er veldig dårlige for virksomheten.De er uønskede, veldig skadelige økonomisk, og må utkjempes mot å bruke alle tilgjengelige ressurser.
Feilkonfigurasjoner er viktige
IT-prosessinstituttets synlige OPS-håndbok rapporterte i det siste at "80% av ikke planlagte strømbrudd skyldes dårlig planlagte endringer gjort av administratorer (" Operasjonspersonell ") eller utviklere" (Synlig ops).
Enterprise Management Association rapporterte at 60 % av tilgjengelighets- og ytelsesfeil er et resultat av feilkonfigurasjoner.
Hva koster det?
Nedetid kan koste bedrifter $5 600 per minutt og opptil $300 000 per time i nedetid for nettapplikasjoner (ifølge en2014 Gartners analyse).
Gjennomsnittlig timepris for nedetid for bedriftsservere, over hele verden, 2017-2018:
Kilde:Statsmann
Vedlikeholdskostnadene for applikasjoner øker med en årlig hastighet på 20 %. Men det kan ikke løse alle problemene dine. En tidligere bransjeundersøkelse avslørte at minst en fjerdedel av nedetiden var forårsaket av konfigurasjonsfeil. (Hvor mye vil du bruke på nedetid for søknader i år?).
Hvor vanlig er nedetid eller driftsstans?
Ok, nedetid kan være et økonomisk mareritt. Den delen er tydelig. Men hvis du ønsker å estimere risikopotensialet for driftsstans for virksomheten din, bør det umiddelbare spørsmålet være "hvor sannsynlig er det at det skjer?"
Kilde:Datasenterkunnskap
Ok, så strømbrudd er altfor vanlige til å bli ignorert ved å tenke "Det er ikke sannsynlig at jeg opplever et stort strømbrudd". Nå kommer spørsmålet om hvordan du skal beregne deres spesifikke risiko for virksomheten din.
Produksjons- og anvendelseskostnader gjorde det klart
Uplanlagte strømbrudd er opp til IT å løse. Likevel, og som jeg allerede har nevnt, på slutten av dagen påvirker disse strømbruddene hele organisasjonen.
En viktig del av en grundig evalueringsprosess for avbruddsrisiko er å estimere hvor mye penger du vil tape per time (eller minutt, eller et hvilket som helst annet tidsintervall etter eget valg) i tilfelle nedetid.
For bedrifter som utelukkende er avhengige av datasentre mulighet til å levere IT- og nettverkstjenester til kunder-for eksempel leverandører av telekommunikasjonstjenester eller e-handelsbedrifter-kan driftsstans være spesielt kostbart, med den høyeste kostnaden for en enkelt begivenhet som topper 1 million dollar (mer enn11 000 dollar per minutt) i henhold til estimater fra eksperter.
I en USA Today-undersøkelse blant 200 datasenterledere rapporterte over 80 % at nedetidskostnadene deres oversteg $50 000 per time. Over 25 % rapporterte nedetidskostnader på over $500 000 per time (!!).
Ifølge en annen undersøkelse, mens selskaper ikke kan oppnå null driftsstans, sa en av hver 10 selskaper at tilgjengeligheten deres må være større enn 99.999%.
Kilde:Searchcio Tetan
For å få en solid forståelse av implikasjonene av produksjon og utgivelsesstans, la oss ta en titt på hvordan konsekvensene av nedetid kommer til uttrykk.
Nedetidskostnad - per år eller per hendelse?
EN2017 studieavslørte at av 400 IT-beslutningstakere opplevde 46 % mer enn fire timer med IT-relatert nedetid over 12 måneder; 23% sa at de pådro seg kostnader fra $12 000 opp til mer enn $1 million per time.
Over 35 % innrømmet at de er usikre på kostnadene ved en driftsstans.
Hvis du spør Delta Airlines, som måtte avlyse 280 flyvninger på grunn av et strømbrudd i 2017, tapene av en enkelt driftsstive hendelsekan nå over 150 millioner dollar.
For et par år siden rapporterte Dun & Bradstreet at 59 % av Fortune 500-selskapene opplever minimum 1,6 nedetidstimer per uke.
Hvis du tar det gjennomsnittlige Fortune 500-selskapet (eller et selskap som sysselsetter minst 10 000 ansatte) og antar at det betaler et IT-team i gjennomsnitt $56 per time, så (forutsatt at hele IT-en er opptatt med å løse nedetiden) er det bare arbeidskraften. en del av nedetiden for en organisasjon av denne størrelsen vil nå $896 000 per uke, noe som betyr mer enn $46 millioner per år (Vurderer den økonomiske effekten av nedetid).
Selvfølgelig er virkeligheten mer komplisert, siden du må ta hensyn til mange parametere som tidspunktet for hendelsen (midt i uken eller helgen? Dag eller natt?) og mer. Forståelse av kostnadene ved driftsavbrudd vil likevel bidra betydelig til å estimere risikopotensialet ditt og avkastningen til verktøy som kan bidra til å minimere effekten av nedetidshendelser.
Har bransjen klart å lære av fortiden og minimere sikkerhetsskadene under et strømbrudd?
Hvordan har ting endret seg fra fortiden?
Så vi vet allerede at downtimes og strømbrudd fortsatt skjer i dag, og industrien har ennå ikke lyktes med å avskaffe.Men hvordan har kostnadene deres endret seg over tid?Er disse hendelsene mindre skadelige i dag?
I 2010,en forskning av Coleman Parkesfant at IT -nedetidshendelser samlet kostet virksomheter mer enn 127 millioner arbeidstid per år - i gjennomsnitt 545 arbeidstid per selskap - i ansattes produktivitet.
I 2009 ble det rapportert at de gjennomsnittlige driftsstansekostnadene varierer betydelig på tvers av bransjer, fra omtrent $ 90 000 per time i mediesektoren til omtrent $ 6,48 millioner per time for store online meglere (Hvordan kvantifisere nedetid).
I følge en undersøkelse av IT -ledere som ble utført i løpet av disse årene, blir selskaper mer bevisste på de direkte økonomiske kostnadene for driftsstans for datamaskiner.Undersøkelsen avdekket at en av fem virksomheter mister 12 000 dollar i timen gjennom driftsstans i systemer (Hvordan kvantifisere driftsstans).
Som nevnt ovenfor, rapporterte en senere analyse utført i 2014 av Gartner, en gjennomsnittlig kostnad på $ 5600 per minutt og over $ 300 000 per time.
Selv allerede i 2004 festet et konservativt estimat fra Gartner timekostnaden for driftsstans for datanettverk til $ 42.000.Følgelig kan et selskap som lider av en dårligere driftsstans enn gjennomsnittet på 175 timer per år, tape mer enn $ 7 millioner årlig.Kostnaden for hvert utbrudd påvirker imidlertid hvert selskap på en annen måte, så det er viktig å vite hvordan man beregner den nøyaktige økonomiske virkningen (Hvordan kvantifisere nedetid).
Det er fornuftig å tro at kostnadene ved strømbrudd bare blir høyere med tiden (siden vi alle lener oss mer på datasystemer i dag). Du kan derfor forstå hvorfor tidligere data kan multipliseres med et betydelig antall for å reflektere dagens virkelighet...
Hvert minutt teller
For over ti år siden ble den gjennomsnittlige kostnaden for driftsstans i datasenteret på tvers av bransjer verdsatt til omtrent 5600 dollar per minutt (Uplanlagte IT-avbrudd koster mer enn $5 000 per minutt), en figur som ifølgeGartner, forble den samme til 2014. Den nevnte tidligere studien av Ponemon Institute beregnet minimum, median, gjennomsnittlig og maksimal kostnad per minutt uplanlagte strømbrudd, basert på innspill fra 41 datasentre.Den største kostnaden for et uplanlagt strømbrudd ble funnet å overstige 11 000 dollar per minutt.
I gjennomsnitt vil kostnadene for et uplanlagt driftsavbrudd sannsynligvis overstige $5000 per minutt.
Det blir bare mer betydningsfullt
EN2013 studieså en økning på over 41 % fra de tidligere gjennomsnittene beskrevet ovenfor, og en gjennomsnittlig kostnad på mer enn $7900 per minutt.
AnITIC -undersøkelse fra 2015Viste tydelig at timekostnaden (sammenlignet med data fra 2008) har økt med mellom 25% til 30%.
Nedetidspåvirkning per år
En tidligere analyse Gartner har beregnet at nedetidshendelser i gjennomsnitt kan nå 87 timer per år. Det er åpenbart summen av mange strømbrudd - alt fra noen få minutter til flere timer (Gjennomsnittlig storbedrift opplever 87 timers nedetid i nettverket i året).
Hvordan har ting endret seg?
En senereforskning fra 2011avslørte at selv om industrien har klart å bekjempe nedetidsepidemien og redusere forekomstene deres, ser vi fortsatt betydelige nedetidstimer og enorme inntektstap (Kilde:førte til over 3 millioner (tilsynelatende Whatsapp-brukere) som migrerte til Telegram)
Innvirkning på omdømme og lojalitet
Hvor mye er ditt forretningssted verdt?Dette kan være ekstremt vanskelig å vurdere, så vel som den langsiktige effekten av et skadet omdømme og dens innvirkning på inntekter og lønnsomhet.
I dette tilfellet inkluderer nedetidskostnader tapte kunder (både kort og lang sikt), og andre konkrete elementer som gjenspeiler kostnadene ved omdømme nedskrivning som nedgangstider for aksjer, markedsføringstimer (krise og merkevaregjenoppretting) og mediebudsjett som kreves for å starte på nytt og polere oppen organisasjons profil.
Hvilke parametere bør påvirke beregningen din?
Når du prøver å estimere kostnadene for downtimes, er det de åpenbare direkte kostnadene (for eksempel tap av virksomhet under driftsstans).Imidlertid bør mange indirekte kostnader som ansattes overhead eller omdømmeproblemer som er diskutert ovenfor, beregnes også i.
Arbeidsstyrken overhead er avledet av kostnadene for å brenne 'krigsroms' oppgaver som fokuserer på å få IT-systemene opp igjen, og kostnadene for å bli forsinket med alle andre planlagte oppgaver, kostnadene for ansatte overtidsutgifter (hvis aktuelt) ogmer.Så er det verdien av tap av data, nødvedlikeholdsgebyr (spesielt hvis strømbruddet oppstår i løpet av arbeidstiden), og ekstra reparasjonskostnader som kan fortsette lenge etter at tjenesten er gjenopprettet.
Det er unødvendig å si at du må beregne disse kostnadene når du estimerer implikasjonen av nedetid, da de vanligvis er svært betydelige; men selv et grovt anslag kan vise seg å være ekstremt fordelaktig for å forstå risikoen og bestemme hvilket teknologinivå du bør støtte deg på for å bekjempe det.
Det er også virkningen av tapt salg. For å ha en nøyaktig vurdering av det totale tapte salget, må påvirkningsprosenten økes for å gjenspeile den reelle levetidsverdien til kunder som permanent avviker til en konkurrent. For eksempel Facebook- (og Whatsapp)-bruddet som jeg nevnte tidligereKostnadsbevissthet: Å nekte de sanne kostnadene ved nedetid for nettverk.Hva er inntektstapet avledet av det faktum at disse brukerne vil presentere mindre fakturerbare AD-impresjoner?
Aksjen falt med 25 %
Selv om det er vanskelig å sette et tall på så mange parametere, er de fortsatt betydelige og betydelige. For eksempel, da Amazon.com gikk offline i flere timer i løpet av de første dagene, falt aksjen med 25 % på en enkelt dag (Kostnadsbevisst: Fornekter de sanne kostnadene ved nedetid i nettverket)!
I detteAmazon skybruddfor eksempel fortsatte selskapet å streve etter å få skytjenestene tilbake på nett. Som et resultat stilte mange kunder spørsmålstegn ved påliteligheten til skyen og Amazons kommunikasjon rundt strømbruddet. Andre kunder mente de burde få kompensasjon for nedetiden som en del av SLAen deres.
Jeg vet at du er nysgjerrig: Når det gjelder SLA, til tross for nesten fire dagers driftsstans, ble ikke Amazons EC2 SLA brutt (Sju leksjoner å lære av Amazons strømbrudd).
Kostnaden for nedetid: Beregn det selv
Hvor mye er du nødt til å tape fra en uventet driftsstans av serverne eller forretningsapplikasjonene dine?
I følge flere kilder er den enkleste måten å beregne potensielle inntektstap under et strømbrudd ved å bruke denne ligningen:
Mistet inntektene | = | (Gr/th) x i x h |
Gr | = | brutto årlig inntekt |
TH | = | samlet årlig arbeidstid |
Jeg | = | prosentvis påvirkning |
H | = | antall timer avbrudd |
Hvordan minimere driftsstans og nedetidsrisiko?
Nedetid og driftsstans er katastrofale, men de trenger ikke å ha så stor innvirkning. Ved å bruke løsninger som fokuserer på å komme til roten av problemet, kan strømbrudd forhindres før de i det hele tatt oppstår.
Evolven Change Analyticsutviklet en unik AIOP -løsning som fokuserer på endringer - den virkelige årsaken til ytelseshendelser.Evolven hjelper Enterprise IT og Cloud Ops -team med å forhindre og feilsøke hendelser før problemet starter.
Kontakt ossfor å se hvordan vi hjelper ledende bedrifter med å kutte antall hendelser og MTTR.