99,9995% beschikbaarheid voor Nederlandse Spoorwegen (NS)

Hoe de cloudinfrastructuur van ACC ICT de integrale ketentestomgeving van NS een uitzonderlijke beschikbaarheid levert.

KLANT

Nederlandse Spoorwegen

manaGed services

Managed Private Cloud

branche

Transport & Logistiek

INLEIDING

Over de NS

In 2012 schreef NS een minicompetitie uit voor een ketenteststraat. InTraffic won de opdracht en schakelde ACC ICT in als partner op het gebied van infrastructuur. Ruim acht jaar later komt aan deze samenwerking een eind omdat ketentesten ondergebracht worden in een NS-breed cloud platformaanbesteding. Een samenwerking van 8,5 jaar met slechts één verstoring van 20 minuten op een beperkt deel van de OTAP-omgeving. Een beschikbaarheid van 99,9995%, een prestatie van formaat.

In 2012 kende de NS (Nederlands Spoorwegen) een versnipperde IT-organisatie, een versnipperd applicatielandschap, en ook een versnipperd datacenterlandschap. Er waren wel twintig datacenterlocaties en sommige applicaties draaiden bij een leverancier. Daardoor was het vrijwel onmogelijk om ketens van applicaties te testen, terwijl het aantal interfaces tussen applicaties alleen maar toenam. NS had daarom behoefte aan gevirtualiseerde testomgeving waarin ze geautomatiseerde ketentesten konden uitvoeren. In eerste instantie ging het om enkele servers. Welke primair als doel hadden om reizigers te voorzien van de reisinformatie omtrent planning van de treinen via NS.nl, de NS Reisplanner-app en OBIS, het On Board Information System in treinen.

Voor dit project schreef NS een minicompetitie uit, die werd gewonnen door InTraffic in nauwe samenwerking met ACC ICT. Waar InTraffic de softwarematige kant voor zijn rekening nam, waaronder de testautomatisering, was ACC ICT verantwoordelijk voor de infrastructuur, in- en externe koppelingen en de hosting. NS noemde de nieuwe ketenteststraat KWARTS, wat staat voor Ketens Waarborgen als Reguliere Test Service. Wat in 2012 begon met één teststraat met voorzien van een kleine tien servers groeide uit tot 19 teststraten, waarbij elke teststraat, afhankelijk van de benodigde keten, een variërend aantal servers vanaf 10 en 20 servers bevatte.

UITDAGING

Testen is bedrijfskritisch voor NS

Testen is voor NS een bedrijfskritische activiteit. Het is daarom van groot belang dat de omgevingen beschikbaar zijn. Niet alleen tijdens kantoortijden, maar 24/7 zodat er ruimte is voor uitloop mochten de testwerkzaamheden niet binnen kantoortijden afgerond kunnen worden.

Daarnaast lopen testscripts en duurtests natuurlijk ook gewoon 24/7 door. “Sinds de lancering in 2012 realiseren we een beschikbaarheid van bijna 100 procent. Slechts één keer, namelijk op 17 november 2015, hebben we in de avonduren een incident met een storage-unit gehad. Om dit incident te verhelpen is, na overleg met NS, spoedonderhoud uitgevoerd, waardoor wij enkele servers preventief voor een periode van 20 minuten uitschakelen. Data is er niet verloren gegaan”, vertelt Paul Bijleveld.

Wat betekent een verstoring van 20 minuten over een looptijd van 8,5 jaar?

  • Recovery Time Objective (RTO): 20 minuten;
  • Recovery Point Objective (RPO): 0 minuten;
  • 101 maanden met een beschikbaarheid van 100% ;
  • 1 maand met een beschikbaarheid van 99,96;
  • Totale beschikbaarheid over 102 maanden (8,5 jaar); 99,9995%.

Interessant gegeven is dat de omgeving van NS gedurende de looptijd continu in ontwikkeling is geweest en dus onderhevig aan talloze wijzigingen. Daarnaast zijn alle onderdelen van de infrastructuur (storage, routers, firewalls, servers, etc.) in de loop der tijd tenminste 1 keer vervangen, de meeste zelfs 2x. “Een prestatie van formaat”, aldus Wierbos.

“We kunnen fouten eerder opsporen en herstellen, waardoor we de ontwikkelcyclus kunnen versnellen en kosten verlagen, binnen het LTSO-domein hebben we de cyclus van één à twee weken naar twee uur kunnen terugbrengen”
Onno Wierbos - IT-Lead (NS Test Competence Center)

oplossing

Flexibiliteit en snelheid in OTAP-proces

KWARTS heeft NS de mogelijkheid gegeven om al tijdens de development fase te testen op een omgeving die een uitstekende representatie is van de productieomgeving. Dit zorgt voor veel flexibiliteit en snelheid in het OTAP-proces. “We kunnen fouten eerder opsporen en herstellen, waardoor we de ontwikkelcyclus kunnen versnellen en kosten verlagen, binnen het LTSO-domein hebben we de cyclus van één à twee weken naar twee uur kunnen terugbrengen”, zegt Wierbos.

Een andere as waarover NS kosten bespaart, is de snelheid van schakelen in ontwerp en realisatie van de doorontwikkeling van de omgeving. “In de loop der jaren is de omgeving behoorlijk gegroeid, hij is groter en breder geworden. Doordat InTraffic en ACC ICT zo goed wisten wat er nodig was, heeft NS dit steeds zeer kostenefficiënt kunnen realiseren”, meent Wierbos. “De return on investment (ROI) is een belangrijke factor want in mijn optiek moet iedere optimalisatie van het OTAP-proces terugverdiend worden. Anders heeft veranderen ook weinig zin”, aldus Paul Bijleveld.

BENIEUWD HOE WIJ JOUW
IT-INFRASTRUCTUUR

verder kunnen professionaliseren?

SAMENWERKING

Klantbelang staat altijd voorop

Sinds 2012 is er veel veranderd bij NS. De ICT is gecentraliseerd, wat in 2015 leidde tot een grote aanbesteding van datacenterfaciliteiten. Daarmee komt ook de samenwerking voor het project ketentesten met InTraffic en ACC ICT ten einde. De volledige NS-omgeving moest worden ondergebracht in de NS Private Cloud, waarvoor InTraffic en ACC ICT de migratie verzorgden.

Ondanks het feit dat daardoor een mooi project afloopt voor InTraffic en ACC ICT, werkten ze beide goed mee aan de migratie. Het is tekenend voor de professionele manier van werken, vindt Wierbos.

Ook de laatste fase is er nog constructief meegedacht en een pragmatische oplossing gevonden bij een compliance uitdaging van de NS. “InTraffic en ACC ICT stellen altijd het belang van de klant voorop, ook als daar weinig eigenbelang aan zit.” Sterker, het contract is in al die jaren nooit uit de la gehaald, zegt Arjen Bakker, operationeel directeur bij InTraffic. “En dat is maar goed ook, want in onze opinie zijn we te laat als het contract erbij moet worden gehaald.”

"De return on investment (ROI) is een belangrijke factor want in mijn optiek moet iedere optimalisatie van het OTAP-proces terugverdiend worden. Anders heeft veranderen ook weinig zin"
Paul Bijleveld - Managing Director (ACC ICT)

RESULTAAT

Succesvolle samenwerking tot het eind

Ook in de laatste fase is er nog constructief meegedacht en een pragmatische oplossing gevonden bij een compliance uitdaging van de NS. Hoewel ACC ICT in de praktijk min of meer fungeerde als de afdeling Hosting & Connectiviteit van de het NS Test Competence Center, was dit bedrijf formeel ‘slechts’ onderaannemer. “Zo hebben wij uiteraard niet in de wedstrijd gezeten en NS en InTraffic ook niet”, zegt Paul Bijleveld, directeur van ACC ICT.

“In de operatie hebben wij rechtstreeks contact met NS. Bij uitbreidingen of in geval van escalaties wordt altijd alles open met z’n drieën besproken. Ik denk dat dit dé belangrijkste succesfactor is”. Wierbos besluit: “Wat mij vooral bij blijft is de manier waarop we samenwerken. De manier waarop InTraffic en ACC ICT ruim acht jaar lang in de wedstrijd hebben gezeten, is voor mij een voorbeeld hoe je de samenwerking tussen klant en leverancier zou moeten inrichten. Het resultaat laat zien dat het contract ondergeschikt is aan de mindset waarmee leveranciers werken."

"Blauwe Achtergrond met Golfjes en USP's