- Door
- Jeroen Mulder
- geplaatst op
- 4 maart 2015 10:00 uur
System reboot. Keek niemand van op: zo nu en dan was dat noodzakelijk op systemen in een datacenter. Dat is in de cloud niet anders. Ook daar hebben we af en toe te maken met verstoringen en moeten systeem opnieuw worden opgestart. Toch is het wel nieuws als het heel veel systemen betreft. Tussen nu en 10 maart gaat bijvoorbeeld Softlayer alle systemen rebooten die op de Xen Hypervisor draaien, dit vanwege mogelijke kwetsbaarheid in de hypervisor zelf.
IBM volgt hiermee Rackspace en AWS dat eerder deze week al aankondigde de systemen te gaan rebooten. Kwetsbaarheden in software zijn van alle tijden, ook systemen in cloud-omgevingen hebben hiermee te maken. De bedrijven doen dat uit voorzorg: voordat er meer bekend wordt over de exacte aard van het risico, worden de systemen gepatcht. En ook dat is niks nieuws.
Maar het wordt nieuws omdat cloud zo ontzettend zichtbaar is. Heel veel services waarvan miljoenen consumenten tegenwoordig op pc’s, laptops, tablets en natuurlijk smartphones gebruikmaken, komen uit de cloud. Een verstoring wordt direct opgemerkt. Wereldwijd. Door miljoenen mensen. Gaan die consumenten of bedrijven dan iets merken van een reboot? Je zou denken van niet: gevirtualiseerde capaciteit moet je eenvoudig kunnen verplaatsen naar andere machines, waarna je de vrijgevallen capaciteit tijdelijk en ongemerkt ‘uit de operatie’ kunt halen.
Dat gaat goed totdat omgevingen echt heel groot worden en letterlijk duizenden servers beslaat. Inclusief achterliggende infra, zoals netwerk en storage. Dan wordt het schuiven met systemen een uitdaging. Natuurlijk biedt cloud enorme mogelijkheden op het gebied van beschikbaarheid, maar zelfs dan zijn er nog grenzen. En met de groei van big data worden die grenzen ook sneller bereikt en zal een verstoring in cloudstructuren sneller merkbaar zijn.
Zelfs de cloud heeft, ondanks of wellicht juist dankzij haar ongebreidelde groei, haar limiet. Zelfs als we aan de randen van die cloud de onbenutte capaciteit – apparaten met rekenkracht bij mensen thuis, die wel aan het internet hangen – gaan inzetten. De groei zal altijd sterker toenemen dan de daadwerkelijke capaciteit. Haperingen komen dan sneller aan de oppervlakte en hebben bovendien meer impact.
Veel hosters hebben in de afgelopen jaren flink geïnvesteerd in hun omgevingen. Hoe groot of klein een omgeving ook is en hoeveel ‘controls’ er ook zijn om te voorkomen dat klanten iets merken van zo’n hapering en systemen ‘live’ kunnen worden geboot, dankzij bijvoorbeeld technologieën zoals boot-from-SAN, communiceer het wel naar de klanten. Die verwachten ‘always on’ in de cloud. Downtijd vanwege onderhoud – wel beschouwd is de Xen-patch preventief onderhoud – wordt eigenlijk niet meer geaccepteerd. Dan moet een cloudprovider maar schuiven in capaciteit of desnoods bijschakelen vanuit grotere omgevingen.