- Door
- Arnout Veenman
- geplaatst op
- 22 juli 2008 08:09 uur
De Amazon Simple Storage Service (S3) waar veel Web 2.0 bedrijven en diensten, zoals Twitter, gebruik van maken om hun data op te slaan heeft afgelopen zondag getroffen door een ruime 8 uur downtime, met tot gevolg dat verschillende Web 2.0 sites niet of maar deels bereikbaar waren, afhankelijk waar ze de opslag precies voor gebruiken.
In een verklaring stelt Amazon het volgende over de storing:
Als gedistribueerd systeem, moeten de verschillende onderdelen van S3 bewust van elkaars status zijn. Dit geeft het systeem de mogelijkheid om te bepalen welke redundante fysieke storage server een verzoek kan uitvoeren. We hebben te maken gehad met een probleem met de interne communicatie tussen de verschillende systemen, waardoor de verschillende componenten niet goed met elkaar konden samenwerken en klanten tijdelijk hun verzoeken niet succesvol konden uitvoeren. Na het bekijken van verschillende alternatieven, heeft het team besloten om de dienst offline te halen om de interne communicatie te kunnen herstellen en de dienst daarna weer online te brengen. Dit zijn geavanceerde systemen en het duurt daardoor soms even om bij de bron van het probleem te komen in een degelijke situatie — we zullen onze klanten van meer informatie voorzien zodra we het incident volledig hebben onderzocht.
Ondanks de uitleg van Amazon vragen verschillende Web 2.0 bedrijven die zijn getroffen door de storing zich af hoe het mogelijk is dat een redundante dienst als Amazon S3 het zo laat afweten. En stellen er veel te kijken naar andere storage providers als fallback of zelfs als vervanging van Amazon S3. Een ander punt waar verschillende getroffen Web 2.0 bedrijven zich over beklagen is dat nu de 99 procent uptime garantie deze maand niet is gehaald ze zelf moeten vragen om contractuele compensatie van 25 procent van het betaalde maandbedrag.