- Door
- Veenman
- geplaatst op
- 3 februari 2009 08:06 uur
Afgelopen zondag waren verschillende websites slecht bereikbaar door een probleem bij AMS-IX op locatie NIKHEF. Henk Steenman, technisch directeur van AMS-IX liet tegenover ISPam.nl weten dat het probleem werd veroorzaakt door dat één edge switch niet meer met de core switch communiceerde, dit werd waarschijnlijk veroorzaakt door een defect aan de bewuste edge switch, waar verschillende AMS-IX leden op zijn aangesloten.
Ook het monitoring systeem van AMS-IX gaf om nog onbekende reden geen melding van het feit dat er geen verkeer meer over de verbinding tussen de bewuste edge en de core switch ging, waardoor de storing enkele uren lang onopgemerkt bleef. Toen de storing eenmaal ontdekt was door de AMS-IX is er meteen overgeschakeld op het backup netwerk van de AMS-IX (topology swap), waarna het probleem verholpen was.
Ondanks het feit er maar een storing aan één van de 20 edge switches van AMS-IX was, waren veel Nederlandse websites slecht bereikbaar. Steenman zegt niet in te kunnen schatten hoe groot de gevolgen waren voor eindgebruikers. Feit is wel dat de bewuste edge switch in NIKHEF, de drukste switch is in het AMS-IX netwerk. Op de bewuste switch zijn namelijk een aantal grote content en usenet providers aangesloten.
Op de vraag hoe dit soort storingen in de toekomst zullen worden voorkomen, geeft Steenman aan dat je altijd storingen zal blijven houden én zodra er een wordt geconstateerd wordt er meteen een topology swap uitgevoerd, maar dan moet het monitoring systeem wel aangeven dat er een storing is. Op dit moment is men daarom ook nog druk bij AMS-IX bezig om uit te zoeken waarom het monitoring systeem geen melding heeft gegeven afgelopen zondag.