Journalistiek

Onpartijdig, onafhankelijk nieuws, uitsluitend in dienst van het branchebelang.

Storing aan drukste AMS-IX switch blijft urenlang onopgemerkt

  • Door
  • Veenman
  • geplaatst op
  • 3 februari 2009 08:06 uur

AMS-IXAfgelopen zondag waren verschillende websites slecht bereikbaar door een probleem bij AMS-IX op locatie NIKHEF. Henk Steenman, technisch directeur van AMS-IX liet tegenover ISPam.nl weten dat het probleem werd veroorzaakt door dat één edge switch niet meer met de core switch communiceerde, dit werd waarschijnlijk veroorzaakt door een defect aan de bewuste edge switch, waar verschillende AMS-IX leden op zijn aangesloten.

Ook het monitoring systeem van AMS-IX gaf om nog onbekende reden geen melding van het feit dat er geen verkeer meer over de verbinding tussen de bewuste edge en de core switch ging, waardoor de storing enkele uren lang onopgemerkt bleef. Toen de storing eenmaal ontdekt was door de AMS-IX is er meteen overgeschakeld op het backup netwerk van de AMS-IX (topology swap), waarna het probleem verholpen was.

Ondanks het feit er maar een storing aan één van de 20 edge switches van AMS-IX was, waren veel Nederlandse websites slecht bereikbaar. Steenman zegt niet in te kunnen schatten hoe groot de gevolgen waren voor eindgebruikers. Feit is wel dat de bewuste edge switch in NIKHEF, de drukste switch is in het AMS-IX netwerk. Op de bewuste switch zijn namelijk een aantal grote content en usenet providers aangesloten.

Op de vraag hoe dit soort storingen in de toekomst zullen worden voorkomen, geeft Steenman aan dat je altijd storingen zal blijven houden én zodra er een wordt geconstateerd wordt er meteen een topology swap uitgevoerd, maar dan moet het monitoring systeem wel aangeven dat er een storing is. Op dit moment is men daarom ook nog druk bij AMS-IX bezig om uit te zoeken waarom het monitoring systeem geen melding heeft gegeven afgelopen zondag.

Jeeves_, 3 februari 2009 12:19 pm

...
Op de vraag hoe dit soort storingen in de toekomst zullen worden voorkomen
...

Dat zijn toch altijd van die domme vragen. Als daar alle antwoorden op zouden zijn, zouden er geen storingen meer zijn. Of wel soms?

Arnout, ik kreeg net een lege pagina toen ik dit artikel in een apart scherm kreeg. Hoe ga jij er voor zorgen dat dit nooit meer gebeurd?

Arnout Veenman, 3 februari 2009 12:33 pm

@Jeeves_, storingen zul je altijd blijven houden, maar het risico en de gevolgen van storingen kun je inperken door bepaalde maatregelen te nemen. Dat is dan ook de insteek van mijn vraag geweest.

Wat betreft de witte pagina, dat was een noodzakelijk gevolg van onderhoud aan ISPam.nl, waar de cache voor moest worden gereset. Dat kan daarom nog weleens vaker voorkomen. ;-)

XBL, 3 februari 2009 6:35 pm

Misschien denk ik te simplistisch (is namelijk niet mijn vakgebied - netwerken). Maar de providers die via die switch peeren hadden toch zelf ook kunnen merken dat ze elkaar niet meer konden bereiken (of slecht) en dus de route uit hun bgp tables kunnen trappen?

Laatste reacties

Bedankt voor het succes van ISPam.nl
Koen Stegeman, Editor-in-Chief & founder Hostingjournalist.com: Jammer Arnout, maar je hebt een mooie bijdrage aan de hosting industrie geleverd, en dat jaren lang....

Bedankt voor het succes van ISPam.nl
Dillard Blom: Jammer dat een 'instituut' verdwijnt, en daarmee een bron van informatie over actuele zaken (en opin...

Bedankt voor het succes van ISPam.nl
L.: Uit automatisme kijk ik toch nog steeds elke dag naar ispam.nl, toch de hoop dat er nog een berichtj...

Bedankt voor het succes van ISPam.nl
Toni Donkers: Arnout bedankt! ik ga het missen dat is een feit!

Bedankt voor het succes van ISPam.nl
Marcel Stegeman: Ik zie het nu pas. Inderdaad jammer maar ik kijk nu al uit naar het volgende project.