- Door
- Arnout Veenman
- geplaatst op
- 23 november 2006 21:31 uur
Om 7:00 uur vanmorgen ging het netwerk van Ecatel (Linkup) down. In een NOC-email verstuurd door Ecatel wordt het probleem zoals dat werd ervaren als volgt beschreven:
When our technicians checked remotely both core switches in Amsterdam the three fiber-links between Redbus BT(our core pop) and DCA were down. We rebooted both switches but to no avail, the links just went down. We replaced the modules, removed the WDM equipment and watched the result. No luck. After this we contacted our fiber supplier, they didn’t know of any fiber issue in Amsterdam.
Uiteraard is dit zéér merkwaardig, verder in de NOC-email staat nog iets opvallends:
In our switch log files we noticed flapping of our kinks every 2nd second. We then sent the log files to the fiber suppliers noc for analysis. As yet we do not have a reply from them.
Hoe merkwaardig het ook mag klinken, een deel van de logfile is door Ecatel directeur Reinier van Eeden op IRC gecopy/paste en laat daadwerkelijk bovenstaande problemtatiek zien:
2302 2004-06-29 06:16:37 Port 1:25 link up, 10Gbps FULL duplex
2301 2004-06-29 06:16:35 Port 1:25 link down
2300 2004-06-29 06:16:34 Port 1:25 link up, 10Gbps FULL duplex
2299 2004-06-29 06:16:26 Port 1:25 link down
2298 2004-06-29 06:16:25 Port 1:25 link up, 10Gbps FULL duplex
2297 2004-06-29 06:16:18 Port 1:25 link down
2296 2004-06-29 06:16:16 Port 1:25 link up, 10Gbps FULL duplex
2295 2004-06-29 06:16:11 Port 1:25 link down
2294 2004-06-29 06:16:10 Port 1:25 link up, 10Gbps FULL duplex
2293 2004-06-29 06:16:08 Port 1:25 link down
Hierbij valt dan wel meteen op dat de switch of router niet juist is ingesteld, gezien een datum uit 2004 is ingesteld. Gezien dit niet al te zorgvuldig is, zou je je kunnen afvragen of bij andere punten in de configuratie wel voldoende zorgvuldigheid in acht is genomen. Echter lijkt met de configuratie niet het probleem, gezien het netwerk volledig redundant zou zijn.
Rond 13:00 uur was het netwerk van Ecatel weer in de lucht zodat na 6 uur downtime de problemen voorbij zijn. Ik ben overigens heel benieuwd naar de oorzaak, mocht die net zo bizar zijn als de kwestie nu lijkt, dan kom ik daar zeker op terug.