- Door
- Arnout Veenman
- geplaatst op
- 10 juli 2007 09:37 uur
De afgelopen tijd draait het ReasonNet netwerk niet helemaal lekker door relatief veel packetloss en korte storingen. Gezien ISPam.nl ook in het ReasonNet draait, heeft dit ook effect op de bereikbaarheid van ISPam.nl en andere websites van xCAT.nl Publishing.
Op het forum van PCextreme is vannacht uitleg geplaatst over de ReasonNet storingen.
De afgelopen jaren heeft ReasonNet op Foundry Jetcore apparatuur gedraaid, echter door de enorme groei van ReasonNet was een upgrade naar nieuwe apparatuur noodzakelijk. Daarbij werd gekozen voor de nieuwe XMR/MLX series van Foundry.
Deze zijn vanaf 1 maart 2007 in een test-setup in gebruik genomen, om er zo zeker van te zijn dat er geen bugs of andere nog onbekende problemen mee waren. Na een aantal maanden testen bleek de nieuwe apparatuur naar behoren te werken en werd besloten om de oude Jetcore apparatuur door de nieuwe Foundry XMR/MLX apparatuur te vervangen.
Nadat de nieuwe apparatuur in gebruik was genomen bleek er in de Foundry XMR/MLX apparatuur toch een paar vervelende bugs te zitten. Door één van de bugs reboot de apparatuur spontaan en een andere vervelende bug had tot gevolg dat de verbinding met andere netwerken uitvielen. De eerste bug wordt op dit moment door Foundry aan gewerkt en de laatste bug is het hoofd geboden door het uitschakelen van een bepaalde functionaliteit.
Voor de techneuten onder ons hier de technische uitleg:
First :
We found a major bug in the what foundry said “ stable software”.
When we start AGGREGATING our netblocks, the router spontainiasly reboots and comes back without these command lines in the configuration.(Foundry is Aware of this now, and will update their firmware a.s.a.p for their customers)
In the meantime we found a workaround, so it can’t happen again.Second :
OSPF is not pushing all subnets into BGP correctly, this is why you could have seen some strange route flapping going on. Especially some /24’s. When flapping is going on, a lot of carriers will put you in a temporary damping table. This causes a delay to get your network back into the world.
We do not use OSPF anymore to push routes into BGP.
This behavior therefore can’t happen anymore.
Wat mij betreft is dit een nette uitleg. Het is te hopen dat ReasonNet de problemen snel weet op te lossen. Wat vinden jullie van deze uitleg en de storingen bij ReasonNet?