Journalistiek

Onpartijdig, onafhankelijk nieuws, uitsluitend in dienst van het branchebelang.

Koelingsprobleem leidt tot dataverlies bij SIDN

  • Door
  • Randy ten Have
  • geplaatst op
  • 4 februari 2012 13:24 uur

In de nacht van vrijdag op zaterdag heeft de SIDN met een storing te kampen gehad, waarbij dataverlies is opgetreden. De oorzaak van de storing lag in de koeling van het BIT-datacenter. Hierdoor werd de temperatuur van de apparatuur te hoog.

De SIDN heeft een fail-over gedaan van het BIT-datacenter naar de back-up locatie. Hierdoor zijn alle transacties die zaterdagnacht (vrijdag op zaterdag, RtH) tussen 04:24 en 04:31 uur uitgevoerd verloren gegaan. Deelnemers klagen over het feit dat zij niet door de SIDN op de hoogte gesteld zijn van de storing. Wel was een melding te lezen op de besloten website, maar de kans dat deze in het weekend wordt opgemerkt is klein.

Hoewel de fail-over wel heeft gefunctioneerd is er wel dataverlies opgetreden doordat lopende transacties niet behandeld werden. SIDN heeft daarbij geluk gehad dat dit probleem zich diep in de nacht heeft voortgedaan en  niet tijdens de drukkere kantooruren op een reguliere werkdag.

BIT meldt op haar website dat de storing is veroorzaakt door een falende koelpomp. “Om nog onbekende reden is niet omgeschakeld naar de standby pomp. Onze engineers hebben nu de standby pomp geactiveerd. Wel zien wij (ook) nog problemen met de koelmachines. De temperatuur in de serverruimte is aanzienlijk gestegen.” BIT heeft zaterdagmorgen een onderzoek laten instellen door de leverancier. Het onderzoek toont aan dat een stuurleiding bevroren was, waardoor de aansturing van de pompen niet goed verliep.

Pieter, 5 februari 2012 11:50 pm

Eigenlijk van de zotte dat de SIDN zijn deelnemers niet eens op de hoogte heeft gesteld en slechts een simpele tweet heeft doen uitgaan met dat er meer is te lezen op het besloten gedeelte van de registrar website SIDN.

Zijn de deelnemers maar tweederangs, hoeven zij dit niet te weten middels een email met wat er aan de hand is of is geweest?

Zeer vreemde wijze van handelen.

Ook een bedroevende zaak dat er al meer van dit soort van problematiek is voorgevallen bij BIT, daar ie toch ook nog wel eens iets aan de hand; brandmeldingen waardoor de SIDN niet meer bereikbaar was dan nu weer koeling problemen (bij gemiddelden van -14oC en weer problemen bij de SIDN deze keer verlies van data.

Is dit nu werkelijk allemaal zo knullig bij een Stichting genaamd SIDN die toch vele miljoenen heeft te besteden.

Jelle M, 6 februari 2012 9:42 am

BIT staat bekend om de koelproblemen

Alex Bik, 6 februari 2012 11:43 am

@Jelle: Het klopt dat er eerder issues in BIT-2A geweest zijn met koeling, maar de datacenters waar we zelf klant zijn (SARA, TC2, InterXion in Frankfurt) hebben ook meer dan eens issues gehad met de koeling. Het verschil is dat BIT er open over communiceert. Andere DC's doen dat niet, zelfs niet (altijd) met de getroffen klanten. De opmerking dat BIT er om bekend zou staan laat ik daarom voor je eigen rekening.

BIT zal later vandaag of anders uiterlijk morgen met een (eveneens publiek beschikbare) RFO komen. Ik kan al wel vertellen wat de oorzaak was: De opnemer die het drukverschil over de koelwaterpompen meet (waar de pompen op geregeld worden) was bevroren, waardoor het gemeten drukverschil veel hoger was dan in werkelijkheid. De pompen werden daarom ten onrechte allebei teruggeregeld, waardoor er geen koelwater meer rondgepompt werd. Er zijn inmiddels maatregelen getroffen waardoor dit niet meer kan gebeuren en er zullen nog aanvullende maatregelen getroffen worden. De details zijn straks in de RFO te vinden.

Randy ten Have, 6 februari 2012 11:50 am

Ik sluit me bij Alex zijn standpunt aan. Pluspunten voor de communicatie bij BIT!

Jesper, 6 februari 2012 11:15 pm

Wat mij betreft één van de vele pluspunten van BIT. Het is onterecht om te doen alsof BIT daardoor meer storingen heeft. Het zijn er heel weinig maar ze wel zijn bekend.

John Knieriem, 7 februari 2012 10:08 am

Elke datacentrum heeft zo nu en dan problemen. Zolang we met technologie te maken hebben zullen er technische problemen zijn. Bit is hierin geen uitzondering en zal ook geen uitzondering worden.
Dat problemen in de een DC leiden tot dataverlies bij klanten heeft ook iets te maken met de door klanten gekozen architectuur en de risico's die zij besloten hebben te nemen.
Ik vind het bij storingen in DC's vooral interessant om te zien hoe ze worden geanalyseerd, worden opgelost en welke lessen er geleerd zijn. En vooral ook hoe er over wordt gecommuniceerd door de aanbieder.
Vorm je eigen oordeel over Bit.... en vergelijk dit met anderen.... .

Laatste reacties

Bedankt voor het succes van ISPam.nl
Koen Stegeman, Editor-in-Chief & founder Hostingjournalist.com: Jammer Arnout, maar je hebt een mooie bijdrage aan de hosting industrie geleverd, en dat jaren lang....

Bedankt voor het succes van ISPam.nl
Dillard Blom: Jammer dat een 'instituut' verdwijnt, en daarmee een bron van informatie over actuele zaken (en opin...

Bedankt voor het succes van ISPam.nl
L.: Uit automatisme kijk ik toch nog steeds elke dag naar ispam.nl, toch de hoop dat er nog een berichtj...

Bedankt voor het succes van ISPam.nl
Toni Donkers: Arnout bedankt! ik ga het missen dat is een feit!

Bedankt voor het succes van ISPam.nl
Marcel Stegeman: Ik zie het nu pas. Inderdaad jammer maar ik kijk nu al uit naar het volgende project.