- Door
- dr. Serge Gielkens
- geplaatst op
- 24 november 2015 08:00 uur
In de nieuwe rubriek Storage Stories bekijken we als eerste het hosting bedrijf PCextreme. Cloud is voor PCextreme de toekomst en onder de naam Aurora biedt zij een serie cloudproducten aan. Wido den Hollander is CTO van PCextreme en in een interview met hem leren we hoe de opslag voor deze lijn van producten geregeld is.
Ceph voor de cloud
PCextreme is al sinds 2004 actief met onder andere webhosting, registratie van domeinnamen en e-mailservice. Toen PCextreme de cloudmarkt verkende, was Wido den Hollander al geruime tijd actief in de Ceph community. Hij zag namelijk al veel problemen bij traditionele storage systemen. Hij praat hierbij uit eigen ervaring want PCextreme gebruikte zelf onder meer ZFS op FreeBSD en producten van EMC.
Den Hollander licht toe: “Bij ZFS ben je afhankelijk van één enkele machine. Als die omvalt, heb je een groot probleem omdat ook andere machines uitvallen. De recoverytijd is daardoor ook lang. Ceph daarentegen bestaat uit zoveel machines dat het uitvallen van een bepaalde machine niet het hele platform meetrekt. De klant merkt hoogstens dat een VM even iets minder presteert.”
EMC heeft bij PCextreme een slechte nasmaak achtergelaten. “EMC was veel te duur voor hetgeen ze leverde. De performance bijvoorbeeld was niet bepaald overtuigend”, verklaart Den Hollander. Omdat PCextreme fan is van open source, wil ze bovendien alles op open platformen draaien. Een gesloten platform als EMC past niet in die filosofie.
Zoals Den Hollander het kort en krachtig samenvat: “Ceph biedt voor ons de groei, de flexibiliteit en de mogelijkheden die wij nodig hebben voor onze cloud.”
Alle Ceph servers draaien op Ubuntu 14.04. “Deze Linux distributie is een persoonlijke voorkeur”, zegt Den Hollander. Hij voegt daar nog aan toe: “Overigens gebruikt hele bedrijf Ubuntu, ook op de laptops.” PCextreme gebruikt van Ceph de object store en de block devices. Het onderliggende bestandssysteem is XFS.
Om de virtuele machines te deployen, gebruikt PCextreme CloudStack. Den Hollander heeft zelf de ontbrekende Ceph-integratie voor CloudStack geschreven. PCextreme geeft alle code en bugfixes voor Ceph en CloudStack overigens terug aan de community. “Open source wordt voor iedereen beter als we eraan bijdragen”, is de vaste overtuiging van Den Hollander.
De cloudomgeving draait op hardware van Supermicro. Er wordt een mix gebruikt van HDD en SSD. Voor de HDD’s worden schijven van Western Digital en Seagate door elkaar gebruikt. Wat betreft de SSD’s wordt er weliswaar nog Samsung gebruikt maar hoofdzakelijk zijn ze van Intel. Dit merk blijkt het betrouwbaarst, aldus Den Hollander.
Hij vertelt verder dat dit geen enterprise drives zijn maar consumer grade producten. “De HDD’s zijn gewone 7200 rpm schijven van 3TB. De reden om consumentendrives te gebruiken is dat Ceph de opslag regelt. Ceph is gebouwd voor falende hardware en ondervangt het uitvallen van schijven. Daarom is ook geen dure RAID hardware nodig.” Het is duidelijk dat Ceph aanzienlijke besparingen op de investeringen
mogelijk maakt.
Verschil moet er zijn
Den Hollander geeft aan dat de storage niet voor alle cloudproducten op dezelfde wijze geregeld is. PCextreme biedt voor Aurora Compute twee smaken cloudservers aan: Stamina en Agile. Omdat ze verschillende doelen dienen, is de opslag eveneens op verschillende manieren geregeld. Hij licht dit toe.
“De virtuele machines van Stamina zijn bedoeld voor high availability. Ze gebruiken Ceph storage waarvan alle data drie keer worden gerepliceerd. Dit blijft binnen één datacenter maar staat wel op drie verschillende drives. Bij een uitvallende disk ben je dus niks kwijt en draait alles gewoon door.”
“Het Agile aanbod is veel goedkoper en is bedoeld als een snel computing platform waarop alleen tijdelijke data staan. Een virtuele machine van Agile gebruikt daarvoor een lokale SSD zonder enige redundantie. Als de drive het begeeft, ben je alle data kwijt. Wij adviseren klanten dan ook om daar geen belangrijke data op te zetten.”
Het Stamina platform staat momenteel alleen in Amsterdam. Het Agile-platform biedt PCextreme wel aan in al haar datacenters. Naast Amsterdam zijn dat Miami, Los Angeles en Tokyo. “De reden is dat het Agile-platform sneller en goedkoper uit te rollen is”, zegt Den Hollander. Hij voegt eraan toe dat op termijn het Stamina-plaform ook beschikbaar komt in de andere datacenters.
Tussen datacenters bestaan overigens geen koppelingen wat de storage aangaat. Dat is met opzet gedaan. Als toelichting geeft Den Hollander: “We willen geen afhankelijkheid creëren tussen de datacenters. Wij vinden het namelijk belangrijk dat klantenapplicaties kunnen verdelen over de datacenters waarbij elk datacenter een eigen availability zone vormt. Mocht een zone uitvallen, dan hebben andere zones daar geen last van.”
Tot slot
“Wij dragen heel graag uit dat we open-source minded zijn”, zegt Den Hollander. Hij roept dan ook alle andere hostingbedrijven in Nederland op om niet alleen open-source te gebruiken, maar er vooral ook aan bij te dragen. We besluiten deze Storage Story met zijn advies: “Bijdragen aan open-source is meer dan code typen. Dat kan al door een gedegen bug report zodat een ontwikkelaar het probleem kan reproduceren.”