Hoe wij ons platform voor jou veilig houden!

“Waar gehakt wordt, vallen spaanders.” Ofwel, waar software geschreven wordt, ontstaan bugs. Sommige van deze bugs zorgen voor instabiliteit, andere voor verminderde veiligheid. Dit geldt voor alle software, van welke ontwikkelaar dan ook. Hoe kunnen wij er dan voor zorgen dat ons platform betrouwbaar en veilig is?

Hoe wij ons platform voor jou veilig houden!

Een betrouwbaar en veilig platform begint natuurlijk met goed besturingssysteem als solide basis. Deze basis is bij ons ‘CloudLinux’, die op zijn beurt ‘Red Hat Enterprise Linux’ (RHEL) als basis heeft. Waar RHEL zich voornamelijk op de enterprise richt, is CloudLinux opgericht om speciaal voor webhosting aanvullende features te bieden. Wat Red Hat samen met de aanvullende mogelijkheden van CloudLinux levert, blijkt in de praktijk ook een uitstekende keuze te zijn. Er is een goede balans tussen stabiliteit en nieuwe features.

Naast een besturingssysteem is ook een beheeromgeving essentieel, een zogeheten ‘control panel’. Om het beheer van onze webhostingpakketten voor onze klanten eenvoudig te maken, is er daarom DirectAdmin als control panel geïnstalleerd. Dit is de meest zichtbare kant van onze servers. Het is de omgeving waarop je inlogt om bijvoorbeeld e-mailaccounts aan te maken of een applicatie, zoals WordPress, te installeren.

Dat beetje extra

Een stabiel besturingssysteem, een beheerpaneel erbij en dan ben je klaar om je klanten te bedienen. Simpel, nietwaar? Hoewel we het op deze manier zouden kunnen doen, is dit voor ons niet goed genoeg. Wij stellen, net zoals onze klanten, hogere eisen en doen graag net dat beetje extra!

Verder lezen

Een pikdonker en doodstil datacenter…

Afgelopen dinsdag, 23 juni 2015, gebeurde rond 8:30 uur het ergste wat een hostingprovider kan overkomen: er was een volledige black-out in één van de datacenters, waarin wij het merendeel van onze servers hebben geplaatst. Het gevolg: alle apparatuur down en tienduizenden klanten onbereikbaar. Een fantastisch begin van de dag. Het kan nóg erger: totale verwoesting van het datacenter in kwestie, maar dat was gelukkig niet aan de orde. Wat dan wel? Nou, een stroomstoring…

Stroomuitval in het dataceter: pikdonker en doodstil

Ik hoor het je denken: “Hè, wat?! Dat kan toch niet? Alles in zo’n datacenter is beveiligd, dubbel uitgevoerd, heeft noodaggregaten en zo?” Inderdaad, dat is er allemaal en in veel gevallen zelfs vierdubbel uitgevoerd. In theorie kan stroomuitval dus niet voorkomen. Echter, door de meest ongelukkige samenloop van omstandigheden gebeurde het toch. Een goed voorbeeld van hoe theorie en praktijk soms ver uit elkaar liggen.

Naast dat het voor iedereen zeer vervelend is, was het voor ons ook een ultieme proef of we spoedig konden herstellen van zo’n grote storing. Daarnaast was het de vuurdoop voor ons nieuwe platform, waarin duidelijk werd of het in de praktijk deed wat het moest doen. Omdat jij ook recht hebt op deze informatie, hebben we hieronder een gedetailleerd verslag geschreven.

Inhoudsopgave

  1. Antagonist zegt sorry!
  2. Klein team, veel klanten
  3. Prioriteit tijdens calamiteit
  4. Hoe kan dat dan, geen stroom?
  5. De gevolgen voor Antagonist
  6. Opstarten na stroomuitval
  7. Nazorg, totdat alles weer in orde is
  8. Wat is de schade?
  9. Communicatie
  10. Hoe gaan we dit voorkomen?
  11. One more thing…

Antagonist zegt sorry!

Maar eerst zeggen we: “Sorry!” Een storing is altijd hinderlijk. Helemaal als klanten er de dupe van worden. Door de stroomstoring in het datacenter heeft ons gehele platform er even uit gelegen. Al onze klanten hebben daardoor downtime ondervonden. Daarnaast hebben enkele klanten langer last gehad vanwege herstelwerkzaamheden.

Het ‘uitvallen’ van de stroom heeft dus een behoorlijke impact. Dat vinden we erg vervelend en daarom bieden we onze excuses aan. Dat is tevens één van de redenen voor dit blog. Daarnaast willen we je een eerlijk en helder inzicht geven in wat er precies is gebeurd.

Tijdens de storing hebben we regelmatig updates geplaatst. Het waren vooral beknopte berichten over de voortgang van de situatie en het herstel. Daarnaast hebben we twee ‘post incident’-berichten geschreven. Deze gaven inzicht in de toedracht. De werkelijke gevolgen zijn voor een buitenstaander wellicht lastig voor te stellen. Vandaar dat we je graag een kijkje in de keuken geven, hoe het er dinsdag aan toe ging.

Klein team, veel klanten

Antagonist heeft tienduizenden klanten en 12 medewerkers. Zodoende moet je tijdens een grote storing, als een geoliede machine te werk gaan. Alles moet vanzelfsprekend zijn, want tijd is er niet. Met een klein en hecht team moet je handelen vanuit instincten. Juist daarom vinden we het zo belangrijk dat een medewerker goed moet passen binnen ons team. Naast de juiste kennis en vaardigheden zoeken we dus naar de perfecte match.

Als het misgaat, dan is het heel simpel. Er zijn drie dingen die er toe doen. Eén: onze klanten moeten zo snel mogelijk weer online. Twee: voorkom zoveel mogelijk schade en dataverlies. Drie: zorg voor een vlotte en oprechte communicatie, waarin vragen van klanten zorgvuldig worden beantwoord.

Qua prioriteit ligt het ietsje ingewikkelder. De hoogste prioriteit is bij Antagonist altijd data-integriteit. Dat betekent dat we het voorkomen van dataverlies belangrijker vinden dan beschikbaarheid. Je hebt immers niets aan een website zonder data. Gelukkig hoeven we ons daar weinig zorgen over te maken. Gegevens worden veilig opgeslagen. De kans op dataverlies is daardoor zeer gering. Zodoende storten we ons, tijdens een storing, vrijwel direct op de beschikbaarheid.

Prioriteit tijdens calamiteit

Goed, het is dinsdagochtend en we zien dat er heel veel loos gaat. De oorzaak weten we niet. Er was weliswaar een sterk vermoeden dat het om een (deels) falende stroomtoevoer gaat, maar dat kunnen we niet bevestigen. Dat is erg naar. Want hoe kun je iets oplossen, als je het probleem niet kent?

Verder lezen

Zes coole datacenters en één hele hete…

Coole datacenters: Servers van AntagonistDe vakantieperiode staat alweer voor de deur, een goed moment om op reis te gaan. In dit artikel neem ik je mee naar een aantal van de meest opvallende en coole datacenters in de wereld, bepaald door architecturale innovatie, inventieve duurzaamheid, opzienbarend hergebruik van bestaande gebouwen of gewoon de grootte in omvang. Het is een digitale trip langs alle uithoeken van de aarde. Niet alleen de datacenters zijn interessant, ook de ligging en de verschillende landschappen zijn de moeite waard.

Wat is een datacenter?

Voordat we op reis gaan zal ik je eerst wat meer vertellen over een datacenter. Een datacenter is een faciliteit waar bedrijfskritische ICT-apparatuur (zoals servers) zijn ondergebracht.

Coole datacenters: Wat is een datacenter?

Voorzieningen als klimaatbeheersing, geavanceerde automatische brandblussysteem, back-up stroomvoorzieningen en noodaggregaten worden in datacenters veelal gebruikt om de veiligheid zoveel mogelijk te waarborgen.

Coole datacenters: Dieselaggregaat bij Previder

In verband met het bedrijfskritische karakter van de apparatuur in een datacenter, zijn de voorzieningen doorgaans redundant (dubbel) uitgevoerd. Tevens zijn aan de buitenkant van datacenters vaak fysieke beveiligingsmaatregelen genomen om het gebouw optimaal te beschermen. Meer informatie kun je vinden op Wikipedia.

Het datacenter dat Antagonist gebruikt

Bij Antagonist maken we gebruik van twee datacenters, Equinix en Previder. De meeste van onze servers hebben we bij Previder ondergebracht. Previder, qua beveiliging ook wel het ‘Fort Knox van Twente’, genaamd, behoort tot één van de beste datacenters van Nederland. Alles rondom de stroomvoorziening en bedrijfszekerheid is dubbel en vaak zelfs driedubbel uitgevoerd. Deze aanpak biedt de absolute zekerheid dat gegevens altijd beschikbaar zijn.

Verder lezen