Ce matin, overblog a subi un incident plutôt rare : une fuite d'eau dans le datacenter de Level3 à Nanterre.
Un datacenter, qu'est ce que c'est ? Disons que c'est un bâtiment spécialement construit pour recevoir des systèmes informatiques dans la meilleure qualité de connectivité, de température, de redondance électrique, de surveillance d'accès, d'hygrométrie, etc... Overblog ce sont des dizaines de serveurs (fermés dans des baies, les petites tours visibles sur cette image) répartis sur les datacenter Level3 (Nanterre) et Interxion (Aubervilliers).
A Nanterre, le datacenter se trouve dans un bâtiment de bureaux qui se nomme Le Capitole. Et cette nuit, au premier étage du Capitole (la salle où se trouvent nos serveurs est au rez-de-chaussée), une conduite d'eau à lâchée. Pas le tuyau d'alimentation d'une machine à laver... non, non... un tuyau de 15 cm de diamètre, autant dire, que de l'eau il y en a eu !
Les équipements électriques n'aimant pas trop l'eau, les défaillances ont été nombreuses, à commencer par des équipements réseaux se trouvant en haut des baies (donc les premiers touchés par l'eau).
Paradoxalement, Overblog n'a pas cessé de fonctionner cette nuit, nos serveurs ont même continué à dialoguer parfaitement entre eux (moins de 10 serveurs ont dû recevoir une intervention de notre part pour refonctionner normalement) mais n'étaient plus accessibles depuis l'Internet par manque de réseau.
Notre prestataire de fourniture de connectivité (celui qui amène la fibre optique à nos serveurs) était sur place dans les minutes qui ont suivies le début de l'inondation pour sécuriser et éventuellement réparer les équipements réseau touchés.
Je sais que du point de vue de l'utilisateur final dans son canapé, cela ressemblait à une panne d'Overblog, mais ce que j'essaye d'expliquer dans cet article, c'est que cela était bien indépendant de notre volonté et même de notre bon vouloir à réparer : nous ne pouvions qu'attendre que notre prestataire finisse son intervention. Alors certains ne nous croient pas (et se dépêchent même de diffuser une information totalement non vérifiée sur le net) mais je vous assure que ce genre d'incident est d'une rareté incroyable. Malgré cela, la réactivité de tous les intervenants à été à la mesure de l'incident, et pour overblog nous déplorons une perte de 6% du trafic journalier (l'incident ayant eu lieu sur les heures les plus creuses de fréquentation des blogs).
A l'heure qu'il est, le premier étage du Capitole est encore très humide, les salles machines de Level3 sont sèches, mais un système électrique reste défaillant, sans impact sur Overblog.