staging.inyokaproject.org

Was ist mit eshu passiert?

ubuntuusers.png

Eine Erklärung, was mit einem unserer Server eshu in Frankreich passiert ist, welcher für den Mailverkehr inklusive der Mailinglisten verantwortlich war.

Wer oder was ist eshu?

Eshu ist seit einigen Jahren unser DNS- und Mailserver, welcher nicht nur für ubuntuusers.de, sondern auch für viele Mailinglisten verwendet wurde. Dieser steht in einem Rechenzentrum in Frankreich und wurde vom Hoster Dedibox 🇫🇷 gespendet und war ursprünglich als ein Backup-Server konzipiert. Weitere Informationen zu den eingesetzten Servern gibt es im Artikel Was macht eigentlich das Serverteam.

Was ist passiert?

Leider hat niemand vom aktuellen Serverteam die Möglichkeit vor Ort nachzusehen, was genau ausgefallen ist bzw. wo das Problem liegt. Alle Informationen, die das Serverteam hat, kamen von einem Kollegen aus Frankreich, welcher selbst den Support des Hosters bemüht hat.

Dass wir einen Kollegen in Frankreich haben, ist übrigens historisch begründet: Früher gab es ein gemeinsames Serverteam, welches alle Server vieler europäischer Communities betreute. Die zwei größten Mitglieder dieses Serververbundes waren die deutsche und die französische Ubuntu Community. Im Laufe der Zeit trennten sich die Wege der Communities wieder – was blieb sind die Kontakte zwischen den Serveradministratoren.

Der Kollege aus Frankreich versuchte daraufhin den Hoster dazu zu bewegen, die Platten vom vermeidlich defekten Server in einen neuen Server zu stecken, so dass das ubuntuusers-Serverteam eine Kopie der Daten (DNS-Zonen, Mailsetup, Mailman-Konfiguration) anfertigen könnte. Dies hat der Hoster nach Angaben unserer französischen Kollegen jedoch abgelehnt.

Das Schlimmste an dem Ausfall ist aber nicht, dass die Hardware ausgefallen ist – diese wäre einfach zu ersetzen, der Hoster hat uns sogar einen neuen Server angeboten –, sondern dass es keine Kopie der Daten (Backups) gibt und so alle Dienste von Grund auf wieder neu in Betrieb genommen werden müssen. Dies ist beim Mailsetup und den DNS-Servern noch relativ einfach und schnell erledigt, bei den Mailinglisten ist es aber nicht möglich, die Daten der Abonnenten ohne Backup wiederherzustellen.

Wie geht es weiter?

Schon kurz nach dem Ausfall hat ein Mitglied des Serverteams die DNS-Konfiguration und -Zonen (welche im Noris DNS-Server gecached sind) auf einen anderen Server kopiert und den Nameserver dort eingerichtet. In den darauffolgenden Tagen wurde am Standort Köln das Mailsystem wieder in Betrieb genommen, gleichzeitig auch eine Umstellung von Exim auf Postfix durchgeführt.

In den nächsten Tagen und Wochen wird auf einem der Server wieder Mailman installiert, anschließend werden die Mailinglisten neu angelegt, so dass Benutzer diese wieder abonnieren und nutzen können. Für immer verloren sind die Archive der Mailinglisten!

Konsequenzen?

Da derartige Ausfälle, insbesondere mit Datenverlust, nicht tolerierbar sind, wird aktuell an einem neuen Konzept für die Server, Backups und Vernetzung gearbeitet. Dies wird in den nächsten drei bis vier Wochen in diversen Ikhaya-Artikeln öffentlich erläutert, so dass auch für die Nutzer das sonst unsichtbare Serverteam mal etwas in Erscheinung tritt.


Vielen Dank an encbladexp für den eingesandten Artikel!

Veröffentlicht von toddy | 10. Januar 2012 21:20 | Kategorie: ubuntuusers | # Fehler im Artikel melden

ben_tinc

Avatar von ben_tinc
1 10. Januar 2012 22:00

Vielen Dank für die Informationen! Ich bin schon sehr gespannt auf die folgenden Artikel!

Developer92

Avatar von Developer92
2 10. Januar 2012 22:26

Keine Backups gehabt?

*duck und weg*

Ryuno-Ki

Avatar von Ryuno-Ki
3 10. Januar 2012 22:26

Jedem Ende wohnt ein Anfang inne. (Hermann Hesse)

Dann kann gleich das in der Zwischenzeit erworbene Wissen verwendet werden, um vielleicht alles ein Stück sauberer aufzusetzen ☺

So betrachtet.

Sieht man ja auch bei der Umstellung hin zu Postfix 😉

EnTeQuAk

Avatar von EnTeQuAk
4 10. Januar 2012 23:07

@2: Lies den Artikel doch einfach nochmal und beantworte deine Frage selber. Tipp: vierter Absatz im 2. Teil ☺

Developer92

Avatar von Developer92
5 11. Januar 2012 01:45

@4: ich weiß, deswegen ja das "duck und weg" ☺

Wollte lediglich die Admins ein wenig ärgern, sofern davon jemand hier mitliest.

jo-master

Avatar von jo-master
6 11. Januar 2012 06:39

warum lasst ihr euch die festplatte oder das rack nicht einfach per post zuschicken? (oder man sendet einen hilferuf an die franz. kollegen mit der bitte die platte abzuholen)

toddy

Ikhayateam

Avatar von toddy
7 11. Januar 2012 08:10

@6: Die Versuche die Platten zu bekommen, haben stattgefunden, aber leider nicht zu einem Ergebnis geführt.

Rittmeister

Avatar von Rittmeister
8 11. Januar 2012 09:52

@7: So was sollte man sich merken!

encbladexp

Ehemaliger

Avatar von encbladexp
9 11. Januar 2012 15:15

@2: Ja, auch die Admins lesen hier mit, und auch ja es gibt (leider) keine Backups von diesem System.

@6: Hat dir unsere nette PL schon beantwortet, das wurden natürlich versucht, allerdings haben große Hoster so ihre Probleme mit individuellen Anfragen 😉

Bis auf eshu (RIP) und gu (Server für IRC Bots) haben wir übrigens alle Server in einem Rechenzentrum das wir selbst aufsuchen können wenn was kaputt geht, wir haben hier also ein klassisches Worst-Case Szenario das ausgerechnet da was kaputt geht wo man auch nicht einfach ran kommt.

mfg Betz Stefan

bullgard

Avatar von bullgard
10 11. Januar 2012 17:41

toddy: Danke für die Infos!

sidimike

12 11. Januar 2012 19:33

@9 Server gu bleibt also ganz alleine im Ausland zurück 😢 , die übrigen Server (16) befinden sich in 2 Rechenzentren (Annahme), lg ali

encbladexp

Ehemaliger

Avatar von encbladexp
13 11. Januar 2012 19:38

Der Server gu wird in den nächsten Tagen außer Betrieb gehen, es wird also nur noch Server geben welche von Mitgliedern des Serverteams in maximal 24h irgendwie erreichbar sind, und natürlich bei welchen man die Möglichkeit hat mit sanfter Gewalt nachzuhelfen 😉

An dem Problem mit den Backups wird parallel gearbeitet, was aber zeitlich etwas mehr Aufwand ist :-/

mfg Betz Stefan

sidimike

14 11. Januar 2012 19:47

...die Möglichkeit ... mit sanfter Gewalt nachzuhelfen 😉 , bedeutet, ihr werdet dem Hoster dann etwas näher treten?

encbladexp

Ehemaliger

Avatar von encbladexp
15 11. Januar 2012 19:54

Nein, wenn wir Zugang zum RZ haben können wir die Server persönlich treten und sind nicht drauf angewiesen Menschen als Opfer zu nehmen 😉

mfg Betz Stefan

Wutze

16 12. Januar 2012 08:42

Jaja, das ewige Spiel mit den Backups. Wenn ich das nicht auch selber kennen würde. Der Mist braucht ja nicht nur Zeit, man muss es auch testen. Und immer wird irgend eine Datei am Ende fehlen und das ganze Backup zunichte machen, so mehr oder weniger, wenn es live benötigt wird.

sidimike

17 13. Januar 2012 12:03

Dem Artikel fehlt das Datum, Eintritt des Geschehens! Ich entsinne mich folgender Meldung, den Zusammenhang kann ich nicht mehr darstellen, es ging aber mit Problemen einher. Hatte das mit eshu zu tun? Kopie vom 03.01.2012, GMT 17:00

Some of our servers are currently running amok.
We are trying hard to get it up as soon as possible again. So stay tuned!
Sorry for the inconvenience.

EnTeQuAk

Avatar von EnTeQuAk
18 13. Januar 2012 12:36

@17: Nein, die Meldung besagt lediglich das die Server, auf denen Inyoka direkt läuft Probleme haben. „eshu” ist komplett woanders angesiedelt und davon abgekapselt.

Gruß, Christopher.

Cyrion

19 21. Januar 2012 19:11

Dies hat der Hoster nach Angaben unserer französischen Kollegen jedoch abgelehnt.

nur zum verständnis; der hoster hat sich geweigert, vermutlich intakte daten von einer der platten auf irgendeine weise sichern zu lassen? wenn dem wirklich so ist, gute nacht...

encbladexp

Ehemaliger

Avatar von encbladexp
20 21. Januar 2012 19:13

@19: Das hast du richtig verstanden, dies ist aber bei Mass Hosting Providern nicht ungewöhnlich. Die machen nur Standardsachen und alles andere ist nicht deren Problem.

mfg Betz Stefan

DPITTI

Avatar von DPITTI
21 12. Mai 2012 00:19

O man diese Franzosen schade das diese es Abgelehnt haben die Platten aus dem Defekten in den Neuen Server zu bauen.Aber ist es nich möglich irgendwie doch an die Daten zu Kommen? Es muss doch und davon bin Ich überzeugt im Netz irgendwas sein was Ihr vielleicht nich wisst.

encbladexp

Ehemaliger

Avatar von encbladexp
22 12. Mai 2012 02:02

Nein, da ist nicht möglich.

mfg Betz Stefan