Schlagwort-Archive: corosync

erneuten Proxmox 2.0/2.1 – Gau gefunden

Der besondere Vorteil von #Proxmox ist ja, daß #Proxmox 2.0 und höher  #HA #High-Avaliable #Clustering emöglicht. Eine tolle Sache, wenn alle Voraussetzngen erfüllt sind und der eine oder andere Proxmox Host-Betreiber wird es ausprobieren wollen und einen Cluster zufügen und eine oder mehrere #Nodes additional zufügen – und dann kommt das böse böse Erwachen, wenn nämlich Multicast-Network an einer Stelle nicht unterstützt wird!

Die Hosts haben sich dann bis zu einem Teil mit einander verbunden, eine Fehlermeldung kommt: #corosync nicht läuft und es gibt keine Chance mehr vor und zu rück – die „Kisten“ sind verfahren!

Auf dem ersten Host läuft noch alles, man kann sogar mit dem Webinterface den anderen Host (Cluster) sehen und auch anklicken – und nichts geht mehr – ein Connecten ist nicht möglich.

Auf dem zweiten Host kann das Webinterface nicht gestartet werden, denn der Apache2 startet auf dem Host nicht. Grund sind Zertifikate, die nicht angelegt wurden, aufgrund nicht vorhandener corosync – Verbindung. Die kann man auch nicht in den Berech von dem anderen Host reinkopieren, denn das /etc/pve – Verzeichnis kann nicht mehr beschrieben werden!
Die Zertifikatsdateien können in anderen Verzeichnissen angelegt werden (mal nur testweise), dann wird aber beim Verbinden vom anderen Host, eine gleiche Key-Datei benötigt, die auf dem Problemhost fehlt und auch dort nicht im /etc/pve angelegt werden kann.

Nun gut, was man normalerweise eingestellt hat, kann man ja zurück stellen – doch weit gefehlt:

Beim Zurückstellen mit dem Befehl: pvecm delnode Hostname
kommt die Fehlermeldung, daß corosync nicht läuft und daher ein
delnode nicht möglich ist! Auch -force und -silent bringen hier nichts.

Dann findet sich plötzlich die Möglichkeit, die Zertifikate neu zu erzeugen, auch mit -force und -silent – nur werden die Zertikate definitiv nicht angelegt!

Nirgendwo im Internet unter stundenlangem Suchen, findet man eine manuelle Möglichkeit, die Nodes von einander manuell zu trennen oder den Fehler zu beheben!

Wer sich darauf verlassen hat, daß hier Proxmox datenkonsistent gearbeitet hätte, der ist nun verlassen. Wir haben dann 2 Test-Container erst mal schnell nach langem Suchen, komplett neu aufgespielt! Was wäre passiert, wenn ein Hoster, dies mit vollen Container gemacht hätte? Mehrere Stunden und Tage Ausfall für Umkopieren etc. wären die Folge gewesen.