erneuten Proxmox 2.0/2.1 – Gau gefunden

Der besondere Vorteil von #Proxmox ist ja, daß #Proxmox 2.0 und höher  #HA #High-Avaliable #Clustering emöglicht. Eine tolle Sache, wenn alle Voraussetzngen erfüllt sind und der eine oder andere Proxmox Host-Betreiber wird es ausprobieren wollen und einen Cluster zufügen und eine oder mehrere #Nodes additional zufügen – und dann kommt das böse böse Erwachen, wenn nämlich Multicast-Network an einer Stelle nicht unterstützt wird!

Die Hosts haben sich dann bis zu einem Teil mit einander verbunden, eine Fehlermeldung kommt: #corosync nicht läuft und es gibt keine Chance mehr vor und zu rück – die „Kisten“ sind verfahren!

Auf dem ersten Host läuft noch alles, man kann sogar mit dem Webinterface den anderen Host (Cluster) sehen und auch anklicken – und nichts geht mehr – ein Connecten ist nicht möglich.

Auf dem zweiten Host kann das Webinterface nicht gestartet werden, denn der Apache2 startet auf dem Host nicht. Grund sind Zertifikate, die nicht angelegt wurden, aufgrund nicht vorhandener corosync – Verbindung. Die kann man auch nicht in den Berech von dem anderen Host reinkopieren, denn das /etc/pve – Verzeichnis kann nicht mehr beschrieben werden!
Die Zertifikatsdateien können in anderen Verzeichnissen angelegt werden (mal nur testweise), dann wird aber beim Verbinden vom anderen Host, eine gleiche Key-Datei benötigt, die auf dem Problemhost fehlt und auch dort nicht im /etc/pve angelegt werden kann.

Nun gut, was man normalerweise eingestellt hat, kann man ja zurück stellen – doch weit gefehlt:

Beim Zurückstellen mit dem Befehl: pvecm delnode Hostname
kommt die Fehlermeldung, daß corosync nicht läuft und daher ein
delnode nicht möglich ist! Auch -force und -silent bringen hier nichts.

Dann findet sich plötzlich die Möglichkeit, die Zertifikate neu zu erzeugen, auch mit -force und -silent – nur werden die Zertikate definitiv nicht angelegt!

Nirgendwo im Internet unter stundenlangem Suchen, findet man eine manuelle Möglichkeit, die Nodes von einander manuell zu trennen oder den Fehler zu beheben!

Wer sich darauf verlassen hat, daß hier Proxmox datenkonsistent gearbeitet hätte, der ist nun verlassen. Wir haben dann 2 Test-Container erst mal schnell nach langem Suchen, komplett neu aufgespielt! Was wäre passiert, wenn ein Hoster, dies mit vollen Container gemacht hätte? Mehrere Stunden und Tage Ausfall für Umkopieren etc. wären die Folge gewesen.

 

 

 

Ein Gedanke zu „erneuten Proxmox 2.0/2.1 – Gau gefunden“

  1. nach missglückter Konfiguration und vergeblichen versuchen, die configs wieder gerade zu beigen hat das hier wunderbar funktioniert. Auf allen Nodes ausgeführt ist das System quasi wieder jungfräulich und das Cluster schnell wieder aufgebaut. Über Sinn und Unsinn könnte man sich streiten.

    service cman stop
    service pve-cluster stop
    rm /etc/cluster/cluster.conf
    rm /var/lib/pve-cluster/*
    service pve-cluster start

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.