Progetto

Generale

Profilo

Reinstallare un cluster Proxmox

Una volta che si sia installato un cluster Proxmox diventa estremamente problematico il cambiamento di alcuni parametri, ad esempio gli indirizzi IP usati per il cluster. Questo comporta che la via più semplice per effettuare alcuni cambiamenti è la reinstallazione. Il primo passo per la reinstallazione è la eliminazione dei singoli nodi dal cluster, questo può essere fatto con il comando:

pvecm delnode nodoX

Dato che nel prosieguo della procedura si cancelleranno tutti i dati, può essere opportuno salvare il contenuto di eventuali configurazioni di /etc/pve, se si voglino ripristinare i dati di un precedente cluster anche quelli di /var/lib/cluster.

Ma questo non è sufficiente in quanto restano sul nodo tutte le componenti per cui il wiki di Proxmox indica la reinstallazione della macchina. La richiesta è in effetti un po' eccessiva ed in sostanza quello che è sufficiente è l'eliminazione di tutte le componenti e la cancellazione dei relativi dati. Per questo si cominci con la disinstallazione dei pacchetti:

apt-get remove --purge pve-manager pve-cluster libcorosync4-pve
Reading package lists... Done
Building dependency tree       
Reading state information... Done
The following packages were automatically installed and are no longer required:
  dtach libcgroup1 attr pve-kernel-2.6.32-14-pve libio-multiplex-perl
Use 'apt-get autoremove' to remove them.
The following packages will be REMOVED:
  clvm* fence-agents-pve* libpve-access-control* libpve-storage-perl*
  pve-cluster* pve-manager* qemu-server* redhat-cluster-pve*
  resource-agents-pve* vzctl*
0 upgraded, 0 newly installed, 10 to remove and 0 not upgraded.
After this operation, 6,742 kB disk space will be freed.
Do you want to continue [Y/n]? 
...

Si tenga presente che si otterranno una serie di avvertimenti su directory non cancellabili perché non vuote, ed un errore su /etc/pve che può restare montata, pur non essendo più utilizzabile in quanto si è rimossa la compomente del cluster che la mantiene sincronizzata sui nodi, per cui nel caso occorrerà smontarla a mano con:

umount /etc/pve

Questo ha comunque una conseguenza, il cluster infatti sposta le chiavi di autenticazione di SSH per root da /root/.ssh a /etc/pve/priv/authorized_keys lasciando sul posto un link simbolico, quindi i suddetti file verranno persi e si dovrà autenticarsi con le password; qualora si fosse rimossa l'autenticazione a password nella configurazione di SSH la si ripristini prima di scollegarsi o si resterà chiusi fuori.

Occorrerà poi ripulire le varie directory che contengono dati precedenti e che non sono state rimosse perché non vuote:

rm -fR /etc/cluster/ /var/log/cluster /var/lib/cluster /etc/pve/ /usr/share/fence /var/lib/pve-manager /var/lib/pve-cluster/

Inoltre potrebbe essere il caso di cancellare anche tutto quanto sta sotto /var/lib/vz/, ma in questo caso ci sono due controindicazioni, la directory può essere stata montata a parte e contenere lost+found e potrebbero esservi fra i contenuti le eventuali immagini ISO ed i template scaricati e non solo eventuali macchine virtuali che non interessano più, quindi non conviene cancellare tutto ma solo quel che non interessa.

A questo punto è opportuno riavviare il nodo per esser sicuri di aver fermato tutti i servizi e si potrà passare a reinstallare i servizi, il primo passo però è installare vzctl che è stato rimosso con la disinstallazione ma che deve essere installato preventivamente perché necessario al riavvio di pve-manager, pur non comparendo nelle dipendenze. Per questo prima occorre eseguire:

apt-get install vzctl

e solo in un secondo tempo eseguire:

apt-get install pve-manager