Hoch- und Runterfahren

Alle Systeme sind so gestaltet, dass Sie hochfahren und alle Dienste selbstständig starten.

Dennoch ergeben sich gewisse Abhängigkeiten zwischen den Diensten, sodass ein sauberes Hoch- und Herunterfahren am besten geschieht, wenn eine gewisse Reihenfolge betrachtet wird.

Hochfahren

Abhängigkeiten

Alle Dienste der Plattform sind von zwei zentrale Entitäten abhängig:

Das Storage
Die Datenbank(en)

Für das Hochfahren der Lösung, sollte immer zuerst das Storage hochgefahren werden. Wenn dies Extern zur Lösung ist, dann fährt man mit den nächsten Schritt fort. Ansonsten, wird der Rechner (oder bei Redundanz - beide Rechner) gestartet auf den das Storage ist. Dies ist in der Regel der Load-Balancer, bei größere Systeme kann jedoch eine separate Storage-Maschine implementiert worden sein.

Anschließend, wird die Master Datenbank hochgefahren. Sobald dieser oben ist, kann der Slave hochgefahren werden.

Zum Schluss können die Telefonieserver und Webserver in einer beliebigen Reihenfolge, auch gleichzeitig, hochgefahren werden.

Reihenfolge

Im Folgenden wird von einer nicht redundante Lösung ausgegangen. Der Betrieb einer redundanten Lösung bedarf eine gesonderte Schulung.

Somit ergibt sich folgende Startreihenfolge:

Storage (Separates Storage acd-store oder Load-Balancer acd-lb).
Warten bis Storage oben ist.
Bei separater Storage, nun den Load-Balancer acd-lb hochfahren.
Hier muss nicht gewartet werden.
acd-dbm - Datenbankmaster - hochfahren.
Warten bis DB-Master oben ist.
acd-dbs - Datenbankslave - hochfahren.
Warten bis DB-Slave oben ist.
acd-jb1 ... acd-jb(x) sowie acd-tel1 ... acd-tel(x) hochfahren.

Prüfungen

Am Web über den Load-Balancer anmelden.
1. Anmeldung OK?
  Wenn nicht, /home/jtel/jboss-(version)/standalone/log/server.log prüfen.
2. GANZ WICHTIG: Logo in der Webanwendung sichtbar?
  Wenn nicht, ist das Storage nicht oben. Mit mount auf den Webservern prüfen. Ggf. mit mount /home/jtel/shared Mount wiederherstellen.
System anrufen.
1. Anrufe werden durchgestellt?
  Wenn nicht, Telefonieserver prüfen.
  Nach rote Meldungen im Telefonieserver schauen und entsprechend handeln.
2. Anrufe werden im Agent-Home bzw. Mini-Client signalisiert?
  Wenn nicht, Hazelcast-Cluster (PlatformListener auf Telefonie, sowie Webserver) prüfen.

Herunterfahren

Reihenfolge

Das Herunterfahren geschieht in der umgekehrten Reihenfolge:

Alle Webserver acd-jb1 ... acd-jb(x) und Telefonieserver acd-tel1 ... acd-tel(x) herunterfahren.
Schritt fertigstellen bzw. sicherstellen dass die Rechner wirklich am herunterfahren sind bevor man weitermacht.
Datenbank Slave acd-dbs herunterfahren.
Datenbank Master acd-dbm herunterfahren.
Load Balancer acd-lb herunterfahren.
Bei separater Storage, acd-store herunterfahren.

Zwischen den einzelnen Schritten ist es nicht zwingend notwendig zu warten, ledeglich Schritt 1 sollte insgesamt abgeschlossen sein bevor man fortfährt.

Hoch- und Runterfahren - Redundante Komponeten

Wenn das gesamte System heruntergefahren wird, kann es sein, dass manche Komponenten nicht sofort verfügbar sind, bzw. dass ein manueller Eingriff notwendig ist.

Storage (Redundant)

Runterfahren (nur einer)

Immer eins nacheinander herunterfahren.

Mit:

pcs status

feststellen welcher Node aktiv ist.

Auf den anderen node:

drbdadm down jtelshared

Dann diesen Node herunterfahren.

Hochfahren (nur einer)

Wurde nur ein Node neu gestartet, dann kann der Betrieb wieder aufgenommen werden indem man auf den Secondary folgendes nach dem Neustart eingibt:

drbdadm up jtelshared

Sync status prüfen mit:

cat /proc/drbd

Nachdem der Sync ggf. erfolgt ist, und fertig ist:

drbdadm primary jtelshared

Runterfahren (beide)

Mit:

pcs status

feststellen welcher Node aktiv ist (der Node auf den das Samba sowie die virtuelle IP läuft). Dies ist der Primary Node.

Mit:

pcs cluster stop --all

den Cluster auf inaktiv setzen.

Auf auf den Secondary zuerst, dann Primary:

drbdadm down jtelshared
shutdown now

Hochfahren (beide)

Beide nodes booten.

Auf beide Nodes (Primary zuerst):

drbdadm up jtelshared

Prüfen mit:

cat /proc/drbd

Beide Nodes sollten auf Secondary stehen, aber kein Sync sollte erfolgen.

Dann auf beide Nodes (Primary zuerst):

drbdadm primary jtelshared

Prüfen mit:

cat /proc/drbd

Beide Nodes sollten auf Primary stehen, aber kein Sync sollte erfolgen.

Dann auf den Primary:

pcs cluster start --all
pcs resource cleanup

Dann prüfen ob alles läuft:

pcs status

Page tree

Starting Up and Shutting Down

Hoch- und Runterfahren

Hochfahren

Abhängigkeiten

Reihenfolge

Prüfungen

Herunterfahren

Reihenfolge

Hoch- und Runterfahren - Redundante Komponeten

Storage (Redundant)

Runterfahren (nur einer)

Hochfahren (nur einer)

Runterfahren (beide)

Hochfahren (beide)