Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Sv translation
languageen

Introduction

A jtel ACD consists of a minimum of 2 virtual machines and may grow to sizes of 30 or more, in depending on redundancy or performance requirements. Based on a systems architecture, there are certain dependencies between the services, so a clean startup and shutdown is required and only done in a certain order to prevent problems during and after startup. The following pages describe the general parameters, as well as some of the various possible scenarios for proper shutdown and startup procedures, depending on the systems architecture. 

Info
titleOn Premise

Caution for on premise jtel ACD systems:

Shutting down and starting the virtual machines of your jtel System is not part of the jtel service contract and may incur service fees as a result, if assistance from jtel is required. For further information, or to book a service appointment, please contact us at service@jtel.de 

Page Layout

The pages are split into a parent and child pages. This parent page contains general information. The child pages each contain information about the specific procedure, depending on the sizing of the system. The sizing variants are Small, Medium and Large

Redundancy - Controlled Failovers

If you wish to shutdown only one side of your redundant jtel cluster, the following child page provides a guide for this procedure  Shutdown/Startup Procedure - Redundancy - Controlled Failover and Failback

This procedure is useful for cases where one of your VM-Hosts must be shutdown, but your jtel ACD is required to maintain service during this time. 

jtel System Dependencies

All services of the platform are dependent on two central entities:

  • The Storage(s)
  • The Database(s)

To boot the solution, the storage should always be booted first. If this is external to the solution, continue with the next step. Otherwise, the computer (or in case of redundancy - both computers) is started on which the storage is located. This is usually the load balancer, but for larger systems a separate storage machine could have been implemented. Afterwards, the master database is booted. As soon as its is finished, the slave can be started up. Finally, the telephony servers and web servers can be started up in any order, even simultaneously.

Redundant Systems

Shutting down redundant clusters is generally easier than starting them back up. If problems occur after starting back up, some components must be checked:

Database:

  • MySQL Replication between all replication partners

Load Balancing:

  • pcs cluster status

Storage:

  • pcs cluster status
  • drbd status

Checks after starting a system

To ensure proper system functionality after a boot, tests are required. Follow the guideline on this page: System Health Check

Machines and Shutdown Priorities

Info

The Hostnames of an ACDs jtel virtual machines may not be in concurrence with the aliases displayed below.


AliasSignifiesShutdown PriorityStartup Priority
acd-dbmDatabase MasterThirdThird
acd-dbm1First Database MasterThirdThird
acd-dbm2Second Database MasterThirdThird
acd-dbsDatabase SlaveSecondFourth
acd-dbs1First Database SlaveSecondFourth
acd-dbs2Second Database SlaveSecondFourth
acd-dbrReporting DatabaseSecondFourth
acd-lbThe Load BalancerFourthSecond
acd-lb1First Load BalancerFourthSecond
acd-lb2Second Load BalancerFourthSecond
acd-storeThe File StorageLastFirst

acd-tel1 ... acd-telN

The Telephony Machine(s) Numbered from 1 ... NFirstLast

acd-jb1 ... acd-jbN

The Webserver Machine(s) Numbered from 1 ... NFirstLast
acd-apiThe REST-APIFirstLast
acd-chatChat and or WhatsAppFirstLast
acd-chatbotChatbot FirstLast


Sv translation
languagede


Warning
titleAlt

Diese Seite ist veraltet und aktuell nur in englischer Version verfügbar.

Hoch- und Runterfahren

Alle Systeme sind so gestaltet, dass Sie hochfahren und alle Dienste selbstständig starten.

Dennoch ergeben sich gewisse Abhängigkeiten zwischen den Diensten, sodass ein sauberes Hoch- und Herunterfahren am besten geschieht, wenn eine gewisse Reihenfolge betrachtet wird. 

Hochfahren

Abhängigkeiten

Alle Dienste der Plattform sind von zwei zentrale Entitäten abhängig:

  • Das Storage
  • Die Datenbank(en)

Für das Hochfahren der Lösung, sollte immer zuerst das Storage hochgefahren werden. Wenn dies Extern zur Lösung ist, dann fährt man mit den nächsten Schritt fort. Ansonsten, wird der Rechner (oder bei Redundanz - beide Rechner) gestartet auf den das Storage ist. Dies ist in der Regel der Load-Balancer, bei größere Systeme kann jedoch eine separate Storage-Maschine implementiert worden sein.

Anschließend, wird die Master Datenbank hochgefahren. Sobald dieser oben ist, kann der Slave hochgefahren werden.

Zum Schluss können die Telefonieserver und Webserver in einer beliebigen Reihenfolge, auch gleichzeitig, hochgefahren werden.

Reihenfolge

Im Folgenden wird von einer nicht redundante Lösung ausgegangen. Der Betrieb einer redundanten Lösung bedarf eine gesonderte Schulung.

Somit ergibt sich folgende Startreihenfolge:

  1. Storage (Separates Storage acd-store oder Load-Balancer acd-lb). 
    Warten bis Storage oben ist.
  2. Bei separater Storage, nun den Load-Balancer acd-lb hochfahren.
    Hier muss nicht gewartet werden.
  3. acd-dbm - Datenbankmaster - hochfahren.
    Warten bis DB-Master oben ist.
  4. acd-dbs - Datenbankslave - hochfahren.
    Warten bis DB-Slave oben ist.
  5. acd-jb1 ... acd-jb(x) sowie acd-tel1 ... acd-tel(x) hochfahren.

Prüfungen

  1. Am Web über den Load-Balancer anmelden. 
    1. Anmeldung OK?
      Wenn nicht, /home/jtel/jboss-(version)/standalone/log/server.log prüfen.
    2. GANZ WICHTIG: Logo in der Webanwendung sichtbar?
      Wenn nicht, ist das Storage nicht oben. Mit mount auf den Webservern prüfen. Ggf. mit mount /home/jtel/shared Mount wiederherstellen.
  2. System anrufen.
    1. Anrufe werden durchgestellt?
      Wenn nicht, Telefonieserver prüfen.
      Nach rote Meldungen im Telefonieserver schauen und entsprechend handeln.
    2. Anrufe werden im Agent-Home bzw. Mini-Client signalisiert?
      Wenn nicht, Hazelcast-Cluster (PlatformListener auf Telefonie, sowie Webserver) prüfen.

Herunterfahren

Reihenfolge

Das Herunterfahren geschieht in der umgekehrten Reihenfolge:

  1. Alle Webserver acd-jb1 ... acd-jb(x) und Telefonieserver acd-tel1 ... acd-tel(x) herunterfahren.
    Schritt fertigstellen bzw. sicherstellen dass die Rechner wirklich am herunterfahren sind bevor man weitermacht.
  2. Datenbank Slave acd-dbs herunterfahren.
  3. Datenbank Master acd-dbm herunterfahren.
  4. Load Balancer acd-lb herunterfahren.
  5. Bei separater Storage, acd-store herunterfahren.

Zwischen den einzelnen Schritten ist es nicht zwingend notwendig zu warten, ledeglich Schritt 1 sollte insgesamt abgeschlossen sein bevor man fortfährt.

Hoch- und Runterfahren - Redundante Komponeten

Wenn das gesamte System heruntergefahren wird, kann es sein, dass manche Komponenten nicht sofort verfügbar sind, bzw. dass ein manueller Eingriff notwendig ist.

Storage (Redundant)

Runterfahren (nur einer)

Immer eins nacheinander herunterfahren.

Mit:

Translations Ignore


Code Block
pcs status 


feststellen welcher Node aktiv ist.

Auf den anderen node:

Translations Ignore


Code Block
drbdadm down jtelshared


Dann diesen Node herunterfahren.

Hochfahren (nur einer)

Wurde nur ein Node neu gestartet, dann kann der Betrieb wieder aufgenommen werden indem man auf den Secondary folgendes nach dem Neustart eingibt:

Translations Ignore


Code Block
drbdadm up jtelshared


Sync status prüfen mit:
Translations Ignore


Code Block
cat /proc/drbd


Nachdem der Sync ggf. erfolgt ist, und fertig ist:

Translations Ignore


Code Block
drbdadm primary jtelshared


Runterfahren (beide)

Mit:

Translations Ignore


Code Block
pcs status


feststellen welcher Node aktiv ist (der Node auf den das Samba sowie die virtuelle IP läuft). Dies ist der Primary Node. 

Mit:

Translations Ignore


Code Block
pcs cluster stop --all


den Cluster auf inaktiv setzen.

Auf auf den Secondary zuerst, dann Primary:

Translations Ignore


Code Block
drbdadm down jtelshared
shutdown now



Hochfahren (beide)

Beide nodes booten.

Auf beide Nodes (Primary zuerst):

Translations Ignore


Code Block
drbdadm up jtelshared


Prüfen mit:

Translations Ignore


Code Block
cat /proc/drbd


Beide Nodes sollten auf Secondary stehen, aber kein Sync sollte erfolgen.


Dann auf beide Nodes (Primary zuerst):

Translations Ignore


Code Block
drbdadm primary jtelshared


Prüfen mit: 
Translations Ignore


Code Block
cat /proc/drbd


Beide Nodes sollten auf Primary stehen, aber kein Sync sollte erfolgen.

Dann auf den Primary:

Translations Ignore


Code Block
pcs cluster start --all
pcs resource cleanup 



Dann prüfen ob alles läuft:

Translations Ignore


Code Block
pcs status




...