Rôle | Vérifiez | Commentaires |
---|
TOUTES LES LINUX | Temps de fonctionnement et erreurs | Utilisez: Temps de fonctionnement pour vérifier depuis combien de temps le système est en marche. S'il a été redémarré, vérifiez les points suivants pour savoir pourquoi : less /var/log/messages Vous devrez peut-être revenir à un fichier plus ancien que le fichier journal actuel pour voir pourquoi. |
TOUTES LES LINUX | Espace disque | Utilisez: df -h pour s'assurer que le disque n'est pas plein. En particulier sur les systèmes de base de données, assurez-vous que cet espace ne sera pas bientôt épuisé. Remarque : sur certains systèmes, /var/lib/mysql peuvent être montés séparément. Utilisez : monture pour vérifier comment il est monté ou cat /etc/fstab |
TOUTES LES LINUX | Charge CPU | Utilisez les deux méthodes suivantes pour identifier les problèmes de charge du CPU : haut sar (historique) sar -u 1 (temps réel) |
TOUTES LES LINUX | Sync du temps | Utilisez les commandes suivantes pour vous assurer que la sync temporelle est correcte : ntpq -p (anciens systèmes) sources chronyc (systèmes plus récents) timedatectl |
TOUTES LES LINUX | Système de fichiers accessible en écriture | Parfois, si une erreur de système de fichiers s'est produite, linux va soit : - Ne pas le monter du tout (c'est facile à voir/trouver)
- Montez-le en lecture seule (ce n'est pas si évident).
Essayez d'écrire dans un fichier |
Rolle | Prüfe | Kommentar |
---|
ALL LINUX | Uptime and Errors | Use: uptime to Prüfe for how long the system has been up. If it has been restarted, then Prüfe the following for why: less /var/log/messages You may need to go back to an older file than the current log file to see why. |
ALL LINUX | Disk Space | Use: df -h to make sure the disk is not full. Particularly on the database systems make sure this space will not run out soon. Note: on some systems, /var/lib/mysql may be mounted separately. Use: mount to verify how it is mounted or cat /etc/fstab |
ALL LINUX | CPU Load | Use both of the following to identify CPU load problems: top sar (historical) sar -u 1 (real-time) |
ALL LINUX | Time Sync | Use the following commands to make sure the time sync is OK: ntpq -p (older systems) chronyc sources (newer systems) timedatectl |
ALL LINUX | File System writable | Sometimes, if a file system error has occurred, linux will either: - Not mount it at all (this is easy to see / find)
- Mount it read-only (this is not so obvious)
Try writing to a file : cat << EOFF > /root/test.txt Test EOFF cat /root/test.txt |
ALL TOUTES LES LINUX | Expected processes runningLes processus attendus sont en cours d'exécution ? | ps -ef | less |
WINDOWS | Time Sync du temps | Vérifiez l'état de ntp en utilisant l'application monitorPrüfe the ntp status using the monitor application. |
WINDOWS | Charge CPU Load | Vérifiez le gestionnaire des tâches pour vous assurer qu'aucun processus n'utilise un nombre très élevé de Prüfe the task manager to make sure no process is running very high CPU. Note: on a loaded system 50% or more CPU is perfectly fine, as long as it is eitherRemarque : sur un système chargé, 50 % ou plus de l'unité centrale est parfaitement acceptable, à condition qu'il s'agisse de l'une ou l'autre des options suivantes : - 8-Server
- SIP and et RTP Stack (Aculab)
|
DB | DB MasterMaître-MasterMaître DB Slaves Esclaves BD | Assurez-vous que la réplication est en cours Make sure replication is running : SHOW SLAVE STATUS\G
Make sure MySQL is not crashingAssurez-vous que MySQL ne se bloque pas : less /var/log/mysqld.log |
LBRedundant | LB redondant | Vérifiez l'état du cluster pcs avec Prüfe the status of the pcs cluster with : pcs statusMake sure one of the load balancers has the shared IP address, and that all resources are started Assurez-vous que l'un des équilibreurs de charge possède l'adresse IP partagée et que toutes les ressources sont démarrées. |
LB | haproxy Stats and Control Page | Page de contrôle et de statistiques de haproxy | Page de contrôle et de statistiques de haproxyOpen haproxy (on both load balancers in a redundant system) using the following url: http://<load-balancer>:7777 Make sure the expected resources are present and all up: - Expected database servers (in a redundant solution) are up and running.
- Only one load balancer is serving connections.
- Only one of the DB masters has active connections.
|
STORE | Redundant Store | Prüfe the status of DRBD with: drbdadm status jtelshared Make sure it is primary/primary (for older installations) or primary secondary (for newer installations). Prüfe the status of the pcs cluster with: pcs status Make sure all of the resources are started: - Mount of /srv/jtel/shared is started on one of the STORE servers
- Samba is started on one of the STORE servers
- The shared IP is started on one of the STORE servers
|
Assurez-vous que les ressources attendues sont présentes et toutes en place : - Les serveurs de base de données attendus (dans une solution redondante) sont opérationnels.
- Un seul équilibreur de charge sert les connexions.
- Un seul des maîtres DB a des connexions actives.
|
MAGASIN | Magasin redondant | Vérifiez le statut de DRBD avec : drbdadm status jtelshared Assurez-vous qu'il s'agit du primaire/primaire (pour les anciennes installations) ou du primaire/secondaire (pour les installations plus récentes). Vérifiez l'état du cluster pcs avec : pcs status Assurez-vous que toutes les ressources sont démarrées : - Le montage de /srv/jtel/shared est lancé sur l'un des serveurs STORE.
- Samba est lancé sur l'un des serveurs MAGASIN.
- L'IP partagée est démarrée sur l'un des serveurs MAGASIN.
|
MAGASIN | Magasin non redondant | Vérifiez l'état du service samba | STORE | Non-Redundant Store | Prüfe the status of the samba service : smbstatus ps -ef | grep samba Make sure it is runningAssurez-vous qu'il est en marche. |
STOREMAGASIN | Space | Espace | Vérifiez l'espace disponible sur le magasin avec Prüfe the available space on the store with df -h |
TEL | 8-Server starteddémarré | La fenêtre du fichier batch startup.cmd batch file window presentest-elle présente ? ? La fenêtre du fichier batch giHal.exe batch file window present and running?est-elle présente et en cours d'exécution ? Est-ce que giAcu.exe (SIP Registrations) present and running (if requiredest présent et fonctionne (si nécessaire) ? Est-ce que 8Server.exe present and runningest présent et fonctionne? |
TEL | Santé du 8-Server health | Vérifiez les erreurs / avertissements pour des messages d'erreur excessifs, tels que des erreurs ODBC ou des erreurs de fichiers .r5 non trouvés. Les erreurs ODBC peuvent indiquer un problème de base de données (par exemple, une panne de mysql), ou une erreur de syntaxe dans une procédure sql. Les erreurs de fichiers non trouvés (en particulier les fichiers .r5) peuvent indiquer un problème de stockage Prüfe errors / warnings for excessive error messages, such as ODBC errors or .r5 files not found errors. ODBC errors can indicate a database problem (for example, a mysql crash). File not found errors (particularly .r5 files) can indicate a storage problem. |
TEL | 8-Server stuck initialisingbloqué lors de l'initialisation | Si If 8-Server says indique "Initialising" on all lines, and does not exit this status for a long time, then there may be connectivity problems to the storage. This is best mitigated by making sure the samba credentials are correct, and that all "jtel" users have the same credentials. sur toutes les lignes, et ne sort pas de cet état pendant une longue période, il peut y avoir des problèmes de connectivité au stockage. La meilleure façon d'éviter ce problème est de s'assurer que les informations d'identification de samba sont correctes et que tous les utilisateurs de "jtel" ont les mêmes informations d'identification. |
TEL | Le serveur de téléphonie ne reçoit pas les appels | Lancez une trace wireshark pour SIP en utilisant ce filtre de capture | TEL | Telephony Server not Receiving Calls | Start a wireshark trace for SIP using this capture filter : port 5060 or ip[6:2] & 0x1fff != 0 If SIP messages are being received, then the problem might be a firewall rule injection by a domain policy. Prüfe the firewall rules to make sure the required ports are openedSi des messages SIP sont reçus, le problème pourrait être l'injection d'une règle de pare-feu par une politique de domaine. Vérifiez les règles du pare-feu pour vous assurer que les ports requis sont ouverts. |
TEL | Connecteur PBX Connector | Le connecteur téléphonique est lancé et fonctionne ? Des messages sont reçus du Telephony connector started and running? Messages being received from the PBX ? |
TEL | Platform Plate-forme Listener UDP Listener | Vérifiez que l'écouteur UDP de la plate-forme est lancé Le cluster contient-il tous les membres attendus ? Par exemple Prüfe the Platform UDP listener is started Does the cluster contain all expected members? For example:
|
TEL | Disk Space | Espace disque | Utilisez l'explorateur Windows pour vous assurer que le disque n'est pas pleinUse the windows explorer to make sure the disk is not full. |
WEB | Webservers | Serveurs web | Vérifiez chaque serveur web individuellement en utilisantPrüfe each webserver individually using http://<server>:8080/CarrierPortal/sysadmin/login Make sure it is possible to login. Assurez-vous qu'il est possible de se connecter. Vérifiez que le logo est visible (si ce n'est pas le cas, cela indique une erreur de montage du partage de fichiers à Make sure the logo is visible (if not, this indicates a file share mount error to /home/jtel/shared) |
WEB | Certificate | Make sure the certificate is OK by accessing the system via the load-balancer (if necessary, using an alias in your hosts file). This is mandatory, for example, for SalesForce integrations. | Certificat | Vérifiez que le certificat est correct en accédant au système via l'équilibreur de charge (si nécessaire, en utilisant un alias dans votre fichier hosts). Ceci est obligatoire, par exemple, pour les intégrations SalesForce. |
WEB | Compteurs de statistiques | Pour vérifier la santé générale de l'application web et de la base de données, les pages de statistiques suivantes peuvent être utilisées | WEB | Stats Counters | To Prüfe the general health of the web application and database, the following stats pages can be used : http(s)://<load-balancer>/CarrierPortal/pages/common/Stats.xhtml Cache counters (average should be below Compteurs de cache (la moyenne doit être inférieure à 1 ms) :
Page counters (average should be below Compteurs de pages (la moyenne doit être inférieure à 300 ms) :
|
CHAT | Application runningen cours d'exécution | Assurez-vous que l'application de chat est en cours d'exécution Make sure the chat application is running : ps -ef | grep jtel-clientmessenger |
REST | Application runningen cours d'exécution | Assurez-vous que l'application de chat est en cours d'exécution Make sure the chat application is running : ps -ef | grep jrest |