Page 1 sur 1
HELP ... Domino plante 3 fois par jour ...

Publié:
30 Sep 2010 à 09:29
par adx60
Bonjour,
Donc, je ne suis pas administrateur Domino, tout juste développeur....
Je travail sur un serveur Domino dont voici la config :
- Windows Server 2003 R2.
- Domino Server 7.0.4
- DECS 7.0.4 (lié a un AS400 via ODBC)
- Sametime server
Bien sur, mon job est de développer des application notes sur ce serveur. Depuis quelques temps, nous avons des plantages a répétition...
D'abord, les temps de réponse du serveur Domino ralentisse, puis 2 à 3 minutes après, Domino ne répond plus.
Le serveur Windows ne pose aucun soucis, lui il fonctionne.
La partis sametime fonctionne plus ou moins (délai important, mais on arrive a communiquer)
Dans ce cas, la première solution consiste à redémarrer le services Domino, 1 fois sur 10, cela suffit et Domino repart...
Les 9 autres fois, Windows répond "Impossible d'arrêter le service".
Dans ce cas, redémarrage de Windows indispensable....
Nous avons normalement un administrateur Domino, mais disons que il est généralement au abonné absent... Je n'obtient aucune réponse de sa part, il s'en fous ! D'ailleurs il m'a donné les droits d'administration pour que je me débrouille... Au secoure je sait, mais il ce fait que je suis seul fasse au problème...
Dans les log :
- Event viewer windows : Rien de spécial, tout au plus une erreur quand je tente d'arrêter le service Domino et que Windows me jette...
- Log.nsf : Rien de spécial...
- Log de DECS : Nada
Je ne sait pas ou chercher ? Ou regarder ?
Pourriez-vous essayer de m'aider ? De me donner quelques pistes ? peut-être des fichiers log quelque part me permettant au moins d'avoir une piste ?
Merci d'avance a toutes les bonne âmes ici présente.
A+

Publié:
30 Sep 2010 à 09:41
par Maxime Choucroun
A priori, (vu les indices, il vaut mieux etre prudent...), il semblerait que lorsque Domino plante, des processes de celui-ci sont toujours vivants. C'est pourquoi le redemarrage pose probleme....
Il y a killDomino.exe (jamais essayé pour killer domino qui fonctionne en service).
Ensuite, il faudrait voir aussi quels sont les processes sont vivants et ceux qui sont morts lors d'un plantage....
Ce n'est pas la solution mais un depart de piste..

Publié:
30 Sep 2010 à 09:56
par adx60
Effectivement on fonctionne au indice ici....
En tout cas, merci de cette première réponse.
Deux autres question, pour essayer d'avancer :
Existe-il un moyen de savoir ce qui fonctionne encore, a part le "Lotus Administrator" qui me réponds invariablement "Serveur is not reachable", et ne me donne plus aucune infos ?
Autre piste : Peut-être que le serveur est simplement surchargé ? Existe-t-il un moyen d'alerte lorsqu'un serveur Domino a atteint sa limite ?
Merci et A+

Publié:
30 Sep 2010 à 10:07
par Maxime Choucroun
Peux-tu passer du mode "service" en mode normal (avec affichage de la console).
Je ne sais pas comment il faudrait faire mais cela ne doit pas etre difficile
On peut toujours poser des "questions" à la console.

Publié:
30 Sep 2010 à 11:02
par adx60
Ok, je peut avoir la console en "live" ??? Mais je suis un vrai débutant en administration domino ???
Quel sont les commandes intéressantes ?

Publié:
30 Sep 2010 à 12:13
par SISSI
Slt,
Pour passer le service Domino en mode manuel il faut se connecter au serveur Windows et aller voir dans la liste des services lancés automatiquement.... et mettre manuel...
Les probs peuvent venir de plusieurs choses :
* Le fichier Log.nsf peut être corrompu. Pour le regénérer il suffit d'arrêter Domino (console : Quit) et de renommer en old le fichier log.nsf. Puis relancer Domino depuis le serveur Windows. Le fichier LOG se recréera automatiquement quand le serveur Domino sera relancé. Le fichier log.ntf doit figurer sur le serveur.
* Les mailbox peuvent être corrompus. Idem fichier Log. Mais cette fois il faudra vérifier qu'il ne restait pas des messages dans les mail1.box et mail2.box. le fichier mailbox.ntf doit être présent sur le serveur.
* Des utilisateurs peuvent envoyer des fichiers TRES GROS (plusieurs Mo) et ton serveur ne supporte pas. Dans ce cas surveiller les mail.box du serveur en tant réel pour voir les messages qui transites
* La mail.box est peut-être surchargée de messages (si tu n'as qu'un fichier mail.box)
* La puissance de ton serveur est peut-être insuffisante ?
* Tu as peut-être un prob de disk ?
et puis il y a surement pleins d'autres choses possible, regarde dans l'aide Domino
Bon courage !

Publié:
30 Sep 2010 à 13:46
par Philippe Horlaville
Hello,
Jette aussi un oeil dans le répertoire IBM_TECHNICAL_SUPPORT du répertoire data de Domino.
Regarde si tu as un fichier nsd_.... à la date et heure du plantage.
Tu l'ouvre avec un notepad.exe et tu fais une recherche sur le mot "fatal" :
Ca peut t'indiquer quel process a planté, et, le cas échéant, en regardant un peu plus bas, tu as du code hexadécimal, mais traduit en language 'humain' : tu peux éventuellement découvrir quel fichier nsf ou quel élément (fichier, répertoire...) a pu faire planter le process en question.
Bon courage !

Publié:
30 Sep 2010 à 13:51
par Philippe Horlaville
SISSI a écrit:Slt,
Pour passer le service Domino en mode manuel il faut se connecter au serveur Windows et aller voir dans la liste des services lancés automatiquement.... et mettre manuel...
Les probs peuvent venir de plusieurs choses :
* Le fichier Log.nsf peut être corrompu. Pour le regénérer il suffit d'arrêter Domino (console : Quit) et de renommer en old le fichier log.nsf. Puis relancer Domino depuis le serveur Windows. Le fichier LOG se recréera automatiquement quand le serveur Domino sera relancé. Le fichier log.ntf doit figurer sur le serveur.
* Les mailbox peuvent être corrompus. Idem fichier Log. Mais cette fois il faudra vérifier qu'il ne restait pas des messages dans les mail1.box et mail2.box. le fichier mailbox.ntf doit être présent sur le serveur.
* Des utilisateurs peuvent envoyer des fichiers TRES GROS (plusieurs Mo) et ton serveur ne supporte pas. Dans ce cas surveiller les mail.box du serveur en tant réel pour voir les messages qui transites
* La mail.box est peut-être surchargée de messages (si tu n'as qu'un fichier mail.box)
* La puissance de ton serveur est peut-être insuffisante ?
* Tu as peut-être un prob de disk ?
et puis il y a surement pleins d'autres choses possible, regarde dans l'aide Domino

Bon courage !
Petite précision pour la console 'live' :
Après avoir passé le service en manuel, tu redémarres le serveur, et tu lances le serveur manuellement (Start/All Programs/Lotus Applications/Lotus Domino Server), tu coches "Start as a regular application" et ok.

Publié:
30 Sep 2010 à 15:26
par adx60
Merci à tous...
Plein d'info utile ici ... Je savais qu'il y avait quelques pointure qui trainais sur ce forum...
Donc, j'ai bien trouvé des fichiers nsd_ ...... dans le dossier IBM_TECHNICAL_SUPPORT.... Et voici ce que je trouve dedans :
- Code : Tout sélectionner
############################################################
### thread 6/15: [ StUsers: 155c: 0300]
### FP=0x0fffd6bc, PC=0x7c82860c, SP=0x0fffd64c
### stkbase=0x10000000, total stksize=20480, used stksize=10676
############################################################
[ 1] 0x7c82860c ntdll.KiFastSystemCallRet+0 (5d0,927c0,0,fffdc3c)
[ 2] 0x77e61c8d kernel32.WaitForSingleObject+18 (5d0,927c0,3,fffde58)
@[ 3] 0x601a4804 nnotes.OSRunExternalScript@8+1284 (258,1)
@[ 4] 0x601a4c96 nnotes.FRTerminateWindowsResources+982 (1,0,0,fffe950)
@[ 5] 0x601a504d nnotes.OSFaultCleanupExt@20+877 (1304dc4,0,0,0,0)
@[ 6] 0x601a50a8 nnotes.OSFaultCleanup@12+24 (0,0,0)
@[ 7] 0x601b0872 nnotes.OSNTUnhandledExceptionFilter@4+178 (fffe950)
[ 8] 0x77e761b7 kernel32.RemoveDirectoryA+516 (fffe950,77e61ac1,fffe958,0)
[ 9] 0x77e792a3 kernel32.QueryMemoryResourceNotification+4808 (3d8bb0,959620,0,905a4d)
INFO (0): Generating core dump for [ StUsers: 155c] (coreflags=0, exp=14cc740, dbgver=6.8.0004.0)
INFO (0): Generated core dump file d:\Lotus\Domino\data\IBM_TECHNICAL_SUPPORT\core_StUsers_W32I_SLIDOM06_2010_09_27@14_45_37.dmp
WARNING (0):
Instruction Pointer is NULL!! Will attempt to extract first address from stack context
############################################################
### FATAL THREAD 6/15 [ StUsers: 155c: 0300]
### FP=0x0fffff70, PC=0x00000000, SP=0x0fffed24
### stkbase=10000000, total stksize=20480, used stksize=4828
### EAX=0x01190380, EBX=0x00000001, ECX=0x011903bc, EDX=0x0ffff860
### ESI=0x0096d438, EDI=0x0096dc48, CS=0x0000001b, SS=0x00000023
### DS=0x00000023, ES=0x00000023, FS=0x0000003b, GS=0x00000000 Flags=0x00010202
Exception code: c0000005 (ACCESS_VIOLATION)
############################################################
[ 1] 0x003d7525 StAuthentication.stDdaAuthGetToken+23989 (959620,0,0,959620)
[ 2] 0x77e6482f kernel32.GetModuleHandleA+223 (3d8bb0,959620,0,905a4d)
############################################################
### PASS 2 : FATAL THREAD with STACK FRAMES 6/15 [ StUsers: 155c: 0300]
### FP=0fffff70, PC=00000000, SP=0fffed24
### stkbase=10000000, total stksize=20480, used stksize=4828
Exception code: c0000005 (ACCESS_VIOLATION)
############################################################
Qu'en pensez-vous ??? j'ai l'impression qu'il sagit du process StUsers, et dans ce cas, c'est sametime qui ce vautre ?????
Reste a savoir pourquoi .... Je continue ....
Merci de vos avis ....

Publié:
30 Sep 2010 à 15:44
par Maxime Choucroun
Bon, la, on descendu trop bas...Mais regarde un peu plus haut dans le nsd. Il doit avoir le nom du exe "fautif"
et aussi:

Publié:
30 Sep 2010 à 16:57
par JYR
Ressemble à ceci
LO41842: SAMETIME SERVER CRASH ON STDDAAUTHGETTOKEN
Error description
*
Production ST 8.0.2 crashed multiple times during the day.
Local fix
*
Maintenance ran against vpuserinfo.nsf.

Publié:
04 Oct 2010 à 15:31
par Poulpy
Pour jeter un oeil à la console Domino sur un serveur qui tourne, via la prise de main à distance Windows :
sous XP : mstsc /console
sous Seven : Mstsc /admin
Avec ca, la console est visible dans la prise de main, plus simple que de lancer des commandes un peu bizarre.
Ensuite, si le serveur est planté de chez planté, ou qu'il refuse de s'arreter, on peut via une ligne de commande se positionner dans le répertoire Notes, et taper un joli NSD -kill (attention, ca coupe TOUT).
pour moi, ca fait c:\lotus\domino\notes\nsd -kill en ligne de commande
Après, on peut relancer le serveur, par les services de préférences.
Pour le reste, il existe pas mal d'option de rédémarrage du serveur dans les paramètres de configuration (auto restart / nsd automatique).
Il existe aussi un outil qui analyse le NSD du serveur, en extrait les bonnes infos, et envoi tout ca a IBM sur un incident.
Bon, c'est un vrac, c'est plein de trucs, j'espère que ca va t'aider un peu.
Bon courage,

Publié:
05 Oct 2010 à 08:37
par adx60
Bonjour à tous
Et surtout, merci pour toutes les infos...
Finalement, après avoir beaucoup insisté, j'ai obtenus qu'un administrateur Domino ce penche sur notre soucis...
C'est en cours, j'espère avoir des news bientôt....
Je vous tiendrais au courant, ça peut éventuellement servir a d'autre.
A+