depuis hier soir ma machine subit des crashs très réguliers lors des sessions de jeux vidéos, le problème est survenu de façon très soudaine après plusieurs heures de jeu. Les symptômes sont les suivants :
Freeze complet de la machine, absolument plus rien ne répond, les écrans affichent toujours mais l'image est totalement figée (pas uniquement le jeu, les autres écrans se figent également)
Obligation de faire un hard shutdown de la machine en restant appuyé sur le bouton power
Le son crash également, produisant un bruit similaire à ceci en continu
J'ai tenté de définir les conditions de ces crashs, jusqu'ici ils sont tous survenus pendant l'utilisation de jeux-vidéo; 4 hier soir en l'espace de 2h sur le jeu TemTem que je n'ai plus relancé depuis, ainsi qu'un autre aujourd'hui au lancement du jeu ARK: Survival Evolved. Cependant ces crashs restent assez aléatoire puisqu'ils semblent pouvoir survenir dès le lancement ou jusqu'après plus de 45 minutes de jeu. Je précise également que je n'ai effectué aucun changement hardware ni aucune mise à jour système/pilote depuis plusieurs semaines, au cours desquelles j'ai joué de nombreuses heures (dont une vingtaine sur TemTem) sans soucis. Le PC reste allumé en permanence, en dehors de ces crashs il a donc tourné toute la nuit/journée avec une utilisation plus modeste et n'a rencontré aucun soucis.
Coté config :
* OS: Windows 10 x64
* MB: Asus Rampage IV BE
* CPU: i7-3930K@4.1Ghz (turbo mode)
* GPU: RTX 2060 Super (achetée en Novembre 2019)
* RAM: 16GB DDR3
* Stockage: 3x SSD Samsung Evo 250GB
* Alim: Seasonic X Series Modulaire - 1250W, norme 80+ Gold
A l'exception du GPU l'ensemble de la configuration a 6 ans (de mémoire), mais n'a jamais présentée de problème jusqu'ici.
J'ai d'ores et déjà effectué quelques tests :
Contrôle des températures via HWMonitor / OCCT, tout semble correct (30 à 60°C dans l'ensemble selon la charge) à l'exception notable des sondes tmpin4/5/6 qui affichent des valeurs fluctuants entre 95 et 100°C, c'est plutôt inquiétant mais je doute très franchement que ça soit pertinent, j'ai tout de même tenté un contrôle "tactile" à plusieurs endroits de la MB et je n'ai rien remarqué d'alarmant
Tests de charge GPU/CPU sur OCCT pour tester l'alim, aucune erreur ni crash mais je n'ai pas encore pris le temps de le laisser tourner plus de 20 minutes
Contrôle de l'observateur d’événements, qui ne m'indique rien d'intéressant dans ce type de cas si ce n'est que le dernier redémarrage n'était pas prévu
Mise à jour des pilotes graphique via NVIDIA Experience
Retrait de tous les périphériques USB non essentiels (clé, DD externe, chargeur, manette[...])
Voilà où j'en suis actuellement et malheureusement je ne dispose pas de pièces de rab pour essayer de procéder par élimination. Au vu des symptômes quelle piste privilégieriez-vous ? Y a t-il des tests/mesures qui pourraient me permettre de diagnostiquer précisément l'origine du problème ? Et dans ce genre de cas, y a t-il encore une chance que ce ne soit qu'un problème software ?
Le coup de certaines sonde qui annoncent des températures à 100°C n'ai pas a prendre à la légère. C'est peut être effectivement du faux positif mais si c'est quand même pris en compte par le système il se met lui même en protection.
En plus de ce qui est indiqué et au lieu de OCCT ou en plus d'OCCT, tu devrais lancer "un superposition gratuit" en plusieurs modes (720 p, 1080p, 1080p medium puis extrême et enfin 4 k) les uns après les autres. Tu regardes ce que ça donne niveau températures et si ça plante ou pas.