Monitorer son matériel sous Gnu/Linux

Rédigé par citizenz - - 4 commentaires

Dimanche : j'ai tout fait cramer. En ces jours de forte chaleur précoce (un p'tit 36 °C des familles fin mai, c'est pas banal en bourgogne nivernaise ...)
J'ai reçu du nouveau matos hier (!) et je dois bien dire que je suis un peu tendu niveau température du nouveau système que j'essaie de "monitorer" dans tous les sens...

Pour le moment, c'est du grand bonheur en comparaison de mon ancien CPU (AMD Phenom 2 x6). Mon nouveau Intel I5 7500 ne dépasse pas 42 °C en burn (j'ai fait pas mal de tests).
Certainement, le watercooling installé y fait pour beaucoup (Cooler master - Master Liquid 240).
Par exemple, ma carte graphique que j'ai récupéré de mon ancien ordi (MSI GTX 760) montait à 81 °C en "burn". Elle est à 66 °C en burn actuellement.
Le nouveau boitier (Be quiet! Pure base 600) permet une meilleure circulation de la chaleur : ventilo de 140 devant, ventilo de 120 derrière.

Bref ...

Voici les commandes et applis que j'utilise actuellement pour monitorer mon matériel, plus particumièrement la température :

Carte graphique : nvidia-smi
Nvidia-smi (System Management Interface) permet d'afficher pas mal d'infos sur la carte graphique.
J'affiche les infos de ma carte graphique Nvidia en "live" (température, ventilos, etc.) :

watch -n 0,1 nvidia-smi

Cela m'affiche toutes les secondes les infos de nvidia-smi.
En allant fouiller sur le site officiel, vous trouverez plein de commandes à rallonge pour comléter les informations recueillies, du style : 

nvidia-smi -i 0 -q -d MEMORY,UTILIZATION,POWER,CLOCK,COMPUTE
nvidia-smi -q -g 0 -d UTILIZATION -l

CPU : lm-sensors
Pour le CPU (et ses 4 cores), j'utilise le traditionnel lm-sensors qui vous trouverez sur quasiment toutes les distrib.
Sous Debian-like: apt install lm-sensors
Puis lancez : sensors-detect
Vous pouvez quasiment répondre Yes à chaque question ou suivre les recommandations de l'appli (le yes ou le no est en majuscule quand il s'agit de l'option par défaut).

Disque dur : hddtemp
Pour le/les disque(s) dur(s), encore une app bien connue : hddtemp.
Sous Debian-like : apt install hddtemp
Vous lancez hddtemp en lui fournissant simplement l'emplacement du disque à monitorer, par exemple :  hddtemp /dev/sda

Attention toutefois, je n'ai aucun retour d'info pour disque en /dev/sda qui est un SSD (Samsung) :

/dev/sda: Samsung SSD 840 Series :  pas de capteur

Mon disque en /dev/sdb (disque dur "classique") me renvoie quant à lui les bonnes infos :

/dev/sdb: ST31000524AS: 35°C

Disque dur : smartctl
Un peu moins connu (en ce qui me concerne en tout cas), smartctl permet d'afficher des infos détaillées sur les disques.
Sous Debian-like (Ubuntu en l'occurence) : apt install smartmontools
Vous pouvez également installer smart-notifier.

On "active" Smart sur le disque :

sudo smartctl --smart=on --offlineauto=on --saveauto=on /dev/sda

Puis on affiche les infos grace à la commande suivante :

smartctl -a /dev/sda

Voici un extrait des infos (longues !) qui me sont retournées :

smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.8.0-53-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family:     Samsung based SSDs
Device Model:     Samsung SSD 840 Series
Serial Number:    S19HNEAD503664K
LU WWN Device Id: 5 002538 55033ae22
Firmware Version: DXT08B0Q
User Capacity:    120 034 123 776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed May 31 09:46:33 2017 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
...

On peut aussi utiliser des combinaisons d'options comme :

smartctl -d ata -A /dev/sda | grep -i temperature

Ou même afficher des infos sur l'état actuel d'un disque :

smartctl -s on -a /dev/sda

Enfin, n'oubliez pas de lancer le daemon smartd qui n'est pas actiivé par défaut sous Ubuntu.
Éditez le fichier /etc/default/smartmontools et décommenter la ligne :

start_smartd=yes

... puis démarrez le service en tapant :

sudo /etc/init.d/smartmontools start
CitizenZ : Geek quadra nivernais
fan d'ovalie, de musique, de linuxeries et de Net !

À lire également

4 commentaires

#1  - ekyo a dit :

Salut,

Bon article, il est important de monitorer smile
Cependant je pense que tu pourrais optimiser ton installation :

1/ le rad de ton wc 240 installé en front
2/ 2x140 en extraction en top

Avec l'achat d'un 140 puisque tu en as déjà un (une 10€ sur amazon pour un be quiet pure par ex), tu gagneras facilement de précieux degrés...

Répondre
#2  - citizenz7 a dit :

@ekyo : merci... je note ! Ça me fait bricoler quand même un peu et vu comment j'en ai ch.. pour installer mon nouveau matos, je vais attendre un peu ! Je dois pas être doué ! tongue

Répondre
#3  - Shikiryu a dit :

Coucou,

Pile quand j'ai un problème de température élevée de CPU ! Ça tombe pile. Au final, un peu de nettoyage aura suffit mais ça me permet de surveiller au cas où.

Par contre, je ne connaissais pas celui pour NVidia et je suis bien content de pouvoir surveiller ça aussi ! Merci cool

Répondre
#4  - stephane a dit :

perso , je suis sur un i7 6700K , refroidi par un H60 Corsair
et Geforce 970 EVGA, température : CPU 40°C / GPU 40°C / carte mère 30°C
dans un boîtier Corsair 400C ( non conseillé , à cause du câblage à l'arrière )

--> pour BeQuiet 140 uniquement et le silence en plus

Répondre

Fil RSS des commentaires de cet article

Écrire un commentaire

 Se rappeler de moi sur ce site
Quelle est la deuxième lettre du mot he3rm4 ?