Première panne média ZFS.

A l'occasion d'un scrub régulier (vérification de l'intégrité des données), le système me rapporte des erreurs sur un pool.
Le problème étant qu'il s'agit d'un pool Raidz de 3 disques sans spare. Tout comme avec le Raid 5 je ne peux me permettre la perte que d'un seul disque, il faut donc agir rapidement.

en demandant le statut du pool j'obtiens l'information que c'est le /dev/sdb qui présente des erreurs.
pour autant les infos smart (sudo smartctl -a /dev/sdb) ne rapportent rien de probant. Quoi qu'il en soit je vais procéder au remplacement.

avant de couper le PC, il serait bon d'obtenir le numéro de série de /dev/sdb pour le reconnaitre

ls -l /dev/disk/by-id/ |grep sdb

Je cherche donc un Western Digital WDC20EZRZ-00Z5HB0_WD-WCC4M1JXJXVT.
Une fois le PC coupé, je trouve le disque et en mets un autre à sa place.

redémarrage du PC, zpool status (j'ai oublié la capture d'écran), ZFS signale que le pool est DEGRADED, /dev/sdb missing.
Dans mon cas, ayant remplacé le média au même endroit dans la machine (qui ne possède que 4 ports SATA) j'ai donc remplacé /dev/sdb par ... /dev/sdb
il suffit donc de le signaler à ZFS

zpool replace R5-3x2To /dev/sdb /dev/sdb

Il "suffit" ensuite de surveiller le processus de resilvering, par exemple via

watch -n 300 zpool status -v R5-3x2To

Quelques heures après, le résultat :

Pour les cas plus complexes: https://docs.oracle.com/cd/E19253-01/820-2315/gavwg/index.html