Erreurs volontaires avec ZED

Le système de fichier ZFS est fiable, rapide, et intègre la totalité des concepts connus lors de sa création. Conçu à l’origine pour Solaris, il fonctionne depuis des années sur Linux et BSD.

Tout système informatique doit être sous surveillance constante. Une part importante de cette tâche est gérée par le monitoring.
La surveillance du bon état de ZFS peut se faire de multiples manières. Une des plus simples et fiables est d’utiliser ZED (ZFS Event Daemon) comme source principale, assisté de quelques scripts maison pour affiner selon les situations.

Il manquait à ZED un détail bien pratique : la possibilité de générer une erreur de test afin de s’assurer que tout fonctionne bien.
Cela permet de valider toute la chaîne de monitoring, d’alerte, d’actions automatiques, etc, sans avoir à provoquer une vraie panne du système de fichiers.

Nous avons ouvert un ticket à ce sujet il y a 6 jours, et l’équipe de développement de ZED vient de mettre le nécessaire en place hier. Seulement 5  jours pour pousser en production cette petite demande de fonctionnalité, vous êtes des chefs !