Récupération de données ZFS : guide des configurations RAIDZ1, RAIDZ2, RAIDZ3 et Stripe
Dans cet article, nous passons en revue les procédures de récupération de données à partir d’agrégats RAIDZ1, RAIDZ2, RAIDZ3 et Stripe ZFS créés dans le système d’exploitation TrueNAS SCALE. Nous démontrons la séquence d’actions en cas de défaillance matérielle du serveur et la méthodologie pour restaurer l’accès au pool de données lorsque un ou plusieurs disques tombent en panne ou lorsqu’un dataset est supprimé accidentellement de l’agrégat.

- Fonctionnalités de TrueNAS SCALE
- Méthode 1. Récupération automatique des agrégats ZFS
- Méthode 2. Récupération d’un RAIDZ avec disques manquants
- Méthode 3. Récupération de fichiers supprimés
- Conclusion
- Questions et réponses
- Commentaires
Outre les pannes matérielles, nous traitons la récupération après suppression d’un dataset entier, corruption du pool, défaillance critique du système d’exploitation, endommagement du système de fichiers ZFS, erreurs lors de l’ajout de nouveaux disques, comportement incorrect d’un contrôleur et initialisation accidentelle des disques dans un autre système.
La récupération des données est effectuée sous Linux Ubuntu, mais elle est également possible dans des environnements Windows et macOS.
Récupération de données à partir de matrices RAID SHR-2 et 1 créées sur un NAS Synology DS418play
Fonctionnalités de TrueNAS SCALE
TrueNAS est un système d’exploitation open source pour la construction de stockages en réseau, basé sur Linux et utilisant le système de fichiers ZFS. Il fournit la protection des données, la vérification de l’intégrité, une gestion efficace des disques et prend en charge l’exécution de machines virtuelles.
La plateforme prend en charge divers types de RAID, notamment RAIDZ, qui combine performances et tolérance aux pannes. TrueNAS SCALE permet une mise à l’échelle horizontale en combinant plusieurs nœuds dans un cluster tout en préservant les fonctionnalités clés de ZFS : auto-réparation, snapshots, compression, déduplication et chiffrement.

Le système est compatible avec les protocoles SMB, NFS, iSCSI et S3 et permet également l’exécution de conteneurs et de Kubernetes, ce qui en fait une solution polyvalente pour le stockage et le traitement des données dans divers environnements.
RAIDZ est un ensemble de disques redondant dans ZFS avec parité distribuée. L’utilisation de blocs de longueur variable optimise les écritures et permet la correction automatique des erreurs lors des lectures.
Lors de la reconstruction d’un ensemble dégradé (resilvering), la charge sur les disques restants augmente significativement. Par conséquent, le RAIDZ est mieux adapté aux environnements ayant des exigences modérées en matière de tolérance aux pannes ou pour des disques de petite capacité où le temps de reconstruction de l’ensemble est minimal.
| Catégorie | Capacités |
|---|---|
| Type de système | NAS / serveur open-source basé sur Linux |
| Système de fichiers | Prise en charge de ZFS |
| RAID | RAIDZ1, RAIDZ2, RAIDZ3, Stripe, Miroir |
| Mise à l’échelle | Horizontale (Scale-out) |
| Virtualisation | Prise en charge KVM (machines virtuelles) |
| Conteneurs | Kubernetes, Docker (via Apps) |
| Protocoles réseau | SMB, NFS, FTP, iSCSI |
| Gestion | Interface web (GUI) |
| Sécurité | Chiffrement des données, contrôle d’accès, ACL |
| Sauvegarde | Snapshots, Réplication, Rsync |
| Services cloud | Intégration avec AWS, Google Cloud, Azure |
| Supervision | Alertes, journaux, statistiques |
| Plugins / Apps | Extensibilité via catalogue d’applications |
| Haute disponibilité | Prise en charge du cluster (HA) |
| Prise en charge GPU | Oui (pour conteneurs et VMs) |
Méthode 1. Récupération automatique des agrégats ZFS
En cas de défaillance des composants matériels du serveur (alimentation, carte mère ou contrôleur de disques), l’accès direct aux données depuis le système d’exploitation devient impossible.
De telles situations surviennent également lorsque le serveur n’amorce plus en raison d’une erreur critique pendant une mise à jour de TrueNAS SCALE ou lorsque la partition système est endommagée.
Même si les fichiers et les disques ne sont pas endommagés physiquement, l’accès à un agrégat RAIDZ peut être perdu et les outils standard de ZFS peuvent ne pas détecter les disques ni permettre l’import du pool. Dans ces cas, des logiciels spécialisés, tels que Hetman RAID Recovery, permettent un accès sécurisé aux données et la récupération des informations.
Dans cet exemple, nous démontrons le processus de récupération automatisée sur un poste exécutant Ubuntu.
Éteignez d’abord le serveur et retirez soigneusement tous les disques qui faisaient partie de l’agrégat.

Connectez-les à une station de travail : l’option optimale est directement à la carte mère via des câbles SATA pour une vitesse maximale et une stabilité du transfert de données. Si la carte mère ne dispose pas de ports libres, des stations d’accueil USB externes ou des adaptateurs USB-vers-disque peuvent être utilisés.

Notez que lorsqu’ils sont connectés via des stations d’accueil, la vitesse de balayage peut être inférieure ; pour de gros volumes de données il est donc préférable d’utiliser des ports internes.
Après la connexion, vérifiez que les disques apparaissent sous Ubuntu dans l’utilitaire Disques, mais ne les initialisez pas si le système propose cette action.

Immédiatement après vérification, lancez Hetman RAID Recovery pour effectuer l’assemblage automatique de l’agrégat.
La caractéristique principale de Hetman RAID Recovery est l’analyse approfondie des métadonnées ZFS. Le logiciel ne nécessite pas un système d’exploitation ou un contrôleur fonctionnel — il lit les informations de service directement depuis les disques et reconstruit automatiquement la structure du pool.
Étant donné que ZFS stocke toutes les données de configuration critiques de l’agrégat à l’intérieur du pool lui‑même, l’intégrité logique des fichiers est préservée même si l’environnement serveur est complètement indisponible. Par conséquent, l’utilisateur obtient un accès aux données sous une forme familière sans dépendre du système d’origine.
Cet article illustre plusieurs configurations d’agrégats :
- RAIDZ1 sur trois disques,
- RAIDZ2 sur quatre,
- RAIDZ3 sur cinq,
- et Stripe sur deux disques.

Nous examinerons en détail l’algorithme de récupération pour un agrégat RAIDZ1 à trois disques dans une situation de défaillance matérielle complète du serveur ou d’erreur critique après une mise à jour de TrueNAS SCALE.
Il est important de noter que cette approche est universelle et peut également être appliquée aux configurations RAIDZ2, RAIDZ3 et Stripe.
Après le lancement de Hetman RAID Recovery, celui-ci scanne automatiquement tous les périphériques connectés. Le programme lit les métadonnées de service ZFS, analyse la configuration des groupes vdev virtuels et, sur la base des données obtenues, reconstruit le modèle RAIDZ1 correct.
La fenêtre de travail affiche les disques détectés et les structures logiques assemblées — vous pouvez continuer immédiatement : effectuer une analyse détaillée, consulter la structure des données ou récupérer les fichiers requis.

Sélectionnez le RAIDZ1 requis dans la liste des agrégats reconstruits et lancez le mode Analyse rapide.

Après la fin de l’analyse, le système de fichiers récupéré avec la hiérarchie complète des répertoires et fichiers s’affichera dans la fenêtre principale. Sélectionnez les objets requis et cliquez sur Récupération.

À l’étape suivante, indiquez un dossier pour enregistrer les données — de préférence sur un support distinct disposant d’un espace libre suffisant.

Méthode 2. Récupération d’un RAIDZ avec disques manquants
Examinons maintenant le cas d’une ou plusieurs pannes de disques dans un agrégat RAIDZ.
L’architecture RAIDZ offre une tolérance aux pannes en fonction du type d’agrégat :
- RAIDZ1 tolère la perte d’un disque.
- RAIDZ2 tolère la perte de deux disques.
- RAIDZ3 tolère la perte de trois disques.
Dans le cas du Stripe, il n’y a pas de redondance, donc la panne de n’importe quel disque entraîne une perte complète des données.

S’il n’est pas possible de connecter tous les disques, vous pouvez créer une image du disque manquant et l’utiliser conjointement avec les autres disques pour la récupération.
Grâce aux mécanismes de parité distribuée et aux contrôles d’intégrité des données, des logiciels spécialisés tels que Hetman RAID Recovery peuvent reconstruire les blocs perdus et restaurer l’accès à l’information si le nombre de disques défaillants n’excède pas le seuil admissible pour le type de RAIDZ en question.
Si ce seuil est dépassé, la structure logique de l’agrégat est perturbée et les méthodes logicielles standard deviennent inefficaces. Dans de telles situations, la récupération n’est possible qu’à l’aide d’équipements professionnels dans des laboratoires spécialisés.
Assurez-vous que le support de destination dispose d’un espace libre suffisant pour stocker les données récupérées et retirez soigneusement les disques du serveur avant de les connecter à un ordinateur via des ports SATA ou une station d’accueil externe. Il est important d’éviter toute écriture sur ces disques, car cela pourrait entraîner une perte de données irréversible.

Avant de commencer, fermez toutes les applications susceptibles d’utiliser ces disques et désactivez temporairement les sauvegardes automatiques ou la synchronisation. Si le système ne monte pas l’agrégat, n’initialisez pas les disques, ne créez pas de partitions et ne les formatez pas.
Laissez-les dans leur état actuel et procédez directement à la procédure de récupération. Le respect de ces recommandations augmente considérablement les chances d’un rétablissement des données réussi et sécurisé, quel que soit le type de RAIDZ ou la configuration Stripe.
Si l’architecture de votre poste de travail ne permet pas de connecter simultanément tous les disques, la solution optimale consiste à utiliser des images de disque virtuelles. Cette méthode consiste à créer des copies bit à bit exactes de chaque disque pour une analyse ultérieure.
Après montage de l’image du disque manquant, Hetman RAID Recovery la considérera comme un périphérique physique complet et, combinée aux disques disponibles, reconstruira automatiquement la structure de l’agrégat. Cette approche permet de lancer la récupération des données même lorsque les ports de connexion sont insuffisants — en préservant la sécurité et l’intégrité des données à chaque étape.
Nous examinerons le processus de récupération à l’aide d’un exemple de RAIDZ3, dans lequel trois disques tombent en panne simultanément.
Cette configuration d’agrégat offre la possibilité de restaurer les données même en cas de panne aussi sévère — nous effectuons cette opération avec Hetman RAID Recovery.
Immédiatement après l’ouverture, le logiciel scanne automatiquement tous les disques connectés, lit les informations de service et, sur cette base, reconstruit la structure d’origine de l’agrégat. La fenêtre de travail affiche tous les disques physiques détectés et les configurations virtuelles formées, qui peuvent être utilisées immédiatement. Sélectionnez le RAIDZ3 détecté et activez l’option Analyse rapide.

Dès que la vérification est terminée, la fenêtre de travail affichera la structure complète de l’agrégat reconstruit avec tous les répertoires et fichiers.

Cochez les éléments requis et cliquez sur Récupération. Puis indiquez le dossier de sauvegarde et confirmez l’opération en cliquant de nouveau sur Récupération.

Méthode 3. Récupération de fichiers supprimés
Enfin, nous considérons l’un des scénarios les plus courants — la suppression accidentelle de fichiers d’un agrégat RAID.
Dans cet exemple, nous récupérons des données d’un Stripe créé à partir de deux disques sous le système de fichiers ZFS.
La caractéristique du Stripe est que les données sont réparties sur tous les disques sans aucune redondance. Cela signifie qu’aucun disque individuel ne contient des fichiers complets. Pour une récupération réussie, tous les disques doivent être connectés simultanément et traités comme une seule structure logique. Si l’un des disques est manquant ou non connecté, le logiciel ne pourra pas lire les données.

Avant de commencer, assurez-vous que tous les disques sont physiquement connectés à l’ordinateur — directement via SATA à la carte mère ou en utilisant une station d’accueil externe.
Il est important de ne pas écrire de nouvelles données sur ces disques ni de les initialiser dans le système afin d’éviter l’écrasement des fichiers perdus.

Sous Ubuntu, lancez Hetman RAID Recovery.
Le logiciel analysera automatiquement tous les disques connectés, lira les métadonnées ZFS et reconstruira en conséquence la structure logique du Stripe. Dans la fenêtre principale, vous verrez les disques physiques et l’agrégat assemblé prêt à l’emploi.

Sélectionnez ensuite le Stripe dans la liste des agrégats détectés et lancez une Analyse complète. Une analyse complète est nécessaire car, après la suppression de fichiers sous ZFS, seule une analyse approfondie permet d’assembler les données fragmentées et de restaurer la structure correcte des dossiers.

Les réglages supplémentaires ne sont généralement pas nécessaires ; cliquez simplement sur Suivant et attendez la fin du processus. Après la fin de l’analyse, la fenêtre principale affichera la structure de l’agrégat récupéré avec tous les dossiers et fichiers. Si nécessaire, utilisez l’aperçu pour vérifier le contenu des documents, images ou autres fichiers.
Sélectionnez les fichiers et dossiers requis et cliquez sur Récupération.

Indiquez la destination pour les données récupérées sur un support distinct disposant d’un espace libre suffisant et confirmez le démarrage du processus en cliquant de nouveau sur Récupération.
Après la copie, cliquez sur Terminer.

En conséquence, tous les fichiers seront récupérés et disponibles pour une utilisation normale.
Ce processus garantit la sécurité des données, permet la restauration de fichiers même après une suppression accidentelle et préserve la structure du système de fichiers ZFS sans risquer d’endommager d’autres données sur les disques.
Conclusion
La récupération de données depuis le système de fichiers ZFS et les agrégats RAIDZ1, RAIDZ2, RAIDZ3 et Stripe est complexe mais tout à fait réalisable avec la bonne approche et une compréhension de l’architecture de ces solutions. Grâce aux mécanismes intégrés d’intégrité et de contrôle d’erreurs, ZFS offre un niveau élevé de protection, en particulier dans les configurations RAIDZ2 et RAIDZ3.
Toutefois, même ces systèmes fiables ne sont pas à l’abri d’une perte de données due à des pannes matérielles, des erreurs utilisateur ou une corruption critique du pool. La configuration la moins protégée reste le Stripe, où l’absence de redondance entraîne une perte complète des données en cas de défaillance d’un disque.
Le succès de la récupération dépend de nombreux facteurs : type de RAID, nombre de disques défaillants, état du système de fichiers et rapidité d’intervention. Les recommandations clés sont d’arrêter immédiatement les écritures sur l’agrégat affecté, d’effectuer un diagnostic correct et d’utiliser des logiciels spécialisés ou des services professionnels.
Ainsi, pour minimiser le risque de perte de données, il est important non seulement de savoir comment récupérer les données, mais aussi de mettre en place des stratégies de sauvegarde à l’avance et de choisir le niveau de RAID approprié en fonction de la criticité de l’information.





