La sauvegarde et l’archivage des données au sein d’une PME

par | 15 Avr 2021

Avant-propos

L’actualité récente liée à l’incendie d’un data center de l’hébergeur OVH à Strasbourg rappelle à tout un chacun que la sauvegarde et l’archivage des données sont essentiels dans une entreprise, quelle que soit sa taille. On peut même les qualifier de « business critical » pour les entreprises dont l’activité repose uniquement sur des données numériques. Une scierie pourra toujours continuer à couper du bois et livrer ses clients en cas de perte de données, là où l’entreprise dont l’activité est exclusivement numérique sera pieds et poings liés dans une situation similaire.

C’est la responsabilité, et même le devoir, d’un chef d’entreprise de s’assurer que ses données fassent l’objet d’une sauvegarde et d’un archivage répondant à ses besoins, ceci afin d’assurer la pérennité de l’activité en cas de problème. J’entends par responsabilité le fait d’être au courant de la solution mise en place, d’en avoir compris les implications, négatives comme positives, qui correspond aux besoins de sa société. La mise en œuvre est du ressort d’un professionnel.

La première question à se poser est : quelle est la valeur de vos données ?
La valeur prise au sens large, c’est le niveau d’importance qu’on accorde à ces données et l’impact business d’une perte partielle et/ou totale. Il faudra calculer le « temps homme » nécessaire à la recréation des données perdues. Ensuite, calculer le coût financier. En toute logique, après ce simple questionnement, on se rend compte rapidement que les données ont plus d’importance qu’il n’y paraît. Ainsi sont jetées les bases d’un PRA (Plan de reprise d’activité) que le chef d’entreprise se doit d’envisager.

Après la plus importante des questions, passons à la distinction entre la sauvegarde et l’archivage. Ensuite nous mettrons l’accent sur les bonnes pratiques pour prévenir la catastrophe et nous évoquerons dans la foulée quelques pistes de solutions non exhaustives.

Sauvegarde et archivage, quelles différences ?

Il convient de distinguer les deux. Bien que ces termes soient synonymes, ils n’ont pas tout à fait la même signification.

La sauvegarde

C’est la « copie » de vos données qui aura lieu sur un support physique dissocié, à priori une 1x par jour après les heures de travail et qui vous permettra de restaurer au quotidien une donnée perdue, effacée, endommagée … Il s’agit d’une « photo » de l’ensemble de vos données de production à l’instant T où elle aura lieu. Cette échelle temporelle vous fera, au pire, perdre une journée de travail puisque vous pourrez remonter un jour en arrière. Le nombre de sauvegardes dépendra évidemment des besoins de chacun, sachant que si vous partez sur 30 sauvegardes et donc sur la possibilité de revenir 30 jours en arrière, vous partez dans la bonne direction.

L’archivage

Si dans ce cas il s’agit aussi d’effectuer une sauvegarde, elle sera ciblée et ces données ne feront plus partie des données de production. La même logique d’exclusion s’appliquera à la sauvegarde. Ceci afin de prévenir un effacement accidentel et contrôler le coût de l’espace disque.

La raison de l’archivage est souvent légale, par exemple l’obligation de conservation de données administratives pendant une période définie. Ou business tels que par exemple la nécessité de conserver des fichiers ou des emails spécifiques, des contrats … pendant une durée contractuelle.

Le cas spécifique du BMR (Bare Metal Restore)

Le système d’exploitation (Windows, Linux …) sur lequel sont hébergées vos données peut dysfonctionner et il conviendra de mettre en place une sauvegarde spécifique qui permettra de restaurer le système d’exploitation ET les données hébergées sur celui-ci. 

Le BMR vise à rétablir le service rapidement suite à une situation catastrophique et non à effectuer une restauration de fichier sur mesure. Vous êtes dans une situation d’urgence, que par métaphore je qualifierais d’incendie qu’il convient d’abord d’éteindre.

J’ai évoqué plus haut le PRA : le BMR pourra vous venir en aide dans pareille situation. Imaginez que par mégarde vous ayez activé un rançongiciel en cliquant sur un lien ou un fichier illégitime. Cette erreur peut enclencher le chiffrement du ou des disque.s. Vos données sont alors inaccessibles. Si seul votre ordinateur est concerné, l’impact est limité. Mais si le rançongiciel a aussi chiffré les données du server de fichiers de la société parce qu’au moment du clic fatidique vous êtes authentifié sur ce server et que pour toutes les (mauvaises ?) raisons du monde vous avez beaucoup de droits en écriture sur celui-ci, toute l’entreprise est alors impactée et n’aura plus accès aux données.

Deux précisions :

  • Il est impératif de déconnecter les appareils utilisés pour la sauvegarde permettant d’effectuer le BMR une fois celle-ci effectuée. Si je reprends l’exemple des rançongiciels, ils ont évolué avec le temps et ceux-ci sont maintenant aussi capables de cibler et chiffrer les sauvegardes. La remarque vaut évidemment aussi pour la sauvegarde des données de production et/ou d’archivage.
  • Les raisons pour lesquelles un système d’exploitation peut dysfonctionner, être corrompu etc … sont multiples et ne se limitent pas aux seuls rançongiciels.

Sur site, dans le cloud ou hybride ?

A tout seigneur, tout honneur : votre site web

Sauf cas particulier, il se trouvera dans le Cloud. Si votre site a été conçu via un CMS WordPress il est facile et peu coûteux de mettre en place sa sauvegarde. Les plugins foisonnent pour automatiser le processus et il est tout aussi simple d’effectuer une sauvegarde manuelle. De plus l’espace disque utilisé à cette fin est dérisoire pour la plupart des sites de PME.

La restauration d’un site web classique basé sur WordPress ou autres CMS (Joomla, Drupal …) doit pouvoir être effectuée dans les 24 heures. Peu importe que ce soit chez le même hébergeur ou non.

Pour les sites de grandes tailles et/ou développés « from scratch » (depuis zéro), cela peut prendre plus de temps, les contraintes techniques ne sont pas les mêmes.

Dans tous les cas, un professionnel qui gère un site web doit informer son client :

  • Qu’un PRA a été mis en place ;
  • Que celui-ci est documenté, ce n’est pas le jour du crash qu’il faut commencer à réfléchir, debugger, ni se demander par où on va commencer ;
  • Que la procédure de restauration fasse l’objet d’une (re)validation régulièrement pour limiter au maximum les mauvaises surprises ;
  • Le temps nécessaire à la restauration.

Bien évidemment tout cela aura un coût. Mais quel est le coût pour les entreprises privées de leur principal outil de travail pendant des semaines ? Sans compter le travail des professionnels qui, et c’est bien logique, surtaxeront leurs prestations en urgence pour remettre votre site web dans son état avant incident ? Et votre image de marque vis-à-vis de vos clients, n’a-t-elle pas aussi un prix ? 

Sur site

La sauvegarde des données de production : le LTO (Linear Tape-Open)

La bande magnétique de type LTO reste encore et toujours un incontournable d’un point de vue du rapport « prix/performance/pérennité ». Pour la sauvegarde de données de production et la restauration au quotidien c’est probablement la solution à envisager.

Gardez à l’esprit qu’à chaque itération de la norme LTO, la capacité de stockage augmentera et vous permettra un retour en arrière de n-1 pour l’écriture et n-2 pour la lecture seule. La lecture seule est suffisante pour restaurer des données.

La dernière génération de lecteur qui doit sortir en 2021 est la dixième. Si l’on prend l’exemple d’un lecteur de la 9è et actuelle génération (LTO-9) il vous est donc possible avec ce lecteur d’écrire et lire une bande LTO-8 et de lire seulement une bande LTO-7. Si vous conservez des bandes LTO-6 ou plus anciennes … vous devrez aussi conserver le lecteur adhoc. Il est plus pertinent à un moment donné de transférer les anciennes bandes sur des nouvelles ceci afin de ne conserver qu’un seul lecteur. Ce lecteur sera sous garantie et si vous voulez vraiment être tranquille vous vous assurerez que votre LTO soit couvert par un contrat d’assistance en cas de panne avec un SLA (Service Level Agreement) spécifique à vos besoins. Comme pour tous les éléments critiques de votre infrastructure d’ailleurs.

Vous prendrez alors soin d’externaliser quotidiennement la bande, ceci afin de prévenir des incidents de la vie courante auxquels nous pouvons être tous confrontés : incendie, dégâts des eaux, vols … Cette tâche sera soit confiée à une personne au sein de l’entreprise soit à une société spécialisée qui sera chargée de récupérer les bandes tous les jours. Elle vous les ramènera aussi de façon à effectuer un cycle de rotation sur base d’une fréquence et d’une durée que vous aurez déterminée.

Afin d’optimiser l’utilisation de l’espace, une sauvegarde incrémentale sera mise en place en prenant soin d’avoir une version complète pour pouvoir réconcilier les deux versions le jour j.

Dans le cloud

Le fait d’avoir des comptes chez un hébergeur, qu’il se nomme OneDrive ou SharePoint (Microsoft), Google Drive, Dropbox … ne constitue pas, en soi, une sauvegarde en bonne et due forme. Certes, vous disposez d’une période de rétention (limitée) qui vous permet de restaurer les fichiers effacés mais cela ne couvre pas tous les scénarios, notamment en matière d’archivage. Pour cela vous devrez recourir aux solutions proposées, par exemple, par Amazon comme S3 Glacier ou S3 Glacier Deep Archive, elles aussi dans le Cloud. Vous prendrez soin de bien choisir votre formule, car en fonction de celle-ci la restauration peut prendre de quelques minutes … à 48 heures pour que les données soient disponibles au téléchargement.  

Les espaces personnels dans le cloud dont je viens de faire mention sont d’abord des espaces de données de production que les utilisateurs peuvent aussi partager avec d’autres. Effectuer une « photo » régulière des fichiers se trouvant dans ces espaces créera un historique de versions dont vous pourrez d’une part gérer la granularité et d’autre part vous donner la possibilité de restaurer un fichier au-delà de la période de rétention si celle par défaut n’est pas suffisante.

Arguments « pour »

Le cloud présente plusieurs arguments de poids dont :

  • L’accessibilité de n’importe où ;
  • La protection face aux désagréments d’endommagement que peuvent subir les sauvegardes locales : inondation, incendie, vols … ;
  • Le coût de stockage limité, du moins s’il s’agit d’archivage.

Arguments « contre »

Les règlementations (RGPD, Lois nationales …) qui entourent le sujet : certaines entreprises, notamment lorsqu’il s’agit de données médicales, doivent être attentives à cet aspect.

La ligne internet étant dans la majorité des cas plus lente que le réseau local, il faudra se poser la question en fonction du volume de données à rapatrier. En effet, la vitesse à laquelle aura lieu une restauration de données pouvant être un critère de choix (ou de non choix) du cloud. Certains secteurs d’activités utilisent des fichiers qui doivent être partagés mais dont les tailles sont gargantuesques. Nous pensons, par exemple, aux bureaux d’architectes ou d’ingénierie civile dont les plans peuvent facilement représenter des gigas, voir des dizaines de gigaoctets. Difficile pour eux de collaborer sur des fichiers en temps réel qui sont hébergés dans le cloud suite au décalage de performance évoqué plus haut. Du coup, la sauvegarde journalière peut elle aussi être gargantuesque et limiter la sauvegarde vers le cloud pour cause de voie montante de votre ligne internet limitée parce qu’asymétrique. Le surcoût de location d’une ligne internet symétrique peut être un frein. Chaque situation doit être analysée au cas par cas.

Placer des données importantes dans les mains d’hébergeurs impose une confiance que tous ne partageront pas. Penser que parce qu’il s’agit de sociétés importantes vous n’aurez jamais de problème est un leurre. L’actualité technologique met en exergue toutes les semaines des failles, des incidents qui montrent que ce n’est pas parce qu’une entreprise possède des moyens financiers importants qu’elle sera exempte de tout reproche. Mon propos n’est pas de jeter l’opprobre sur ces sociétés, rien n’est jamais blanc ou noir … Mais si vous avez des données dans le cloud, pensez à effectuer une sauvegarde régulière. Si vous optez pour la sauvegarde et/ou l’archivage vers une solution cloud (pour vos données elles-mêmes hébergées dans le cloud), assurez-vous qu’elle s’effectue dans un lieu totalement dissocié des données de production. Pour la sauvegarde et/ou l’archivage de vos données cloud en local, ce sera de facto le cas.

Hybride

Probablement la solution idéale en mixant le meilleur de deux mondes. Les sauvegardes s’effectueront en local, par exemple, vers un NAS Synology ou QNAP pour ne citer qu’eux. Ces données feront dans le même temps l’objet d’une sauvegarde vers votre espace de stockage cloud. Vous pouvez aussi rajouter un lecteur de bande LTO pour ceux qui voudraient pousser la logique à son paroxysme etc … Toutes les combinaisons sont possibles, seul le budget fixera la limite.

Et l’indépendant avec son ordinateur ?

Pour lui c’est assez simple. Pour les deux systèmes d’exploitation les plus répandus au niveau professionnel que sont Windows 10 et MacOS, vous avez déjà ce qu’il faut en natif pour effectuer vos sauvegardes sur un disque dur externe ou un NAS.

Pour ce qui est de Windows 10 il est facile de mettre en place une sauvegarde via la fonction « Sauvegarde à l’aide de l’historique de fichiers » et « Vous recherchez une ancienne sauvegarde ? » qui comme son nom ne l’indique pas vous permettra d’effectuer un BMR par le biais de wbadmin, comprenez windows backup admin.

Sur MacOS c’est tout aussi facile, Time Machine est la solution native pour effectuer la sauvegarde et la restauration partielle ou totale de votre ordinateur de Cupertino.

Il est à noter que vous pouvez souscrire un abonnement cloud de type Amazon S3 (il en existe d’autres) pour sauvegarder les fichiers de votre ordinateur personnel dans le cloud. Il vous sera alors nécessaire d’installer un programme spécifique pour effectuer cette tâche, automatiquement ou manuellement, selon ce que vous aurez choisi.

La combinaison d’une sauvegarde locale sur un disque dur externe ainsi que d’un programme qui sauvegarde les données dans le cloud protègera l’ordinateur d’un indépendant de manière satisfaisante.

Ce qu’il faut retenir

Les puristes diront qu’il faut absolument respecter la règle du 3-2-1. Dans un monde idéal je ne peux être que d’accord. Mais au regard des milliers d’entreprises impactées par l’incendie susnommé et qui n’avaient rien pour faire face à un tel événement, la route est encore longue avant d’arriver à ce niveau d’exigence.

Commencer en respectant les règles suivantes est un bon début :

  • Effectuer une sauvegarde de mêmes données sur deux supports distincts ;
  • Elle doit avoir lieu à une fréquence que vous aurez déterminé en fonction de vos besoins ;
  • Cette sauvegarde doit se trouver à un emplacement physiquement différent des données de production pour les raisons déjà mentionnées ;
  • Vous effectuerez régulièrement un test de restauration de vos données ;
  • Toute tâche automatisée nécessite malgré tout une surveillance humaine.

Etant motard, je terminerai par mon allégorie de la moto : la question n’est pas de savoir si la chute va se produire … mais quand. En informatique c’est pareil. Mieux vaut être bien équipé ce jour-là.