« LINUX:Sauvegarde » : différence entre les versions

De WIKI sur Linux (ADB)
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Aucun résumé des modifications
 
(15 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
__FORCETOC__
----
''→ [[LINUX:Menu|retour au menu de Linux]]''
----
=But=
=But=
Dans le contexte de la sécurité, la sauvegarde est une pièce très importante. Elle doit se faire au minimum tout les jours.
Dans le contexte de la sécurité, la sauvegarde est une pièce très importante. Elle doit se faire au minimum tout les jours.
En privé on le fait souvent quand on y pense; les modification entre le moment de la sauvegarde et le moment présent est à risque.
 
Si on n'a pas de sauvegarde, on court le risque de perdre nombre de souvenirs tels les photos de famille, tout le travail d'une vie et pour une société, on risque qu'elle doive arrêter ses activités.
 
Les pertes de données peuvent apparaître dans divers cas: données modifiées ou supprimées par vous par erreur, une cyberattaque, une panne matérielle, un vol, un incendie,... Cette perte peut concerner à minima un fichier impactant une personne ou à l'autre extrémité la totalité des fichiers bloquant toute la société.
 
Nous allons considérer deux parties.
 
* Operating system (OS) et logiciels:
L'OS (système opératoire) (tels Windows, Linux,...) et les logiciels sont toujours récupérables. Si on est bien organisé, un PC peut être réinstallé en une heure, un serveur en une demi-journée. Une sauvegarde totale est souvent très volumineuse et donc prend beaucoup de temps et de place surtout si on a affaire à du matériel mobile dont le temps d'accès pour cette opération est très limité par nature. Une sauvegarde de cette partie, fort espacée n'apporte rien; il faudra réinstaller toutes les mises à jour apparues dans l'intervalle alors qu'une réinstallation par exemple de Linux et de ses logiciels remet tout dans leurs versions les plus récentes. Or un des principes de base de la sécurité contre les cyberattaques est d'avoir un OS et des logiciels munis de leurs derniers patchs.
 
* Données:
Par contre, toutes les informations que vous avez créées (documents, photos, configuration, base de données,...), si elles sont perdues ou falsifiées, elles sont dans la grande majorité des cas perdues. Ce problème est identique pour une société. Les données sont souvent peu volumineuses (à part les films et certaines bases de données) et un traitement rapide incrémentiel est souvent possible. Ce type de sauvegarde peut se faire à distance sans devoir interrompre le travail de l'utilisateur. Mais certains fichiers peuvent être bloqués en accès s'ils sont en cours d'utilisation; c'est le cas par exemple du fichier de données de MS Outlook sous Windows. Des techniques plus complexes sont à mettre en oeuvre. Le plus simple reste de sortir d'MS Outlook lors de la sauvegarde.
 
 
Avant de remettre les données, si le matériel est endommagé, il faut avoir à disposition le nécessaire pour le réparer ou le remplacer.
 
Nous allons passer en revue diverses approches de plus en plus sophistiquées, faciles à mettre en oeuvre dans un cadre privé ou d'une PME avec des solutions gratuites sans faire appel à des sociétés externes dont on n'est pas sûr qu'ils vont respecter vos données. Nous n'aborderons pas l'approche qui consiste à faire ses sauvegardes ou son stockage unique dans des systèmes tiers dans le "cloud".
 
 
=Principe=
Une sauvegarde doit être à même de récupérer les données affectées avec un minimum de pertes. Usuellement ce minimum est en moyenne la demi-journée, c'est à dire de faire une sauvegarde journalière. Il est aussi important de pouvoir remonter dans le temps, c'est à dire de remonter par exemple à une situation d'il y a deux semaines. Habituellement plus on remonte dans le temps, moins c'est crucial. Certains logiciels ne laisse que la possibilité de faire des sauvegardes journalières avec un horizon de X jours, ce qui augmente la taille des sauvegardes.
Historiquement on faisait une sauvegarde journalière pour les 7 jours précédents puis une sauvegarde hebdomadaire pour les 28 jours (mois) précédents. On peut étendre cette approche à une sauvegarde mensuelle durant 12 mois (un an).
 
Les sauvegardes peuvent être totales ou incrémentielles. Dans ce second cas, seules les modifications survenues depuis la sauvegarde précédente son reprises. Lors d'une récupération sur base de sauvegardes incrémentielles, il faut toujours partir d'une sauvegarde totale et ensuite appliquer toutes les sauvegardes incrémentielles survenues par la suite. D'autres techniques existent tel le mirroring qui peut se comparer à une fusion directe d'une sauvegarde incrémentielle à une sauvegarde totale précédente.
 
<!--
=Méthodes complémentaires=
Un facteur important est de minimiser le temps d'indisponibilité à une durée acceptable.
 
Pour diminuer ce risque, on peut mettre en oeuvre d'autres techniques afin d'éviter l'utilisation des sauvegardes. La restauration prend du temps.
 
Au niveau d'une machine, on peut utiliser des techniques comme le RAID qui travaille au niveau du bit (ou plus exactement du bloc) et non du fichier. Sans rentrer dans les détails et toutes ses nombreuses formes, les RAID de base sont la 1 et la 5. Le RAID 1 consiste a dupliquer en  temps réel les données d'un disque dur sur un (ou plusieurs) autre(s). Si un disque tombe en panne, l'autre prend le relai. Dans le cas du RAID 5, on dispose de N+1 disques durs; chaque bit sont répartis alternativement sur chacun des N disques; le dernier sert à recueillir le bit de parité. Ce processus se fait de façon circulaire sur tous les disques. Dans le cas de la panne d'un des N+1 disques, il n'y a pas de perte et le système continue à travailler.
 
A ce stade, il faut remplacer rapidement le disque défaillant. Après le remplacement, on lance, si ce n'est pas automatique, le processus de reconstruction. Pour le RAID 1, les données du disque restant sont recopiée sur le nouveau disque; dans le cas du RAID 5, les données du nouveau disque sont reconstruites sur base des autres disques et du bit de parité.


L'OS (système opératoire) et les logiciels sont toujours récupérables. Si on est bien organisé, un PC peut être réinstallé en une heure, un serveur en une demi-journée. Une sauvegarde totale est souvent très volumineuse et donc prend beaucoup de temps et de place surtout si on a affaire à du matériel mobile.  
On peut étendre ces notions à des disques durs se trouvant sur des machines différentes liés à travers le réseau LAN ou WAN. Par exemple sous Linux, DRBD est un RAID 1 dont chaque disque du doublet du RAID 1 se trouve sur des machines différentes. Une autre approche plus complexe est possible sous Linux avec GLUSTERFS. On couvre toutes les facettes du RAID mais au travers d'une multitude de machines et d'une multitude de disques durs. Ce système est extensible à volonté sans arrêt de l'existant. En outre on couvre les fonctionnalités de failover et de répartition de charge. Les clients qui veulent accéder aux données, ne choisissent pas à quels serveurs de cet ensemble GLUSTERFS ils se connectent.


Si le matériel est endommagé, il faut avoir à disposition le nécessaire pour le réparer ou le remplacer. Il ne faut pas négliger d'avoir une infrastructure au minimum en double travaillant en répartition de charge ou en failover pour le matériel partagé (serveur, router, switch,...), c'est à dire qu'un serveur, un router,... est au minimum en double si on veut minimiser le temps d'indisponibilité. Son double doit être en marche et doit être une image du premier; il doit être identique, (OS, logiciels, fonctionnalités et données) à tout moment à celui qui est opérationnel. Dès que le premier tombe en panne, le second prend la relève dans les quelques secondes qui suivent. Ce n'est pas le sujet de cet article.
Windows a un équivalent du RAID 1 à travers le réseau avec son système DFS mais ce système travaille au niveau fichier. Il faut faire très attention au problème du locking de fichier.


Par contre, toutes les informations que vous avez créées (documents, photos, configuration, base de données,...), si elles sont perdues ou falsifiées, elles sont dans la grande majorité des cas perdues. Ce problème est identique pour une société. Les données sont souvent peu volumineuses (à part les films et certaines bases de données) et un traitement rapide incrémentiel est souvent possible.
L'approche de temps de disponibilité ne doit pas se restreindre aux données, c'est à dire aux disques durs.
Il ne faut pas négliger d'avoir une infrastructure au minimum en double travaillant en répartition de charge ou en failover pour le matériel partagé (serveur, router, switch,...), c'est à dire qu'un serveur, un router,... est au minimum en double si on veut minimiser le temps d'indisponibilité. Son double doit être en marche et doit être une image du premier; il doit être identique du point de vue fonctionnalités, (OS, logiciels, fonctionnalités et données) à tout moment à celui qui est opérationnel. Dès que le premier tombe en panne, le second prend la relève dans les quelques secondes qui suivent.
 
On pourrait aussi aborder les problèmes des coupures de courant et surtensions, de la surchauffe des équipements, du vol,...
 
Ces points évoqués ne concernent pas cet article.
-->
 
 
=[[LINUX:ROBOCOPY|ROBOCOPY sous Windows]]=
Le programme "'''robocopy.exe'''" de Microsoft est disponible sous Windows.  
 
 
=[[LINUX:RSYNC|RSYNC sous Linux]]=
Le programme "'''rsync'''" est disponible sous Linux et plus généralement sous de nombreux Unix. Il est le pendant de "robocopy.exe".
 
 
=[[LINUX:RSYNCD|RSYNCD]]=
Le programme "'''rsync'''" présenté ci-dessus, comprend une version serveur. Il existe principalement sous Linux mais une version sous Windows existe via le portage de Linux sous Windows nommé Cygwin.  
 
=Samba=
Nous avons concentré toutes les sauvegardes les plus récentes dans un répertoire nommé "courant". Grâce à Samba, nous avons créé un partage SMB sur celui-ci. Ceci permet de pouvoir récupérer rapidement et facilement un fichier détruit ou modifié dans la journée avant la dernière sauvegarde. Il est important de mettre ce partage en '''lecture seule'''. Une sauvegarde ne doit pas être modifiée; de plus cette limitation d'accès interdit à un malware de la crypter.
 
Voici un exemple de partage ajouté au fichier "/etc/samba/smb.conf":
----
[sauvegarde]
        comment = Sauvegarde courante
        path=/disk2/sauvegarde/courant
        browseable = no
        '''read only = yes'''
        public = no
        force user = root
        valid users = administrateur, adebast, fbertrand
----


Une sauvegarde doit être à même de récupérer les données affectées avec un minimum de pertes. Usuellement ce minimum est la demi-journée en moyenne, c'est à dire de faire une sauvegarde journalière. Il est aussi important de pouvoir remonter dans le temps, c'est à dire de remonter par exemple à une situation d'il y a deux semaines. Habituellement plus on remonte dans le temps, moins c'est crucial. Certains logiciels ne laisse la possibilité de faire des sauvegardes journalières avec un horizon de X jours.
Historiquement on faisait une sauvegarde journalière pour les 7 jours précédents puis une sauvegarde hebdomadaire pour les 28 jours (mois) précédents.
En privé on le fait souvent quand on y pense; les modification entre le moment de la sauvegarde et le moment présent est à risque.


Les pertes de données peuvent apparaître dans divers cas: données modifiées ou supprimées par vous par erreur, une cyberattaque, une panne matérielle, un vol, un incendie,...
Si vous avez architecturé votre sauvegarde par utilisateur, vous pouvez restreindre cet accès à la partie concernant l'utilisateur. Par exemple si on a deux utilisateurs "adebast" et "fbertrand" et dont respectivement deux répertoires "/disk2/sauvegarde/courant/adebast" et "/disk2/sauvegarde/courant/fbertrand", on peut modifier cette configuration en conséquence:
----
[sauvegarde]
        comment = Sauvegarde courante
        '''path=/disk2/sauvegarde/courant/%S'''
        browseable = no
        '''read only = yes'''
        public = no
        force user = root
        '''valid users = %S'''
----


Nous allons passer en revue diverses approches de plus en plus sophistiquées, faciles à mettre en oeuvre dans un cadre privé ou d'une PME avec des solutions gratuites.


Voyez l'article "[[LINUX:Samba|Samba: serveur de fichiers]]" pour plus d'informations.




=[[LINUX:BackupPC|BackupPC]]=
BackupPC est un logiciel de sauvegarde puissant basé sur une interface WEB. Il est à installer sous Linux mais peut sauvegarder des espaces de fichiers se trouvant sur des machines distantes aussi bien Linux, sur base de "RSYNC, RSYNCD et d'autres, que Windows sur base de SMB et RSYNCD.




Ligne 24 : Ligne 106 :


----
----
''->[[LINUX:Menu|retour au menu de Linux]]''
''&rarr; [[LINUX:Menu|retour au menu de Linux]]''
----
__NOEDITSECTION__
__NOEDITSECTION__
[[Category:LINUX]]
[[Category:LINUX]]

Dernière version du 13 février 2022 à 18:34


retour au menu de Linux


But

Dans le contexte de la sécurité, la sauvegarde est une pièce très importante. Elle doit se faire au minimum tout les jours. En privé on le fait souvent quand on y pense; les modification entre le moment de la sauvegarde et le moment présent est à risque.

Si on n'a pas de sauvegarde, on court le risque de perdre nombre de souvenirs tels les photos de famille, tout le travail d'une vie et pour une société, on risque qu'elle doive arrêter ses activités.

Les pertes de données peuvent apparaître dans divers cas: données modifiées ou supprimées par vous par erreur, une cyberattaque, une panne matérielle, un vol, un incendie,... Cette perte peut concerner à minima un fichier impactant une personne ou à l'autre extrémité la totalité des fichiers bloquant toute la société.

Nous allons considérer deux parties.

  • Operating system (OS) et logiciels:

L'OS (système opératoire) (tels Windows, Linux,...) et les logiciels sont toujours récupérables. Si on est bien organisé, un PC peut être réinstallé en une heure, un serveur en une demi-journée. Une sauvegarde totale est souvent très volumineuse et donc prend beaucoup de temps et de place surtout si on a affaire à du matériel mobile dont le temps d'accès pour cette opération est très limité par nature. Une sauvegarde de cette partie, fort espacée n'apporte rien; il faudra réinstaller toutes les mises à jour apparues dans l'intervalle alors qu'une réinstallation par exemple de Linux et de ses logiciels remet tout dans leurs versions les plus récentes. Or un des principes de base de la sécurité contre les cyberattaques est d'avoir un OS et des logiciels munis de leurs derniers patchs.

  • Données:

Par contre, toutes les informations que vous avez créées (documents, photos, configuration, base de données,...), si elles sont perdues ou falsifiées, elles sont dans la grande majorité des cas perdues. Ce problème est identique pour une société. Les données sont souvent peu volumineuses (à part les films et certaines bases de données) et un traitement rapide incrémentiel est souvent possible. Ce type de sauvegarde peut se faire à distance sans devoir interrompre le travail de l'utilisateur. Mais certains fichiers peuvent être bloqués en accès s'ils sont en cours d'utilisation; c'est le cas par exemple du fichier de données de MS Outlook sous Windows. Des techniques plus complexes sont à mettre en oeuvre. Le plus simple reste de sortir d'MS Outlook lors de la sauvegarde.


Avant de remettre les données, si le matériel est endommagé, il faut avoir à disposition le nécessaire pour le réparer ou le remplacer.

Nous allons passer en revue diverses approches de plus en plus sophistiquées, faciles à mettre en oeuvre dans un cadre privé ou d'une PME avec des solutions gratuites sans faire appel à des sociétés externes dont on n'est pas sûr qu'ils vont respecter vos données. Nous n'aborderons pas l'approche qui consiste à faire ses sauvegardes ou son stockage unique dans des systèmes tiers dans le "cloud".


Principe

Une sauvegarde doit être à même de récupérer les données affectées avec un minimum de pertes. Usuellement ce minimum est en moyenne la demi-journée, c'est à dire de faire une sauvegarde journalière. Il est aussi important de pouvoir remonter dans le temps, c'est à dire de remonter par exemple à une situation d'il y a deux semaines. Habituellement plus on remonte dans le temps, moins c'est crucial. Certains logiciels ne laisse que la possibilité de faire des sauvegardes journalières avec un horizon de X jours, ce qui augmente la taille des sauvegardes. Historiquement on faisait une sauvegarde journalière pour les 7 jours précédents puis une sauvegarde hebdomadaire pour les 28 jours (mois) précédents. On peut étendre cette approche à une sauvegarde mensuelle durant 12 mois (un an).

Les sauvegardes peuvent être totales ou incrémentielles. Dans ce second cas, seules les modifications survenues depuis la sauvegarde précédente son reprises. Lors d'une récupération sur base de sauvegardes incrémentielles, il faut toujours partir d'une sauvegarde totale et ensuite appliquer toutes les sauvegardes incrémentielles survenues par la suite. D'autres techniques existent tel le mirroring qui peut se comparer à une fusion directe d'une sauvegarde incrémentielle à une sauvegarde totale précédente.


ROBOCOPY sous Windows

Le programme "robocopy.exe" de Microsoft est disponible sous Windows.


RSYNC sous Linux

Le programme "rsync" est disponible sous Linux et plus généralement sous de nombreux Unix. Il est le pendant de "robocopy.exe".


RSYNCD

Le programme "rsync" présenté ci-dessus, comprend une version serveur. Il existe principalement sous Linux mais une version sous Windows existe via le portage de Linux sous Windows nommé Cygwin.


Samba

Nous avons concentré toutes les sauvegardes les plus récentes dans un répertoire nommé "courant". Grâce à Samba, nous avons créé un partage SMB sur celui-ci. Ceci permet de pouvoir récupérer rapidement et facilement un fichier détruit ou modifié dans la journée avant la dernière sauvegarde. Il est important de mettre ce partage en lecture seule. Une sauvegarde ne doit pas être modifiée; de plus cette limitation d'accès interdit à un malware de la crypter.

Voici un exemple de partage ajouté au fichier "/etc/samba/smb.conf":


[sauvegarde]
       comment = Sauvegarde courante
       path=/disk2/sauvegarde/courant
       browseable = no
       read only = yes
       public = no
       force user = root
       valid users = administrateur, adebast, fbertrand


Si vous avez architecturé votre sauvegarde par utilisateur, vous pouvez restreindre cet accès à la partie concernant l'utilisateur. Par exemple si on a deux utilisateurs "adebast" et "fbertrand" et dont respectivement deux répertoires "/disk2/sauvegarde/courant/adebast" et "/disk2/sauvegarde/courant/fbertrand", on peut modifier cette configuration en conséquence:


[sauvegarde]
       comment = Sauvegarde courante
       path=/disk2/sauvegarde/courant/%S
       browseable = no
       read only = yes
       public = no
       force user = root
       valid users = %S


Voyez l'article "Samba: serveur de fichiers" pour plus d'informations.


BackupPC

BackupPC est un logiciel de sauvegarde puissant basé sur une interface WEB. Il est à installer sous Linux mais peut sauvegarder des espaces de fichiers se trouvant sur des machines distantes aussi bien Linux, sur base de "RSYNC, RSYNCD et d'autres, que Windows sur base de SMB et RSYNCD.




retour au menu de Linux