[Python-de] Attic Backup

Stefan Schwarzer sschwarzer at sschwarzer.net
Mi Jan 7 21:24:00 CET 2015


On 2015-01-07 07:35, Armin Stroß-Radschinski wrote:
> Am 06.01.2015 um 09:46 schrieb "Thomas Koch" <koch at orbiteam.de>:
> [...] 
> rsnapshot hat eine Weile auch seine Dienste getan. Es
> erzeugt selbst Hardlinks in Backup, failt aber wenn die
> Quelle bereits Hardlinks enthält. Es ist also "doofe"
> Simplifizierung zwischen Backup Generationen aber keine
> echte Deduplizierung.

Das habe ich auch festgestellt, aber es hat mir gereicht.
Offenbar ist es mit den "gängigen" Tools von der Laufzeit
her sehr "teuer", Hardlinks in der Quelle auch im Ziel
genauso abzubilden.

Ich wollte mal eine ganze Platte mir `rsnapshot`-Archiven
auf eine neue Platte kopieren, habe aber nach ca. 24 Stunden
abgebrochen. Das Kopieren hatte ich sowohl mit `rsync` als
auch mit `cp -axl` versucht. Ich kann es mir nur so
erklären, dass die beiden Tools für jeden Hardlink die ganze
Platte scannen, um diese Information nicht für _alle_
Dateien zwischenzuspeichern.

Die `rsync`-Manpage enthält auch einen Hinweis dazu,
allerdings nicht bei der `-H`-Option, sondern bei `-a`:

  -a, --archive
         This  is equivalent to -rlptgoD. It is a quick way of saying you
         want recursion and want to preserve almost everything  (with  -H
         being  a  notable  omission).   The  only exception to the above
         equivalence is when --files-from is specified, in which case  -r
         is not implied.

         Note that -a does not preserve hardlinks, because finding multi‐
         ply-linked files is expensive.  You must separately specify -H.

War eigentlich die eingeschränkte Behandlung von Hardlinks
der Grund, warum du kein `rsnapshot` mehr einsetzt oder gab
es einen anderen Grund beziehungsweise Gründe?

Viele Grüße
Stefan


Mehr Informationen über die Mailingliste python-de