Archivage sécurisé P2P


#1

Bonjour,

J’ai une idée qui me trotte comme ca depuis un moment … et pas vraiment le temps de le faire.

Nous avons tous des documents, des photos … bref des trucs numériques que nous ne voulons surtout pas perdre.
On a évidement des sauvegardes … mais que se passerait-il si par exemple la maison brule … et les sauvegardes avec.
De plus, aucun support n’est infaillible et les documents peuvent etre corrompus après quelques années (disk mécanique démagnétisé, les flash ne sont pas garanti après 40 ans, …).

Donc voici mon idée :

  • Un backup multi paires, c’est a dire que je backup une partie des données de mon voisin et il fait de même … le tout bien sur sécurisé
  • les données sont copiés au moins à 3 endroits différents (voir plus)
  • il y a un cron qui passe régulièrement pour calculer les checksum et alerté lors qu’une données est corrompu sur l’un des noeuds …

J’envisage de faire tourné ca sur un SBC comme le BananaPI vu qu’il a un SATA natif performant et qu’il ne consomme rien … mais le trucs doit être portable pour tourné sur n’importe quel Unix (en l’occurence mes sauvegardes actuelles se font sur des PCs linux et NetBSD) mais il est évident que leur consommations empécherait de les faires tourner 24/24.

Qui serait partant ? J’y ai bien réfléchi et j’ai une idée assez précise (mais évidement, il faudra en discuté) … mais entre mes différentes activité, mes devs actuels sur la Domotique et la saison de ski qui ne devrait pas tarder a débuter … je n’ai pas vraiment le temps.

Qui serait donc partant pour des dev collaboratifs ?
Sachant aussi que c’est loin d’etre ma priorité du moment :slight_smile:

A+

Laurent


#2

Salut @destroyedlolo - connais-tu https://syncthing.net/ ?


#3

Je pense que @destroyedlolo imaginait quelque chose de plus “clé en main” et global, dont syncthing pourrait être une brique.

Genre :

Une interface / un site où tu peux te mettre en relation avec des personnes de confiance et qui gère la mise en place et la synchronisation des sauvegardes chiffrées (tronquées entre plusieurs personnes ou non, selon la redondance souhaitée).

ça pose plein de questions sur la vérification de l’identité des personnes, le chiffrement, le transfert mais aussi le quota d’espace mis à disposition par chaque “pair hébergeur de sauvegardes” mais ce serait un beau projet.

(enfin, c’est comme ça que je vois la chose dans mon idéal)


#4

Salut

Le mieux ne serait pas une solution peer-to-peer ?

Les données seraient chiffrées et mises dans une archive qui sera mis à disposition de chaque pair participant.

De là, il faudra gérer une liste de stockeurs. Soit de manière implicite entre les participants; soit de façon automatique. N’est pas déjà le cas avec les logiciels p2p existants ?

Sans oublier l’automatisation des mises à jour. Là aussi, je me demande si cela ne pourrait pas être déjà implémenté dans le logiciel p2p.

avantage : la disponibilité et la réactivité de retour à la source seront fonction du nombre de stockeurs.


#5

@rigelk, je ne connaissant pas syncthing mais je vais regardé de pret leur protocole.

@Gavy, oui, c’est exactement ça.

@PaliPalo : c’est exactement ce que j’avais pensé. Le P2P a l’avantage de permettre les synchro sans passé par le “maitre” donc ca rajoute de la sécurité et économise de la bande passante.
A ce sujet, le P2P permet de limité les débits histoire que les synchros ne pénalisent pas les autres utilisation. On pourrait même imaginer un calendrier pour dire “c’est open bar tous les jours de la semaine de 10h à 17h sinon c’est limité a 30% de la bande passante”.
Par contre, ce qui gène avec le P2P, c’est qu’il faut un tracker ce qui fait donc un spof : dans mon idée, il faudrait que ce soit le “maitre” qui sélectionne les sites de copies et ensuite que tout ce beau monde discutent entre eux sans passer par des intermédiaires.


#6

Je ne suis pas un expert mais je pense qu’ici il parle d’une méthode décentralisée de tracking. Donc, pouf! le spof , j’aimerai dire :slight_smile:


#7

on peut aisément remplacer un tracker par une DHT.


#8

Je pense que Tahoe-LAFS répond à ton besoin.

L’idée pourrait être lancer une grille FramaTahoe…


#9

tu as déjà mis en place Tahoe-LAFS ?


#10

Oui, j’ai participé à une grille de test. Ca fonctionnait bien. Mais pour du backup, il faut de l’espace. Surtout, je crois que par défaut Tahoe-LAFS est configuré pour disposer de 3 copies de tes fichiers (je résume rapidement).

Donc si tu veux sauvegarder 1 Go, tu dois avoir des partenaires qui proposent 3 Go. Et donc en retour, tu devrais leur proposer autant.

Tout est configurable, mais la HA (Haute Availability, haute disponibilité) a un coût.

L’autre avantage avec Tahoe-LAFS, c’est que tout est chiffré. Autrement dit, je sauvegarde mes données chez des partenaires, mais mes partenaires ne peuvent pas lire ce qu’ils sauvegardent. Ce qui est bien la moindre des choses.


#11

Et pour faire un FramaTahoe, ça nécessiterait que Framasoft mette en place de l’espace disque, ou ça serait juste un moyen de mettre en relation les gens mettant à disposition de l’espace disque ?


#12

Framasoft pourrait mettre à disposition de l’espace disque mais le risque serait que tout le monde se mette à utiliser l’espace disque de Framasoft plutôt que de faire du vrai P2P.

Pour vraiment adopter la logique P2P, je pense que Framasoft ne devrait pas mettre à disposition de l’espace disque mais se contenter de fournir un introducer qui sert alors de point d’entrée à la grille Tahoe.

Ca consomme quasiment rien, ni en CPU ni en espace disque. Et Framasoft apporte un introducer et lui - de part le rayonnement de Framasoft - donne la visibilité nécessaire pour qu’un grand nombre de noeuds rejoignent la grille.


#13

Ah je vois. C’est effectivement intéressant. Par contre ça reste un service assez confidentiel (comprendre : l’utilisateur lambda ne saura pas l’utiliser), donc un peu hors contexte des efforts de mise en service de Framasoft.


#14

Autant le sujet discuté m’intéresserait, autant Tahoe m’apparaît comme complètement opaque et incompréhensible.

Je donne ce ressenti car je suis de ces personnes qui essaient de se décentraliser (j’ai un VPS avec Yunohost notamment), mais là on est clairement dans le cas de la solution trop complexe (dans le sens : pas facilement user friendly), même pour les personnes “sensibilisées” aux enjeux du numérique (= le public de Framsoft).