Outils pour utilisateurs

Outils du site


projets:informatique:sauvegarde_de_pages

Sauvegarde de pages

Le World Wide Web (ou web) est un organisme vivant. Des pages apparaissent tandis que d'autres disparaissent. C'est pourquoi, il peut être utile d'en sauvegarder certaines afin de conserver certaines connaissances ou idées. Il y a quelques temps, j'utilisais l'extension Firefox Scrapbook mais celle-ci n'a pas été mise à jour depuis le passage aux WebExtensions 1). Cette extension permettait de faire une copie locale d'un site. Je me suis dit qu'il fallait aller plus loin et fournir une copie en ligne du contenu.

Étonnament, ça a été plus facile et plus rapide que ce que j'avais anticipé.

Ma première idée fut de me tourner vers des services de conservation du patrimoine numérique. Je connais deux services qui font ce genre de chose :

Ces services fonctionnent très bien, mais il faut que les pages soient indexées et que le service soit pérenne. Je me suis dit que j'allais l'héberger moi même.

J'ai essayé de trouver une extension pour remplacer Scrapbook. Je suis tombé sur les extensions ScrapBee et ScrapbookQ mais je me suis vite arrêté car elles demandent d'installer un module en dehors du navigateur. Je me suis souvenu de l'existence de l'extension Save Page WE qui permet de sauvegarder une page complète en 1 seul fichier HTML. Après tests, il s'avère qu'avec quelques manipulations, je peux faire ce que j'avais imaginé.

Étapes

  1. Ouvrir la console de Firefox (Tools > Web Developer > Inspector ou Ctrl+⇧ Shift+Ctrl),
  2. Supprimer tout ce que l'on ne veut pas conserver dans la copie,
  3. Sauvegarder la page avec l'extension Save Page WE,
  4. Faire une capture d'écran de la page sauvegardée,
  5. Ajouter la page sauvegardée sur mon site.

J'ai du supprimer certains éléments de la page. J'ai pu le faire avec cette commande lancée dans la console.

// Pour supprimer les scripts
document.querySelectorAll('script').forEach(element => element.remove());
 
// Pour supprimer les éléments ayant la classe CSS .xc_pin
document.querySelectorAll('.xc_pin').forEach(element => element.remove());

Regarder si cette extension pourrait fonctionner : SingleFile

1)
Et je pense qu'elle ne le sera jamais.
projets/informatique/sauvegarde_de_pages.txt · Dernière modification : 2021/04/12 05:29 de alexis