Préservation numérique : léguer le savoir | Février 2013


Le futur commence aujourd’hui

Les chances que vous souhaitiez conserver vos biens numériques pour une réutilisation future sont fortement probables. Mais face au vieillissement technologique, préserver les données en vue d’une réutilisation future ne s’improvise pas et ne peut s’envisager qu’en mettant en place des mesures de conservation structurées.

La préservation numérique s’appuie en majeur partie sur trois concepts : la conception, la curation de contenus et la conservation.

 

Concevoir, c’est assurer le futur

La majorité des logiciels et des plateformes web incluent la possibilité d’insérer des informations complémentaires au document comme le titre, une description, des mots clés, une durée de vie, etc. Ces informations, appelées métadonnées, sont cruciales pour permettre l’accessibilité et l’identification ultérieures des données.

En effet, les fonctionnalités de recherche, d’un ordinateur ou d’un intranet par exemple, ne se basent pas uniquement sur le nom sous lequel la donnée est enregistrée pour identifier le contenu que vous recherchez. Plus les métadonnées sont complètes, précises et fournies, plus l’identification ultérieure, via un moteur de recherche par exemple, sera pertinente.

Lors de la conception d’un document, il est également indispensable de définir quand la donnée devra être réévaluée ou supprimée.

Outre les métadonnées et la durée de vie, il est crucial de choisir le bon format de conservation dès la conception des données. Il existe de nombreux formats de conservation mais le plus répandu dans les secteurs publics et privés est le PDF/A d’Adobe.

Ce format de fichier présente en effet l’avantage de conserver l’intégrité d’un document et notamment la mise en page, ceci indépendamment du logiciel qui a servi à créer la donnée numérique. Outre le logiciel de la société Adobe, de nombreux logiciels gratuits comme PDFCreator permettent de concevoir des fichiers dans le format PDF/A.

 

La curation pour créer de la connaissance et de la valeur

Pour que les informations acquièrent de la valeur, elles doivent être disponibles, diffusées et transformées. La curation de contenus est la méthode la plus appropriée pour gérer cet aspect de la préservation numérique.

La curation de contenus peut être effectuée par une personne, à l’aide d’un outil de curation tel que Scoop.it, ou par une communauté grâce à une plateforme collaborative telle qu’Elgg.

Les contenus de sites internet sont éphémères. Ils changent ou disparaissent rapidement. Mais plusieurs possibilités existent pour sauvegarder des ressources issues d’internet.

Si les informations sont limitées, il suffit de sauvegarder la page et de l’exporter en tant que fichier individuel ou de l’intégrer directement dans un document.

Outre PDFCreator, il existe de nombreux outils (addOns) qui peuvent être téléchargés et intégrés directement dans un navigateur internet, tels que Web2PDF pour le navigateur FireFox.

Si la quantité de données est élevée, il est possible de créer une liste d’adresses internet (URL) afin de les exporter dans un document unique.

Les logiciels, comme VeryPDF, qui donnent la possibilité d’exporter et de consolider de multiples sources sont généralement payants. Il existe également des outils gratuits mais ils sont généralement plus difficiles d’installation à l’instar de HTMLDOC.

Dans les deux cas, il est important de saisir les métadonnées principales telles que l’adresse de la source en ligne (URL), le nom du site internet, la description du contenu ainsi que la date à laquelle l’opération a été effectuée.

 

Conserver, c’est assurer l’accessibilité et la réutilisation

La conservation des ressources numériques est bien plus qu’une simple notion de stockage. Elle doit permettre l’accessibilité et la réutilisation des données numériques.

Le choix d’une solution de stockage et d’accessibilité dépend des besoins de chaque entité. Evernote est simple, gratuit et conviendra bien aux petites structures. SAP couplé avec la plateforme d’archivage IXOS est un système plus complexe qui ne pourra être mis en place que dans des entreprises plus grandes.

Quelle que soit la solution retenue, il est important de prendre conscience que des événements imprévus et extérieurs peuvent occasionner des pertes de données irréversibles. Il est donc indispensable de stocker les données numériques à deux emplacements, aussi distant que possible entre eux, pour éviter ce risque.

Pour les grandes entreprises, cette assurance est généralement décrite dans un plan de reprise d’activité (Disaster Recovery Plan en anglais). Pour les plus petites structures, il est fortement recommandé de sauvegarder localement une copie des informations et de les stocker dans des emplacements dématérialisés (Cloud) qui prennent en charge les évolutions technologiques.

Pour ce dernier cas de figure, Evernote est idéal de par ses nombreuses fonctionnalités. Des solutions plus basiques de stockage Cloud, telles que DropBox, peuvent également être envisagées, mais elles seront moins performantes en matière de fonctionnalité et de préservation numérique.

Pour en prolonger la réflexion - nos sources :

Scott Berinato, Kathleen Carr, Daintry Duffy, Michael Goldberg, Sarah Scalet, Business continuity and Disaster Recovery, [en ligne], 2007, http://www.cio.com/article/40287/Business_Continuity_and_Disaster_Recovery_Planning_Definition_and_Solutions?page=1&taxonomyId=3030, [consulté le 3 février 2013] ;

Sergio Brotons, Cécile Guitard, Diane Zivkovic, Nathanaël Zutter, La curation web : remède à l’infobésité, [en ligne], 2012, http://e-sens.ch/dossiers/20122013/1564/15640.html, [consulté le 3 février 2013] ;

CEOS WGISS, Data Lifecycle Models and Concepts, [en ligne], 2011, http://www.ceos.org/images/DSIG/Data%20Lifecycle%20Models%20and%20Concepts%20v13.docx, [consulté le 3 février 2013] ;

Juliana De Beni, Gabriella Piergentili, Pascal Rocha da Silva, Nathalie Valembois, Cloud computing : à chacun son nuage, [en ligne], 2012, http://e-sens.ch/dossiers/20122013/1552/15521.html, [consulté le 3 février 2013] ;

Olaf Drümmer, Alexandra Oettler und Dietrich von Seggern, PDF/A : L’essentiel, [en ligne], 2010, http://www.pdfa.org/publication/pdfa-l%E2%80%99essentiel/?lang=fr, [consulté le 3 février 2013] ;

METS, Standards sur les métadonnées, [en ligne], 2011, http://www.loc.gov/standards/mets/METSOverview.v2_fr.html, [consulté le 3 février 2013] ;


dossier préparé par:


Thierry Boudol, Romano Hotz, Cyrille Lacroix