Métadonnées et organisation de vos contenus en ligne

Étiquettes : gestion de projet, recherche, stratégie éditoriale, taxonomie

Les métadonnées sont un puissant outil au service de l’accessibilité, de la recherche et de la gestion des ressources sur le Web. A l’heure actuelle, pourtant, moins de la moitié des pages Web contient des métadonnées. Pourquoi un si faible taux ? Parce que les internautes producteurs de contenus ne savent pas ce que sont les métadonnées, ni quelle est leur utilité. Cela vaut bien quelques éclaircissements, non ?

Données servant à définir ou décrire d’autres données, les métadonnées ne posent pas seulement la question du quoi, mais aussi celles du comment, qui (par qui et pour qui), du quand, etc.

A l’heure où le Web devient sémantique, tout rédacteur ou éditeur Web a intérêt à exploiter cet outil précieux et à en rationaliser l’usage au sein de son équipe éditoriale.

Métadonnées et Standards…

Depuis des années, des recherches sont menées pour mettre en place un système qui permettrait d’identifier et de rendre accessibles les titres, mots clés, auteurs des documents, thèmes et rubriques, dates de publication et de mise à jour, etc. des documents Web.

Ainsi, des normes descriptives ont vu le jour, qui permettent d’indexer toutes les ressources stockées sur la Grande Toile. Il existe 2 grands systèmes de standardisation des métadonnées:

Dublin Core
Resource Description Framework (RDF)

Dublin Core

Dublin Core a été créé en 1996. Il permet d’appréhender les métadonnées au sens large, en fonction de 15 éléments de définition d’un document, chacun étant optionnel et pouvant être répété :

Titre : nom donné à la ressource par l’auteur ou le créateur
Auteur ou créateur : personne à l’origine de la création et du contenu intellectuel de la ressource
Sujet et mots clés : thème de la ressource décrite à l’aide de mots clés
Description : description textuelle du contenu de la ressource
Éditeur : responsable de la diffusion de la ressource
Collaborateur : contributeur au contenu de la ressource
Date : date de publication de la ressource
Type de ressource : catégorie de la ressource (page personnelle, thèse, rapport technique,…)
Format : format de la ressource, utilisé pour identifier le type de ressource,…
Identifiant de la ressource : référence non ambiguë de la ressource dans un contexte donné
Source : référence de la source d’où provient le document
Langage : langue du contenu intellectuel de la ressource
Relation : relation de cette ressource avec d’autres ressources
Portée : attributs spatio-temporels de la ressource
Gestion des droits : données sur les droits détenus par la ressource

Resource Description Framework (RDF)

Ensuite, avec la création du langage XML, un autre système de classification est apparu : RDF (Ressource Description Framework).

RDF est très souvent comparé à un cadre prêt à recevoir les métadonnées du Dublin Core, qui permet d’intégrer et d’emboîter (comme des poupées russes) dans l’en-tête d’un fichier, plusieurs normes de métadonnées.

D’où certaines classes de métadonnées apparaissent dans le code source de la page HTML, entre les balises <HEAD> et </HEAD>.
RDF comprend trois éléments de base :

Ressource : Objet présent sur le Web et accessible via à un URI (Uniform Resource Identifier). Ce sera un site Web, une page Web, ou un élément constitutif d’une page Web (image, texte,…)
Propriété : Attributs de la ressources : par exemple, le nom du l’auteur, la date de création, le format,…
Déclaration : Rapport entre la ressource, la propriété et l’objet, faisant apparaître les relations entre les éléments.

La page HTML dont le titre est « Conseil éditorial » (titre), par exemple, créée le 19 février 2007 (création) par Vandermeulen Muriel (auteur) a pour URI :
//www.ecrirepourleWeb/conseileditorial.

RDF a permis de cataloguer de manière descriptive les contenus dans les bases de données en les reliant avec d’autres ressources sur le Web, de faciliter l’échange et le partage des connaissances et de rendre plus fiable et plus simple l’indexation dans les moteurs de recherche.

Métadonnées et recherche

Pour rechercher une information, les moteurs de recherche repèrent les métadonnées. En d’autres mots, l’efficacité de ce passage au crible par les robots dépend directement de la qualité apportée à la rédaction des métadonnées.

Chaque type de contenu doit être caractérisé par des métadonnées précises et pertinentes. Mais, une fois de plus, ces métadonnées ne doivent pas uniquement plaire aux robots. Elles doivent aussi, et avant tout, être adaptées aux référentiel lexical et aux comportements de navigation des cibles de l’annonceur.

A l’heure actuelle, moins de la moitié des pages Web contient des métadonnées. Pourquoi un taux si faible ? Parce que les internautes producteurs de contenus ne savent pas ce que sont les métadonnées, ni quelle est leur utilité. Parce que ceux qui le savent, c’est-à-dire, plus généralement, des contributeurs professionnels, rechignent devant la lourde tâche d’indexer leurs contenus. Parce que ces mêmes contributeurs n’ont reçu aucune formation sur la gestion des métadonnées, n’en possèdent aucunement la culture et n’ont pas davantage reçu d’instructions quant à la gestion de ces métadonnées au sein de l’entreprise.

Or, l’utilisation de métadonnées demande un travail de réflexion, d’analyse et de stratégie ; elle entraîne, nécessairement, des répétitions (chaque page doit contenir ses métadonnées), des erreurs et un travail supplémentaire qui, souvent, est perçu – à tort – comme une perte de temps d’après les contributeurs.

Rédaction Web et indexation

Les ressources digitales ne seront jamais toutes enrichies de métadonnées. Certaines ne le demandent même pas (songeons à certains contenus générés par les utilisateurs).
Mais dans tous les cas, il est de plus en plus critique, au niveau du Web dans son ensemble, ainsi qu’au niveau de chaque annonceur qui édite une ou plusieurs publications en ligne, de rationaliser la production, l’identification et l’archivage des métadonnées pour fluidifier et simplifier la recherche d’information.

L’indexation des contenus a 3 avantages :

elle facilite la recherche de l’information,
elle simplifie le travail collaboratif,
elle formalise et structure la classification des contenus.

En tant que responsable éditorial, rédacteur ou éditeur Web, architecte de l’information ou éditeur conseil, vous êtes étroitement impliqué dans la création d’une taxonomie cohérente, efficace et pertinente pour les contenus dont vous avez la responsabilité, voire la paternité. Car il vous incombe, en effet, de contribuer également à la trouvabilité de ces contenus.

Réveillez l’Aristote qui sommeille en vous

De tout temps, l’homme a su identifier, classer et retrouver les informations pour structurer son environnement. Aristote, déjà, proposait, dans Métaphysique, une classification de l’univers.

Et nous avons tous appris à classer et structurer les informations que nous recevons. Nous rangeons nos papiers dans des classeurs, puis dans des armoires ou sur des étagères particulières ; nous créons, déplaçons, supprimons chaque jour des fichiers et des dossiers dans l’arborescence de notre ordinateur. Le classement, ça nous connaît.

Il ne vous reste plus qu’à appliquer votre talent naturel à l’information numérique, c’est à dire à organiser vos contenus digitaux pour qu’ils soient trouvables. Je consacrerai mon prochain article au sujet : Du bon usage des métadonnées…

[page_announcements]

Par: Muriel Vandermeulen

Rédaction Web & SEO

Fondatrice de @wearethewords. Éditrice de @ellesfontduvelo & @ecrirepourleweb. Marketing & Contenu. <3 les mots, les rituels, le citron et la bicyclette!

Commentaires

Ping : Rédaction des données grâce au RDF | bertrandkeller
Ping : Métadonnées et organisation de vo...

Métadonnées et organisation de vos contenus en ligne

Métadonnées et Standards…

Dublin Core

Resource Description Framework (RDF)

Métadonnées et recherche

Rédaction Web et indexation

Réveillez l’Aristote qui sommeille en vous

Commentaires

Laisser un commentaire Annuler la réponse

Nos dossiers

Devenez chroniqueur

C’est à quel sujet?

#EPW sur Twitter

#EPW sur Facebook

À propos