Étiquettes : , , ,

Les métadonnées sont un puissant outil au service de l’accessibilité, de la recherche et de la gestion des ressources sur le Web. A l’heure actuelle, pourtant, moins de la moitié des pages Web contient des métadonnées. Pourquoi un si faible taux ? Parce que les internautes producteurs de contenus ne savent pas ce que sont les métadonnées, ni quelle est leur utilité. Cela vaut bien quelques éclaircissements, non ?

Données servant à définir ou décrire d’autres données, les métadonnées ne posent pas seulement la question du quoi, mais aussi celles du comment, qui (par qui et pour qui), du quand, etc.

A l’heure où le Web devient sémantique, tout rédacteur ou éditeur Web a intérêt à exploiter cet outil précieux et à en rationaliser l’usage au sein de son équipe éditoriale.

Métadonnées et Standards…

Depuis des années, des recherches sont menées pour mettre en place un système qui permettrait d’identifier et de rendre accessibles les titres, mots clés, auteurs des documents, thèmes et rubriques, dates de publication et de mise à jour, etc. des documents Web.

Ainsi, des normes descriptives ont vu le jour, qui permettent d’indexer toutes les ressources stockées sur la Grande Toile. Il existe 2 grands systèmes de standardisation des métadonnées:

Dublin Core

Dublin Core a été créé en 1996. Il permet d’appréhender les métadonnées au sens large, en fonction de 15 éléments de définition d’un document, chacun étant optionnel et pouvant être répété :

  1. Titre : nom donné à la ressource par l’auteur ou le créateur
  2. Auteur ou créateur : personne à l’origine de la création et du contenu intellectuel de la ressource
  3. Sujet et mots clés : thème de la ressource décrite à l’aide de mots clés
  4. Description : description textuelle du contenu de la ressource
  5. Éditeur : responsable de la diffusion de la ressource
  6. Collaborateur : contributeur au contenu de la ressource
  7. Date : date de publication de la ressource
  8. Type de ressource : catégorie de la ressource (page personnelle, thèse, rapport technique,…)
  9. Format : format de la ressource, utilisé pour identifier le type de ressource,…
  10. Identifiant de la ressource : référence non ambiguë de la ressource dans un contexte donné
  11. Source : référence de la source d’où provient le document
  12. Langage : langue du contenu intellectuel de la ressource
  13. Relation : relation de cette ressource avec d’autres ressources
  14. Portée : attributs spatio-temporels de la ressource
  15. Gestion des droits : données sur les droits détenus par la ressource

Resource Description Framework (RDF)

Ensuite, avec la création du langage XML, un autre système de classification est apparu : RDF (Ressource Description Framework).

RDF est très souvent comparé à un cadre prêt à recevoir les métadonnées du Dublin Core, qui permet d’intégrer et d’emboîter (comme des poupées russes) dans l’en-tête d’un fichier, plusieurs normes de métadonnées.

D’où certaines classes de métadonnées apparaissent dans le code source de la page HTML, entre les balises <HEAD> et </HEAD>.
RDF comprend trois éléments de base :

  1. Ressource : Objet présent sur le Web et accessible via à un URI (Uniform Resource Identifier). Ce sera un site Web, une page Web, ou un élément constitutif d’une page Web (image, texte,…)
  2. Propriété : Attributs de la ressources : par exemple, le nom du l’auteur, la date de création, le format,…
  3. Déclaration : Rapport entre la ressource, la propriété et l’objet, faisant apparaître les relations entre les éléments.

La page HTML dont le titre est « Conseil éditorial » (titre), par exemple, créée le 19 février 2007 (création) par Vandermeulen Muriel (auteur) a pour URI :
//www.ecrirepourleWeb/conseileditorial.

RDF a permis de cataloguer de manière descriptive les contenus dans les bases de données en les reliant avec d’autres ressources sur le Web, de faciliter l’échange et le partage des connaissances et de rendre plus fiable et plus simple l’indexation dans les moteurs de recherche.

Métadonnées et recherche

Pour rechercher une information, les moteurs de recherche repèrent les métadonnées. En d’autres mots, l’efficacité de ce passage au crible par les robots dépend directement de la qualité apportée à la rédaction des métadonnées.

Chaque type de contenu doit être caractérisé par des métadonnées précises et pertinentes. Mais, une fois de plus, ces métadonnées ne doivent pas uniquement plaire aux robots. Elles doivent aussi, et avant tout, être adaptées aux référentiel lexical et aux comportements de navigation des cibles de l’annonceur.

A l’heure actuelle, moins de la moitié des pages Web contient des métadonnées. Pourquoi un taux si faible ? Parce que les internautes producteurs de contenus ne savent pas ce que sont les métadonnées, ni quelle est leur utilité. Parce que ceux qui le savent, c’est-à-dire, plus généralement, des contributeurs professionnels, rechignent devant la lourde tâche d’indexer leurs contenus. Parce que ces mêmes contributeurs n’ont reçu aucune formation sur la gestion des métadonnées, n’en possèdent aucunement la culture et n’ont pas davantage reçu d’instructions quant à la gestion de ces métadonnées au sein de l’entreprise.

Or, l’utilisation de métadonnées demande un travail de réflexion, d’analyse et de stratégie ; elle entraîne, nécessairement, des répétitions (chaque page doit contenir ses métadonnées), des erreurs et un travail supplémentaire qui, souvent, est perçu – à tort – comme une perte de temps d’après les contributeurs.

Rédaction Web et indexation

Les ressources digitales ne seront jamais toutes enrichies de métadonnées. Certaines ne le demandent même pas (songeons à certains contenus générés par les utilisateurs).
Mais dans tous les cas, il est de plus en plus critique, au niveau du Web dans son ensemble, ainsi qu’au niveau de chaque annonceur qui édite une ou plusieurs publications en ligne, de rationaliser la production, l’identification et l’archivage des métadonnées pour fluidifier et simplifier la recherche d’information.

L’indexation des contenus a 3 avantages :

  1. elle facilite la recherche de l’information,
  2. elle simplifie le travail collaboratif,
  3. elle formalise et structure la classification des contenus.

En tant que responsable éditorial, rédacteur ou éditeur Web, architecte de l’information ou éditeur conseil, vous êtes étroitement impliqué dans la création d’une taxonomie cohérente, efficace et pertinente pour les contenus dont vous avez la responsabilité, voire la paternité. Car il vous incombe, en effet, de contribuer également à la trouvabilité de ces contenus.

Réveillez l’Aristote qui sommeille en vous

De tout temps, l’homme a su identifier, classer et retrouver les informations pour structurer son environnement. Aristote, déjà, proposait, dans Métaphysique, une classification de l’univers.

Et nous avons tous appris à classer et structurer les informations que nous recevons. Nous rangeons nos papiers dans des classeurs, puis dans des armoires ou sur des étagères particulières ; nous créons, déplaçons, supprimons chaque jour des fichiers et des dossiers dans l’arborescence de notre ordinateur. Le classement, ça nous connaît.

Il ne vous reste plus qu’à appliquer votre talent naturel à l’information numérique, c’est à dire à organiser vos contenus digitaux pour qu’ils soient trouvables. Je consacrerai mon prochain article au sujet : Du bon usage des métadonnées

[page_announcements]


Commentaires

  1. Ping : Rédaction des données grâce au RDF | bertrandkeller

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Devenez chroniqueur

Vous souhaitez devenir chroniqueur ou nous soumettre un article? Rien de plus simple.

Ça m'intéresse

#EPW sur Twitter

#EPW sur Facebook

À propos

Votre blog Écrire pour le web en chiffres
  • Plus de 25.000 sessions par mois
  • Plus de 35.000 pages vue chaque mois
  • 1500 abonnés à la newsletter
  • Créé en 2006
  • 1e position dans Google sur des expressions métier
En savoir plus