Etude du social bookmarking via del.icio.us

Ce récent papier du Information Dynamics Lab de HP propose une analyse des sytèmes de tags collaboratifs, via une étude du site del.icio.us.

Pour rappel, del.icio.us est un service de bookmarks collaboratifs en ligne [1]. Chaque utilisateur enregistré peut y référencer ses propres bookmarks, leur associer un certain nombre de tags (mots-clés), et surtout - d’où la composante sociale - visualiser à la fois:

Cette étude montre que l’utilisation des mots-clés est très différente selon les utilisateurs, puisque certains ont tendance à utiliser un très grand nombre de tags alors que d’autres prèfèrent se concentrer sur un petit echantillon pour indexer leurs données, et qu’à partir d’un certain nombre de bookmarks, certains stagnent dans le nombre de tags utilisés, alors que d’autres continuent à étendre leur échantillon.

L’article revient également sur cette notion de tags vue au niveau des URLs, précisant que la proportion des différents tags pour une URL atteint une limite de stabilité au bout d’un certains nombre d’utilisateurs ayant bookmarké, et donc taggé, cette adresse. Ceci se visualise facilement via Cloudicious - un exemple ici avec les tags associés au blog Outils Froids - et peut s’expliquer par le fait que la majorité des utilisateurs tagguent leurs billets en fonctions des mots-clés déjà posés par les autres utilisateurs.

Un autre point intéressant et sujet à discussion est l’identification des différentes fonctions que jouent les tags associés aux URLs. 7 fonctions sont ici référencées, parmis lesquelles:

  1. definir l’objet principal de l’URL référencée;
  2. définir le type de page (article, blog, ouvrage …);
  3. définir l’auteur de l’URL.

Comme indiqué dans le papier, l’utilisation de tags avec des objectifs différents mais situés au même niveau pour l’utilisateur final peut poser problème. Ainsi, même si les tags de type (2) et (3) peuvent être très pertinents pour le propriétaire des bookmarks, ils sont plutôt déstabilisants pour les autres utilisateurs dans leur recherche d’information. Par exemple, une restriction des bookmarks sur le mot-clé blog peut conduire aussi bien sur des sites sur l’actualité du social software - tag de type (1) - que sur des blogs non-techniques (voire pire, peut-etre vers des skyblogs !) - tag de type (2).

Pour éviter cette ambiguité d’indexation, pourquoi ne pas décrire distinctement le contenant et le contenu ? Une solution pourrait être d’associer à chacune des URL des métadonnées supplémentaires comme le DublinCore, qui propose notamment des champs dc:type (pouvant être prédéfini), et dc:contributor, permettant de laisser libre cours à un sytème de tags vraiment relatif au contenu de l’URL (et éventuellement à un jugement de valeur quand à sa qualité ou autre), mais non plus quand au contenant qui serait régi par ces métadonnées.

Notes

[1] Blogmarks est une alternative française - mais anglophone pour le moment - à ce service, avec une interface utilisateur plus conviviale

Comments

4 Responses to “Etude du social bookmarking via del.icio.us”

  1. vincent on September 2nd, 2005 11:44 am

    Merci pour ce digest (def) très intéressant. je suis abonné dans bloglines au fil RSS du tag wiki et j’ai remarqué que beaucoup de gens tagguent wiki des pages de wikipedia. Le sujet n’est pas le wiki mais c’est le type de site/document.

    Je pense que l’utilisation des tags pourrait évoluer dans le futur vers quelquechose de plus rationnel. Par exemple il m’est arrivé d’utiliser des tags anglais pour des textes en français. Désormais j’essaie d’utiliser des tags français quand l’URL est en français. Pb = les noms propres et mots bilingues (web, internet, wiki, google) qui s’écrivent pareil en français et anglais.

  2. Alex on September 4th, 2005 6:28 pm

    Pour les articles wikipedia, c’est en effet le genre de problèmes que j’évoquais, étant donnée qu’on s’attend généralement à ce que les tags soient relatifs au contenu de la page.

    Pour les tags par langue, c’est une bonne idée pour s’y retrouver. L’autre solution est d’utiliser un tag pour la langue, mais on mélange à nouveau contenu et contenant. Mais idem, avec des métadonnées supplémentaires, on peut spécifier la langue séparément des tags, voire la récupérer directement depuis la page web d’origine.

  3. vincent on September 5th, 2005 9:23 am

    Je crois qu’il faut se garder au maximum de multiplier les types de métadonnées. Dans les applications d’entreprise que nous utilisons actuellement les métadonnées sont en général définies à l’avance. Ca a des avantages et des inconvénients. Je pense qu’à l’avenir il faut plutôt regarder du côté de folksonomies mais en arrivant à gérer la dispersion (si chacun a sa façon de “metadonneiser” une brique de connaissance ça ne va pas). Delicious a trouvé un début de réponse en proposant lors du bookmarking les tags déja utilisé par les autres.

  4. Alex on September 14th, 2005 12:33 pm

    Concernant les métadonnées, certaines pourraient être extraites automatiquement des pages bookmarkées, ou du moins proposées pour validation à l’utilisateur (langue, type de site, licence …). Par exemple, ça permettrait de restreindre sur blogmarks un mot clé uniquement aux pages sous contrat Creative Commons. Par contre, je reste favorable à l’utilisation de folksonomies pour le contenu, mais en réflechissant à une couche supplémentaire (ontologie ?) pour gérer la disparité et les relations entre mots-clés.

Leave a Reply

You must be logged in to post a comment.