Ecrire facilement des screen scrapers pour Piggy Bank
Le projet SIMILE vient de mettre à disposition Solvent, une extension Firefox permettant de créer simplement des screen scrapers pour Piggy Bank. Ce screencast pour mieux comprendre.
Blogs, FOAF et gravatars
Les gravatars[1], ce sont ces petites images que vous pouvez voir sur certains blogs pour identifier visuellement les personnes qui commentent des billets.
Ce service est proposé par Gravatar.com, qui a tendance à tomber facilement en rade ces derniers temps, notamment puisque chaque affichage d’une image correspond à une requête sur le serveur.
D’ou la question “Pourquoi ne pas décentraliser ce service et proposer à chacun d’héberger son avatar ?”
A supposer que tout les posseurs d’avatars puissent héberger leur image (site personnel, imageshack …), il faut ensuite trouver un moyen d’associer à chacun l’URL de la dite image.
Et c’est la que FOAF intervient ! En effet, une solution peut être d’utiliser son profil FOAF pour spécifier l’emplacement de son avatar. Pour faire simple, FOAF est un vocabulaire RDF axé sur les individus et les relations qu’ils entretiennent entre eux. On peut ainsi y décrire son nom, ses centres d’intêret … le tout dans un formalisme bien défini, dans l’esprit du Web Sémantique. Certaines applications comme foaf-a-matic permettent de créer simplement un premier profil.
Donc, pour en revenir à notre avatar, l’idée est de définir un vocabulaire gravatar, avec une propriété gravatar:gravatarImage, sous classe de foaf:depiction ou de foaf:img - avec une préférence pour la première, qui permet de bénéficier de la propriété inverse foaf:depicts - , afin d’écrire ce genre de choses (la partie descriptive associée au vocabulaire DublinCore étant optionnelle):
<gravatar:gravatarImage> <Image rdf:about="http://my.website/gravatar.png"> <dc:title>Alex gravatar</dc:title> <dc:description>Alex gravatar for weblogs comments</dc:description> <dc:format>image/png</dc:format> </Image> </gravatar:gravatarImage>
On pourrait par la même occasion s’identifier sur les blogs non plus par le classique {Nom, E-mail, URL}, mais simplement en indiquant l’URL de son profil.
Nouveau “problème”, puisqu’il n’y a pas de contraintes de cardinalité sur les propriétés d’un profil FOAF (ces contraintes sont proposées seulement au niveau OWL), quel nom, e-mail et URL choisir lorsqu’un utilisateur en a indiqué plusieurs ? On pourrait imaginer prendre le premier, mais ça n’est pas forcément celui que l’utilisateur souhaite afficher lorsqu’il bloggue (spam …).
En conséquence, plutot qu’un vocabulaire gravatar, pourquoi pas un vocabulaire blogging, permettant d’écrire quelque chose comme ça ?
<blogging:name>Alex</blogging:name> <blogging:email>alex@NOSPAM.passant.org</blogging:email> <blogging:homepage rdf:resource="http://apassant.net" /> <blogging:gravatarImage> <Image rdf:about="http://my.website/gravatar.png"> <dc:title>Alex gravatar</dc:title> <dc:description>Alex gravatar for weblogs comments</dc:description> <dc:format>image/png</dc:format> </Image> </blogging:gravatarImage>
Les weblogs s’occupant ensuite de parser le fichier lors de la soumission d’un commentaire pour afficher les infos indiquées par le propriétaire du profil.
Notes
[1] globally recognised Avatar
RDF, FOAF et PHP
RAP est une API PHP permettant de manipuler simplement un modèle RDF. En plus de RDF, RDFS et OWL, plusieurs vocabulaires sont référencés, dont FOAF, DublinCore ou encore vCard.
J’ai codé une couche supplémentaire permettant d’obtenir facilement des informations depuis un fichier FOAF. J’y reviendrai prochainement, le temps de nettoyer un peu le code.
Flock (ou pas) ?
J’ai testé brièvement Flock, le nouveau "navigateur social" basé sur Mozilla.
Un des ses atouts est l’intégration dans l’interface de différents services comme Flickr, del.ico.us (pour le moment) et certains outils de blogs. En gros, ce qui se fait déjà avec les bookmarklets, mais cette fois en utilisant directement son navigateur. Rien de vraiment nouveau, surtout que j’ai tendance à préférer les bookmarklets, par exemple pour ajouter des métadonnées à mes billets Dotclear. L’agrégateur RSS est également assez semblable à celui de Safari.
Bon, ceci dit, il y a quand meme quelques trucs sympas, comme le formulaire de recherche contextuel qui affiche les favoris et l’historique correspondante avec un aspect Spotlight, et la possibilité de tagger les bookmarks même en local.
Bref, ça n’est qu’une Beta, mais pas de quoi me faire décrocher de Firefox pour l’instant (d’autant plus que certaines extensions ne passent pas, notamment Greasemonkey)
Tags: firefox, flock, navigateur, socialsoftware
Introduction au Web Sémantique
Un article d’introduction au Web Sémantique, The future of the Web is Semantic, présentant les notions d’URI et les différents langages de représentation de resources sur le Web (RDF, RDFS et OWL).
IBM developerWorks propose par ailleurs de nombreux fils RSS de ces articles.
Géolocalisation collaborative de groupes
Après avoir testé Frapper Beta, j’ai jeté un oeil à MapBuilder (Beta aussi, c’est la mode on dirait), deux outils reposant sur les Google Maps.
Même si MapBuilder propose des fonctionnalités plus sympas (code pour l’export sur son site, fils RSS …), je n’arrive pas à trouver dans ces outils tout ce qui me plairait d’un système online de géolocalisation collaborative de groupes, notamment:
- Un compte utilisateur, permettant de spécifier ses coordonnées afin de pouvoir s’inscrire sur différentes cartes tout en centralisant les informations pour une modification aisée (ce qui n’est pas le cas sur Frapper malheureusement);
- La possibilité d’utiliser son fichier FOAF pour ses paramètres utilisateur, notamment les coordonnées GPS, et éventuellement pour la photo à afficher (ou proposer l’utilisation de son gravatar pour celle-ci);
- Un système de tags pour chaque carte, permettant de trouver des groupes aux intêrets communs, et eventuellement de s’y inscrire. Le système de tags proposé par MapBuilder concerne les points, et non pas la carte en elle-même;
- Un fil RSS des dernières cartes créées, ainsi qu’un fil pour chaque carte (proposé sur MapBuilder), et pourquoi pas un fil par tag également.
Bref, j’ai commencé à jouer avec l’API Google Maps, si j’ai un peu de temps, on sait jamais …
Tags: Geek, geolocalisation, googlemaps
Dotclear: Plugin Fortune 0.4
Je viens de mettre à jour mon plugin d’affichage de citations aléatoires pour Dotclear.
Il gère directement les fichiers au format fortune, d’où une utilisation plus simple que la précédente version.
Disponible ici:
NB: Puisque je ne l’utilise plus ici, si quelqu’un qui s’en sert peut commenter ce post pour donnée une idée du résultat, ça serait sympa
Edit 11/02/2006: Mise à jour des URL (cf commentaires)
Google reader
Google vient de lancer son lecteur de news, dont voilà donc un bref aperçu après quelques minutes de test.
Au niveau des fonctionnalités, il est possible de tagger chacun des flux - que l’on aura préalablement trouvé via le moteur de recherche - offrant ainsi une plus grande souplesse qu’un système de catégories[1] utilisé dans la plupart des agrégateurs.
Il en est de même pour les billets, auxquels ont peut associer un label Star pour les plus intéressants, à l’instar de GMail.
Une interface intuitive (avec navigation au clavier pour passer d’un item à l’autre, très pratique), passage des différents panels (flux et items) sans rechargement de page - tout comme l’édition des tags d’ailleurs - et une “liste déroulante” pour sélectionner les billets assez sympa.
Par contre, je ne sais pas si c’est du à l’implémentation d’AJAX ou à une surcharge du serveur, mais ça rame pas mal en ce moment.
Aspects cognitifs des folksonomies
Une étude sur le pourquoi et les avantages (notamment par rapport à une catégorisation) de l’utilisation de mots-clés pour identifier les choses, en complément de l’article sur l’étude des tags chez del.icio.us.
Via affordance.info
Piggy Bank 2.1.0: nouvelle version du navigateur Web Sémantique
La version 2.1.0 de Piggy Bank est sortie.
Piggy Bank est une extension Firefox permettant d’en faire un “Semantic Web browser”.
Le principe est d’agréger le contenu de différents sites ou services web afin de les faire communiquer entre eux pour, par exemple, localiser des offres de location d’appartements en même temps que les transports en commun (puisque cette nouvelle version intègre l’API Google Maps) , ou rechercher les meilleurs tarifs pour des vacances combinant vol / location de voiture / hotel sur différents sites. On retrouve donc ici l’idée de l’initiative Web Sémantique, qui consiste à proposer un web où les données puissent être exploitables automatiquement par des agents logiciels.
Piggy Bank uilise RDF [1] pour stocker les données agrégées et, lorsque cela est possible, extrait également les données RDF présentes sur les sites selectionnés pour les regrouper. Lorsque le site ne dispose pas d’informations sous cette forme, il est possible d’écrire des Screen Scrapers pour passer de l’information brute à cette description formelle des connaissances.
Notes
[1] un des langages de description de ressources proposé par le W3C dans ce cadre
