Notes ISWC2005: Swoogle
Présentation ce matin de Swoogle, moteur de recherche d’ontologies et de métadonnées qui compte pour le moment 700K documents indexés.
Swoogle permet une recherche par mots clés sur les ontologies ou les concepts, offrant des détails pour chaque ontologie trouvée, par ex:
http://www.isi.edu/~pan/damltime/time-entry.owl Suffix: owl Encoding: RX Last modified: 2004-10-19 15:36:56 Classes defined: 17 Properties defined: 48 Instances defined: 7 Triples: 308 Namespaces used: 6 Ontology Ratio: 0.677083
Possibilité également de voir plus de détails sur l’ontologie (namespaces utilisées …), de rechercher les ontologies contenant tel ou tel concept puis de détailler leur utilisation. l’objectif étant d’avoir un outil pour découvrir des ontologies mais également pour évaluer l’utilisation d’une ontologie donnée.
Swoogle offre également un shopping cart pour pouvoir ensuite faire des requêtes sur l’ensemble du panier.
Le classement des résultats se base sur un algorithme proche du PageRank, à la différence que chaque lien a ici un poids défini en fonction du type puisque contrairement à des pages Web classiques, les relations entre documents peuvent avoir différentes sémantiques et non plus être de simples liens hypertextes.
Les slides de la présentation sont disponibles ici.
Tags: google, iswc2005, ontologie, owl, swoogle, websemantique
Notes ISWC2005: Piggy Bank
David Huynh vient de présenter Piggy Bank à travers un exemple de collecte et de partage d’informations depuis différentes sources (logements et restaurants).
Comme expliqué dans un précédent billet, l’objectif de Piggy Bank est de proposer la collecte, la combinaison et la visualisation contextuelle d’informations en provenance de n’importe quel(s) site(s) web, qu’il s’agisse d’informations publiées dès la source en RDF (RSS, FOAF …) ou extraites vers du RDF depuis ces sites (XSLT, scrapper Javascript avec Solvent …).
Une killer app, puisque l’intêret ici est d’exploiter ces informations depuis des sites en “HTML pur” en l’attente de sites sémantiques au sens WS.
Tags: iswc2005, piggybank, rdf, socialsoftware, websemantique
Notes ISWC2005: Posters & Demos
Quelques notes sur la session de ce soir avant une Guinness bien fraiche:
- Oyster, application de gestion des ontologies en réseau P2P. On ne stocke pas directement l’ontologie mais des métadonnées sur celle-ci, de façon à pouvoir rechercher ensuite les ontologies d’un domaine particulier en fonction du titre, du concept, des namespaces utilisés …
- Confoto, application Web 2.0 (pas d’AJAX cette fois, mais des Iframes) de gestion d’albums photo supportant des métadonnées RDF. Chaque utilisateur du système peut poser ses propres annotations et les partager ou non. On peut également selectionner des photos dans son “panier” pour ensuite exporter les métadonnées concernant uniquement le set de photos selectionné.
- RDFGravity, application de modélisation graphique d’ontologies et de schémas, à la fois pour la partie conceptuelle mais également en ce qui concerne la base de connaissances. Produit des fichiers
.rdfou.owl, malheureusement les propriétés OWL comme la cardinalité ne sont pas supportées directement. Me semble plus intuitif que les nombreux plug-ins Protégé du même domaine.
- openacademia.org, service Web permettant de transformer des données BibTeX en fil RSS. On peut alors syndiquer différents fils obtenus par cet intermédiaire, et utiliser FOAF pour obtenir de plus amples informations sur les auteurs (photo, URL …).
- Semantic Wiki, extension de MediaWiki pour créer des triplets mettant en relation les pages wiki, en lieu et places de classiques liens hypertextes. Une approche qui rappelle celle proposée à WikiMania05.
- Ontoling, plug-in Protégé facilitant l’enrichissement linguistique des ontologies grâce à des services comme Wordnet.
- The Personal Publication Reader, service Web qui extrait de différents sites des informations concernant les publications, les auteurs, les groupes de travail, etc pour les stockes en RDF. Les informations ne sont pas forcément extraites du même site mais sont ensuite recoupées pour proposer une interface de recherche et de navigation complète.
Exciting !
Notes ISWC2005: SemAnnot 2005
Quelques notes sur le Workshop SemAnnot05 qui s’est tenu hier à Galway dans le cadre de l’ISWC2005:
- Le LORIA a présenté un procédé d’extraction automatique de connaissances à partir de sites Web. L’algorithme se base sur la structure des pages, en utilisant DOM, pour travailler ensuite sur des pages similaires. L’idée fait penser à Solvent avec l’avantage d’extraire ici des instances de concepts d’une ontologie. En fonction des informations trouvée, l’instance peut-être plus ou moins raffinée (ex: ProfesseurAssistant, ProfesseurInvité) et en cas d’ambiguité, c’est le concept de plus haut niveau qui est instancié (ex: Professeur). D’ou l’utilité d’avoir des contraites dans son ontologie et dans la définition des classes / sous-classes afin de bénéficier des apports de la classification automatique.
- Mindswap a présenté Photostuff, outil open source (Java) d’annotations sémantiques de photos. Il permet d’annoter ses photo avec des metadonnées DublinCore et EXIFSchema, mais également à partir de ses propres ontologies. On peut également définir des zones d’affichage sur les photos, comme chez [Flickr, avec à nouveau l’apport d’une ontologie pour la description. La démo SemSpace|http://semspace.mindswap.org|en] propose une version on-line d’une partie de l’application.
- Il a également été brièvement question de l’utilisation de métadonnées pour indexer et proposer les contenus musicaux, via SIMAC ou le vocabulaire de métadonnées Musicbrainz … Pour plus continuer sur le sujet des annotations de données multimédia, voir également les actions de la Task Force Multimedia Annotation du Semantic Web Best Practices and Deployment Working Group (W3C).
- Enfin, vu pendant la session posters, un outli de l’Onekin Group permettant de créer des instances de concepts “à la volée” depuis n’importe quelle application (environnement Windows). Après avoir chargé une ontologie, un clic droit sur une page ou un document permet de créer une nouvelle instance (ex: CompteRenduDeReunion) ou d’utiliser les instances déjà crées pour. Le backend utilise Jena et propose un moteur d’inférence pour les relations inverses, etc …
Les actes du workshop seront disponibles sur http://ceur-ws.org.
Tags: iswc2005, metadonnees, ontologie, semannot
Nouvelle URL
Changement d’URL pour ce blog, histoire de pouvoir gérer plus facilement d’éventuels sous-domaines. Le domaine migre vers http://apassant.net.
L’alias http://alex.passant.org/ reste valable pour le moment, mais mettez de préférence à jour vos bookmarks et agrégateurs.
Edit: En fait, la redirection se fait a la racine uniquement, donc le flux RSS et les anciens liens ne sont pas redirigés, desolé !
