Notes ISWC2005: SemAnnot 2005

Quelques notes sur le Workshop SemAnnot05 qui s’est tenu hier à Galway dans le cadre de l’ISWC2005:

  • Le LORIA a présenté un procédé d’extraction automatique de connaissances à partir de sites Web. L’algorithme se base sur la structure des pages, en utilisant DOM, pour travailler ensuite sur des pages similaires. L’idée fait penser à Solvent avec l’avantage d’extraire ici des instances de concepts d’une ontologie. En fonction des informations trouvée, l’instance peut-être plus ou moins raffinée (ex: ProfesseurAssistant, ProfesseurInvité) et en cas d’ambiguité, c’est le concept de plus haut niveau qui est instancié (ex: Professeur). D’ou l’utilité d’avoir des contraites dans son ontologie et dans la définition des classes / sous-classes afin de bénéficier des apports de la classification automatique.
  • Enfin, vu pendant la session posters, un outli de l’Onekin Group permettant de créer des instances de concepts “à la volée” depuis n’importe quelle application (environnement Windows). Après avoir chargé une ontologie, un clic droit sur une page ou un document permet de créer une nouvelle instance (ex: CompteRenduDeReunion) ou d’utiliser les instances déjà crées pour. Le backend utilise Jena et propose un moteur d’inférence pour les relations inverses, etc …

Les actes du workshop seront disponibles sur http://ceur-ws.org.