Archive for the ‘Services’ Category

“les petites cases” sur les linked data

Wednesday, February 10th, 2010

je me premets de reprendre un post en entier du blog “les petites cases“, vivement recommandé!

Data.gov.uk

Je partage l’avis de Zach Beauvais, platform evangelist chez Talis qu’on ne présente plus depuis que Nicolas les a proclamé « Rois du Web sémantique ». La grande nouvelle de la semaine n’est certainement pas l’Ipad, mais bien l’ouverture en bêta publique du site « data.gov.uk ». Mis au point sous la houlette de Sir Tim Berners-Lee et de Nigel Shadbolt, ce site donne l’accès sous une forme brute aux données/statistiques/informations du secteur publique britannique. Et l’influence des deux comparses se fait sentir dès la page d’accueil : un énorme logo représentant un triplet, une rubrique SPARQL dans le menu principal, et une section « What is the Semantic Web » avec le logo du Web sémantique. Le ton est donné et, contrairement au data.gov américain, les Britanniques ont dès le départ fait le choix des technlogies du Web sémantique. Le site en lui-même a été construit avec Drupal 6 avec du RDFa à l’intérieur, la plupart des donnnées a été convertie en RDF grâce, entre autres, aux bons soins de Jeni Tennison, grande prêtresse du XML et de XSLT convertie au Linked Data, elles sont indexées dans une base de données RDF fournie et hébergée par Talis et, bien-sûr, interrogeable en SPARQL via un sparql endpoint. Le site propose une liste d’applications qui exploitent les données et les mashups entre data.gov et data.gov.uk n’ont pas tardé à apparaître à l’image de celui mis au point par Alvaro Graves. Et si vous vous demandez à l’image de Stefano Mazzochi l’intérêt de RDF pour mettre à disposition des données statistiques, je vous recommande la lecture de ce billet de Jeni Tennison qui fait le bilan de l’expérience « data.gov.uk », insistant, en particulier, sur l’intérêt des technologies du Web sémantique.

Linked Data Triplification Challenge 2010

Le « Linked Data Triplification Challenge 2010 » est lancé. Proposé chaque année par le groupe de recherche AKSW de Leipzig à l’origine de Dbpedia et de triplify, ce concours vise à récompenser les initiatives pour exposer des nouvelles données dans le linked data, faciliter la conversion de données en RDF ou exploiter les données du linked data. Ce concours a déjà provoqué l’émergence et/ou récompensé des projets comme Linked Movie Database, Dbtune.org ou Linked Open Drug Data.

Smob V2

Alexandre Passant a publié la semaine dernière une nouvelle version de Smob, un outil de microbloging sémantique. Cette nouvelle version que j’ai eu la chance de tester en bêta constitue une refondation complète par rapport à la version précédente : plus de distinctions entre Smob server et Smob client, mais une notion de hub, l’interface de saisie est plus conviviale et offre un moyen assez simple pour tagger intelligemment ses twitts (entendez relié à des URIs du Linked data ;-) ), RDFa et SPARQL à tous les étages. Bref, c’est très joli, toujours aussi intéressant et je vais m’empresser de l’utiliser à l’image de la version précédente, d’autant qu’il va être maintenu et on peut espérer voir sortir de nouvelles versions plus régulièrement.

Uberblic.org

Georgi Kobilarov qui fut un des créateurs de Dbpedia vient de lancer Uberblic.org, soit un « service d’intégration de données liées fournissant un point d’accès unique au Web de données ». Cette plate-forme présente deux avantages : la mise à jour en temps réel des données modifiés dans le site d’origine et la possibilité de modifier les mappings et la structure des ontologies utilisés (même si cette dernière n’est pour l’instant accessible qu’à des invités). Plutôt qu’un long discours, je vous invite à consulter cette vidéo qui montre tous les détails. En revanche, la politique des identifiants me laisse songeur, car j’ai l’impression que le service attribue de nouvelles URIs à des ressources qui en possèdent déjà, nous verrons à l’usage, mais cette plate-forme me semble prometteuse et me rappelle un peu ce que sera la prochaine version de Twine.

Sur le front de la standardisation

Du côté du W3C, ça s’agite ferme aussi autour des technologies du Web sémantique. Le groupe de travail SPARQL continue sa marche forcée vers SPARQL 1.1 et fournit une mise à jour de 6 recommandations toutes aussi intéressantes les unes que les autres (je conseille en particulier SPARQL Update et SPARQL Uniform HTTP Protocol for Managing RDF Graphs) et offre à la lecture une nouvelle recommandation : SPARQL 1.1 property paths, soit une syntaxe de navigation dans le graphe.

Mais, la grande annonce concerne RDF et la tenue au mois de juin d’un workshop sur son avenir. Cette annonce avait été précédée au mois de novembre par un thread sur la liste Semantic Web du W3C constituant une liste de souhait sur RDF 2 et a été suivie par de nombreuses réactions à commencer par deux threads toujours sur la même liste : Requirements for a possible “RDF 2.0″ et RDF syntaxes 2.0. Sur le même sujet, je vous conseille ausssi la lecture de ce billet de Dave Beckett, développeur de redland, inventeur de turtle et grand avocat des technologies du Web sémantique.

iTunes rival Songbird goes 1.0

Thursday, December 4th, 2008

Innovation in audio software for OS X, Linux and Windows.
“Song bird” 1.0 released!

This stable release can import all audio files (including your iTunes library) and integrates them with the internet.

iTunes just became lame.

try it, like it
http://getsongbird.com/ 

Registries and the public domain at the 3rd COMMUNIA Workshop

Monday, November 3rd, 2008

The 3rd COMMUNIA Workshop on Marking the Public Domain: Relinquishment and Certification was perfectly hosted by Kennisland and IvIR in Amsterdam. The workshop report is online now.

There were major updates on Creative Commons Zero by CC Counsel Diane Peters and a panel discussion between IVIR’s Bernt Hugenholtz and Duke Law School’s James Boyle.  Also included was a panel on marking and tagging public domain works, featuring presentations by Safe Creative’s Mario Pena (Safe Creative’s apprach to registering public domain works), Patrick Peiffer (CC Luxembourg), Jonathan Gray (OKF), and Mike Linksvayer  (Creative Commons)  on certifying public domain works.

All presentations from the workshop are available for download.

OCLC copyright evidence registry

Monday, September 1st, 2008

OCLC is piloting a new service for libraries that encourages librarians and other interested parties to discover and share information about the copyright status of books.

The WorldCat Copyright Evidence Registry does not provide conclusions or assertions about the copyright status of a book. Instead, it provides the information, tools, and community to help you conduct your copyright status investigation and form your own conclusions. It also lets you and others in the community share your conclusions.

So hop over to the Registry Pilot, create a free WorldCat account and have a look. A quick take:

  • Creative Commons licences are supported as copyright information, yet their integration could be optimised with CC+ and a licence chooser, to make sure that OCLC receives machine readable data. Now, you just type in free-form CC licence descriptions and no proper ccREL can be built from that.
  • No sharing of data. Unfortunately, OCLC harvests the rights of those contributing. The terms of use allow hardly any re-use: no mining, no caching, no distribution. There are also some fancy (cardcatalog?) rules like it’s forbidden to “make more than one (1) copy per screen display;”

This is a pilot which rests on the solid basis of 100 million item WorldCat database and has the potential to be a highly relevant source for copyright information evidence.

Better access to scientific articles on EU-funded research

Thursday, August 28th, 2008

 From the RTD Scientific Publication team:

European Commission launches online pilot project

Fast and reliable access to research results, especially via the Internet, can drive innovation, advance scientific discovery and support the development of a strong knowledge-based economy. The European Commission wants to ensure that the results of the research it funds under the EU’s 7th Research Framework Programme (FP7) with more than € 50 billion from 2007 - 2013 are disseminated as widely and effectively as possible to guarantee maximum exploitation and impact in the world of researchers and beyond. The Commission today launched a pilot project that will give unrestricted online access to EU-funded research results, primarily research articles published in peer reviewed journals, after an embargo period of between 6 and 12 months. The pilot will cover around 20% of the FP7 programme budget in areas such as health, energy, environment, social sciences and information and communication technologies.

Information on the open access pilot in FP7:

Questions on the Open Access pilot can be sent to: rtd-open-access@ec.europa.eu

Commission activities in the area of access to scientific information:
http://ec.europa.eu/research/science-society/scientific_information
http://ec.europa.eu/information_society/activities/digital_libraries/