    2017.4.10 noiz Equipo GNOSS

    Semantic Data Management in Practice Half-day Tutorial at WWW 2017

    After years of research and development, standards and technologies for semantic data are sufficiently mature to be used as the foundation of novel data science projects that employ semantic technologies in various application domains such as bio-informatics, materials science, criminal intelligence, and social science. Typically, such projects are carried out by domain experts who have a conceptual understanding of semantic technologies but lack the expertise to choose and to employ existing data management solutions for the semantic data in their project. For such experts, including domain-focused data scientists, project coordinators, and project engineers, our tutorial delivers a practitioner's guide to semantic data management. We discuss the following important aspects of semantic data management and demonstrate how to address these aspects in practice by using mature, production-ready tools:

    • i) storing and querying semantic data;
    • ii) understanding,
    • iii) searching, and
    • iv) visualizing the data;
    • v) automated reasoning;
    • vi) integrating external data and knowledge; and
    • vii) cleaning the data.




    2014.12.19 noiz Equipo GNOSS

    SADI - Semantic Automated Discovery and Integration

    Are you a data or service provider?

    SADI is a framework for discovery of, and interoperability between, distributed data and analytical resources. It combines simple, stateless, GET/POST-based Web Services with standards from the W3C Semantic Web initiative. The objective of SADI is to make it easy for data and analytical tool providers to quickly make their resources available on the Semantic Web with minimal disruption to their usual practices. SADI is quite a distinct “technology” in that there’s nothing to it… literally! SADI avoids creating new technologies or non-standard Web “infrastructure” (e.g., message formats). It simply defines an open set of best-practices and conventions, within the spectrum of existing standards, that allow for a high degree of semantic discoverability and interoperability between participating services. Moreover, many of these integrative behaviors have not been observed before in any precedent, distributed system!

    Do you need data?

    Though you will probably never even know you are using it, SADI was designed with you in mind! SADI enables the data sources and analytical websites that you use every day to provide their resources to you in a much more intuitive way. This means that the software you use to interact with these resources will also become “smarter” when it is SADI-enabled, because SADI is specifically designed to “think” the way you “think”. If there’s a resource that you would like to see available through SADI, contact us, or contact your IT service provider. If there’s a software tool that you think would benefit from being SADI-enabled, tell us about it, or write to the provider of that tool with your request! The open-source SADI project provides a place where participants can submit software and/or ontological tools that adhere to these conventions, and can be used by others. This helps to “spread the word” and make it easier for new resources to become semantically interoperable.

    Development of SADI is generously supported by CANARIE, the Heart and Stroke Foundation of B.C. and Yukon, the Canadian Institutes of Health Research, and Microsoft Research.




    2014.12.17 noiz Equipo GNOSS

    Se presenta BabelNet 3.0

    Se ha presentado BabelNet 3.0, un proyecto financiado por el European Research Council (ERC), y dirigido por el profesor Roberto Navigli, de la Universidad Sapienza de Roma. 

    BabelNet es un diccionario enclopédico muy amplio y una red semántica, creados mediante la integración de Wikipedia y Wordnet, además de otros recursos léxicos como Wiktionary, OmegaWIki, Wikidata y Open Multilingual Wordnet. La integración se consigue mediante un algoritmo de enlazado automático, completado léxicamente mediante traducciones automáticas.

    El resultado es un diccionario enciclopédico que proporciona conjuntos de sinónimos (synsets). Por ejemplo, conceptos y entidades en varios idiomas conectados con una gran cantidad de relaciones semánticas.

    La versión 3.0 tiene las siguientes características:

    • Un nuevo interfaz de usuario.
    • Una nueva API RESTful, disponible en su versión BETA hasta el 31/1/2015.
    • 271 idiomas.
    • Revisión mejorada de la integración de WordNet, Open Multilingual WordNet, Wikipedia, OmegaWiki, Wikidata y Wiktionary.
    • 13,7 millones de synsets.
    • 117 millones de siginificados.
    • 40,3 millones de definiciones textuales.
    • 354 millones de relaciones semánticas.
    • Taxonomía completa, gracias a la integración de Wikipedia Bitaxonomy.
    • 10 millones de imágenes asociadas a synsets.
    • Aproximadamente, 2.000 millones de triples RDF, disponibles con un interfaz SPARQL (próximamente).


    Banca y Web Semántica. BIAN: Banking industry arquitecture network

    BIAN (Banking industry arquitecture network) es una  asociación sin fin de lucro fundada en 2008 por varios bancos e integradores tecnológicos cuyo propósito es construir y promover la creación en el sector de una arquitectura común que aborde los problemas de interoperabilidad bancarias. El objetivo de BIAN es definir una arquitectura orientada a servicios (SOA) donde se definan estándares semánticos para los servicios de TI en el sector bancario.

    La asociación se centra en la creación de un conjunto de estándares semánticos para los servicios bancarios. Esto ayudará a los bancos para lograr una reducción de los costes de integración y el uso de las ventajas de una arquitectura orientada a servicios.

    Las instituciones financieras, proveedores de software e integradores de sistemas, junto con socios tecnológicos, están invitados a unirse a la asociación y de desempeñar un papel de colaboración con otros líderes de la industria en la definición, construcción e implementación de plataformas de banca de próxima generación.

    Por parte española, entre sus miembros se encuentra Banca Galicia.




    2014.3.10 noiz Equipo GNOSS

    Nuevo borrador de WebID 1.0. Web Identity and Discovery. W3C

    El pasado 5 de Marzo se publicó un nuevo borrador de la especificación WebID, en su versión 1.0.

    Una Web Social global y distribuida requiere que cada persona pueda controlar su identidad, que esta identidad sea enlazable a través de diferentes sitios, colocando a cada persona en la Web de las relaciones; y que pueda autenticarse globalmente con esa identidad.

    Esta especificación define un mecanismo sencillo de identificación universal, distribuido, y abiertamente extensible; mejorando la privacidad, la seguridad y el control con que cada persona puede identificarse a sí misma. permitiendo un control de acceso granular a su información en la Web. Esto se consigue aplicando las mejores prácticas de Arquitecura Web, sobre protocolos y estándares ampliamente soportados como HTML, URIs, HTTP y Semántica RDF.

    Los autores de la especificación son Andrei SambraHenry Story y Tim Berners-Lee.


    Integración de datos entre el servicio de salud y el servicio de asuntos sociales con Web Semántica. GNOSS.

    Artículo en el que se expone como la aproximación al problema de la integración de datos en el mundo de la atención sociosanitaria debe ser una aproximación semántica. Salir del aislamiento y la falta de coordinación existente entre el sistema de salud y el sistema de servicios sociales en lo que ha gestión de la información se refiere requiere tecnología. En este caso la tecnología semántica supone un enfoque y una aproximación que permite avanzar más rápido y supera los enfoques de integración tradicionales.

    Portar los datos e interoperar entre datos es posible cuando los mismos están representados semánticamente.






    A few days ago Prateek Jain, Pascal Hitzler, Krzysztof Janowicz, Chitra Venkatramani from Knoesis published a short writeup “There is no money in Linked Data”. And started a corresponding discussion on the W3C Semantic Web mailinglist. In this post I want to summarize the short discussion I had on this topic with Pascal Hitzler, since my impression is that we often do not see the historic analogy between the developments regarding open-source software a few years ago and open data now.


    There’s Money in Linked Data


    To develop technologies, we need critical questions, and of course the most critical ones always come from the inside of a community or movement. But time has come to spread the good news for the ‘outside’.I believe that so far ‘linked data’ has always been perceived by people from outside the linked data core-community only as a new way to organize data on the web, thus technologies are still not mature for enterprises.Yes, databases which rely on linked data standards have become mature and enough performing for many query types so that they outperform even ‘traditional’ relational databases


    • Yes, also issues which are critical for enterprise usage like privacy and security have been solved by most linked data technology vendors
    • Yes, there is a critical mass of available LOD sources (for example UK Ordnance Survey) and also of high-quality thesauri and ontologies (for example Wolter Kluwer’s working law thesaurus) to be reused in corporate settings
    • Yes, there is a volume of developers and consultants on the labor market (in the U.S. as well as in the E.U.) which is big enough to being able to execute large linked data projects
    • Yes, there are tons of business cases that can benefit from linked data. Linked data and semantic web technologies should be considered as core technologies for any information architecture, at least in larger corporations
    • Yes, SPARQL Query Language is not only a second SQL but comes with some brilliant features like transitive queries which help to save a lot of time when developing applications like business intelligence reporting and analysis
    • Yes, Linked Data has the potential to become the basis for a large variety of tools which help decision-makers (not only in enterprises but also in politics) to become true ‘digerati’ instead of being degraded to masters of the ‘bullshit bingo’.


    Mathieu d´Aquin. Open University. Semantic Web

    Mathieu d'Aquin is a research fellow at the Knowledge Media institute (KMi) of the Open University in Milton Keynes, UK. His research activities focus on the Semantic Web, and especially on methods and tools to build intelligent applications relying on formalised knowledge distributed online. Mathieu has in particular been involved in the development of the Watson Semantic Web search engine, and in many applications of its APIs.