facetas

Recursos > Web de los datos

    sortFiltrar Ordenar
    452 resultados

    Artículo

    /

    Publicado el 17.9.2018 por Ricardo Alonso Maturana

    The Semantic Web provides an enticing vision of our online future. This next-generation Web will enable intelligent computer assistants to work autonomously on our behalf: scheduling our appointments, doing our shopping, finding the information we need, and connecting us with like-minded individuals.

    Unfortunately, the Semantic Web is also a vision that, to some, seems very distant, perhaps even outdated. It has been over a decade since it was popularized in a May 2001 article in Scientific American. Semantic Web researchers and engineers have been toiling even longer on the monumental technical and sociological challenges inherent in creating a global Semantic Web.

    The good news is that we are seeing evidence today of its accelerating emergence. Although still far from its grand vision, there are available today small “local” versions of semantic webs and intelligent assistants. Consumers can begin using these intelligent assistants today; producers can begin incorporating this next-generation semantic data into their current business models and applications.

    Paradoxically, the path to a global solution may evolve not only through the cooperation of a community, but through the selective forces of competition. As proprietary semantic networks and software agents vie for mass market dominance, winning technical and business models will emerge through a tapestry of data providers and services.

    ...

    Pdf

    /

    Publicado el 3.8.2018 por Equipo GNOSS

    Google: conocimiento basado en hechos. De enlaces a hechos. Knowledge based Trust. Un grafo de conocimiento "verdadero"

    En el año 2012, Google, en su blog, explicó como estaba transitando de la búsqueda por secuencia de caracteres a la búsqueda de entidades. En su artículo "Things, not Strings" explicaba la construcción de su Grafo de Conocimiento y como éste estaba condicionando la búsqueda, tras la compra dos años antes de Metaweb, empresa creadora de la gran base de entidades llamada Freebase.

    Siguiendo en esta línea y avanzando más, en el año 2015, como se expone en el resumen del paper que adjuntamos "Knowledge Based Trust: Estimating the Trustworthiness of Web Sources" escrito por Xin Luna Dong, Evgeniy Gabrilovich, Kevin Murphy, Van Dang, Wilko Horn, Camillo Lugaresi, Shaohua Sun, Wei Zhang, Google explica como está basándose en hechos y no tanto en links a la hora de seguir avanzando en la construcción de un Grafo de Conocimiento "verdadero".

    Así, los investigadores, apuntan en el resumen del paper que la calidad de las fuentes web se ha evaluado tradicionalmente utilizando señales exógenas como la estructura de los hipervínculos. Desde hace algún tiempo Google está identificando entidades del mundo y proponiendo un nuevo enfoque para sus búsquedas basado en señales endógenas, es decir, en la exactitud de la información objetiva proporcionada por la fuente. Una fuente que tiene pocos hechos falsos se considera confiable. Los hechos se extraen automáticamente de cada fuente mediante métodos de extracción comúnmente utilizados para construir bases de conocimiento (DBPedia, Yago, etc). Se está investigando la forma de distinguir errores cometidos en el proceso de extracción de entidades mediante el uso de inferencias conjuntas en un novedoso modelo probabilístico multicapa.


    Llaman puntaje de confiabilidad al cálculo basado en el conocimiento Confianza (KBT). En datos sintéticos, muestran que con este método pueden calcular los verdaderos niveles de confiabilidad de las fuentes. De este modo lo aplican
    luego a una base de datos con millones de hechos extraídos de la web, y así pueden estimar la confiabilidad de millones de páginas web.

    ...

    Artículo

    /

    Publicado el 1.8.2018 por Equipo GNOSS

    YAGO es una gran base de conocimiento semántico, derivada de Wikipedia, WordNet, WikiData, GeoNames y otras fuentes de datos. Actualmente, YAGO identifica más de 17 millones de entidades (como personas, organizaciones, ciudades, etc.) y contiene más de 150 millones de datos sobre estas entidades.

    YAGO tiene una serie de propiedades de interés:

    •     La precisión de YAGO se ha evaluado manualmente, lo que demuestra una precisión confirmada del 95% (*). Cada relación está anotada con su valor de confianza.
    •     YAGO combina la taxonomía limpia de WordNet con la riqueza del sistema de categorías de Wikipedia, asignando las entidades a más de 350,000 clases.
    •     YAGO está anclado en el tiempo y el espacio. YAGO concede una dimensión temporal y una dimensión espacial a muchos de sus hechos y entidades.
    •     Además de la taxonomía, YAGO tiene dominios temáticos como "música" o "ciencia" de WordNet Domains.
    •     YAGO extrae y combina entidades y hechos de 10 Wikipedias en diferentes idiomas.

    YAGO se desarrolla conjuntamente en el grupo DBWeb en la Universidad Télécom ParisTech, el grupo de Bases de Datos y Sistemas de Información en el Instituto Max Planck de Informática y Ambiverse.

    https://en.wikipedia.org/wiki/YAGO_(database)

    https://github.com/yago-naga/yago3

     

    ...

    Página Web

    /

    Publicado el 17.1.2018 por Equipo GNOSS

    Mejoras en Linked Open Vocabularies (LOV)

    El proyecto Linked Open Vocabularies (LOV) continúa en su tarea de eliminar las barreras que la selección de vocabularios puede provocar a los publicadores de datos en el desarrollo de sus proyectos Linked Data.

    Un reciente paper, Linked Open Vocabularies (LOV): a gateway to reusable semantic vocabularies on the Web, premiado con el Semantic Web Outstanding Paper Award 2017, describe LOV como un catálogo de vocabularios reutilizables de alta calidad, para la descripción de datos en la Web. La iniciativa LOV recopila y hace visible indicadores que no habían sido previamente recopilados, como la interconexión entre vocabularios o el historial de versiones

    ...

    Presentación

    /

    Publicado el 25.4.2017 por Ricardo Alonso Maturana

    Mapping SparQl with Pig Latin (12 June 2011)

    Overview

     1. Motivation

    2. Framework

    3. PigSPARQL

    4. Evaluation

    5. Summary PigSPARQL: Mapping SPARQL to Pig Latin

    ...

    Página Web

    /

    Publicado el 2.6.2016 por Equipo GNOSS

    ¿Qué pasó con la Web Semántica? - What happened to the Semantic Web? - Kingsley Idehen

    Kingsley Idehen, CEO de Openlink Software, creadores de Virtuoso, expone en este post su visión sobre el estado actual de la Web Semántica.

    El provocador título del post es el punto de partida para rebatir la idea de que la web semántica sea una promesa tecnológica incumplida, sino que, más bien, lo que ha sucedido es que su llegada no ha tenido la espectacularidad que algunos esperaban. En palabras de Kingsley Idehen: "In this post, I will demonstrate that as expected [1][2], its arrival was without fanfare, but we are inarguably there."

    El autor proporciona dos ejemplos, relacionados con la experiencia de búsqueda, particularmente en Google.

    En primer lugar, la creación del vocabulario compartido Schema.org, por parte de Google, Microsoft, Yahoo!, Yandex, y otros.

    En segundo, la creación del Knowledge Graph de Google, y su aplicación indirecta en las búsquedas normales, y directa en búsquedas especiales (Custom Search Engine).

    Estos ejemplos demuestran que los objetivos básicos de la Web Semántica ya se han alcanzado:

    • La web está llena de documentos HTML que incluyen datos semánticamente enriquecidos.
    • Estos documentos crean una nueva dimensión Web en la que los enlaces ya no son sólo entre documentos, sino que funcionan como nombres desambiguados para cualquier entidad, permitiendo la construcción de sentencias en lenguaje natural para codificar y decodificar información (datos contextualizados), comprensibles por usuarios y máquinas (bots).

    En palabras del autor: "The fundamental goal of the Semantic Web Project has already been achieved. Like the initial introduction of the Web, there wasn't an official release date — it just happened!"

    ...

    Página Web

    /

    Compartido el 11.4.2016 por Equipo GNOSS

    New book on Open Data for Education

    The Book “Open Data for Education Linked, Shared, and Reusable Data for Teaching and Learning” just got published by Springer. Edited by Dmitry Mouromtsev and Mathieu d’Aquin (the coordinator of AFEL), this book gives an overview of the practices in the area, including concrete examples of applications of open data for learning and teaching, from various authors, including AFEL members such as Stefan Dietze and Besnik Fetahu.

    ...

    Página Web

    /

    Publicado el 7.3.2016 por Equipo GNOSS

    Data on the Web Best Practices Working Group. W3C.

    La misión del grupo de trabajo Data on the Web Best Practices, que forma parte de Data Activity, es:

    1. Desarrollar el ecosistema de datos abiertos, facilitando la mejor comunicación posible entre desarrolladores y publicadores.
    2. Proporcionar guías a los publicadores, para mejorar la consistencia en la gestión de los datos, y promoviendo su reutilización.
    3. Fomentar la confianza en los datos entre los desarrolladores, sea cual sea la tecnología que usen, aumentando el potencial para innovaciones genuinas.

    Las guías y recomendaciones tendrán 2 formas: un conjunto de buenas prácticas de aplicación en múltiples tecnologías, y vocabularios que aún no existen, pero que son necesarios para soportar el ecosistema de datos en la Web. En este sentido, están disponibles los siguientes borradores:

    ...

    Página Web

    /

    Publicado el 4.3.2016 por Equipo GNOSS

    Generar RDF desde datos tabulares en la Web. Recomendación del W3C

    El documento define los procedimientos y reglas a aplicar para convertir datos tabulares en RDF. Los datos tabulares pueden estar complementados con anotaciones en metadatos que describan su estructura, el significado de su contenido, y si forma parte de una una colección de datos tabulares interrelacionados. El documento especifica el efecto de estos metadatos en el RDF resultante.

    Esta recomendación forma parte de un conjunto de documentos del W3C sobre CSV en la Web:

    ...

    Página Web

    /

    Publicado el 29.10.2015 por Ricardo Alonso Maturana

    Choosing Between Graph Databases and RDF Engines for Consuming and Mining Linked Data (Universidad Simon Bolívar, Caracas, Venezuela)

    Abstract.

    Graphs naturally represent Linked Data and implementations of graph-based tasks are required not only for data consumption, but also for mining patterns among links. Despite efficient graph-based algorithms and engines have been implemented, there is no clear understanding of how these solutions may behave on Linked Data

    ...