Resources

    sortFiltrar Ordenar
    2302 results

    Hyperlink

    /

    Published on 3.8.2018 by Equipo GNOSS

    Nueva versión de Ontología PREMIS 3 de preservación digital

    PREMIS Data Dictionary for Preservation Metadata es un estándar internacional de metadatos que da soporte a la preservación de objetos digitales y asegura su usabilidad a largo plazo.

    PREMIS se usa en proyectos de preservación digital en todo el mundo y está incorporado en herramientas y sistemas de preservación digital, tanto comerciales como open source.

    El estándar PREMIS consiste en un diccionario de datos (con una nueva versión 3.0), un esquema XML, una ontología y documentación de soporte.

    La ontología PREMIS OWL proporciona una codificación RDF para el modelo de datos que define las entidades (Objects, Events, Agents y Rights), las propiedad de dichas entidades (unidades semánticas) y las relaciones entre ellas.

    Esta revisión está basada en el nuevo PREMIS Data Dictionary, version 3.0 y es una remodelación de la ontología anterior que incorpora nuevas mejores prácticas de Linked Data y conecta con otras ontologías RDF relevantes como PROV-O (Provenance ontology), Dublin Core metadata terms y los vocabularios de preservación de Library of Congress, entre otros.

    ...

    Categorías:

    Hyperlink

    /

    Published on 3.8.2018 by Equipo GNOSS

    SEO Semántico: de etiquetas y palabras clave a ontologías

    En este artículo, la persona que más y mejor ha estudiado las patentes desarrolladas por Google y sus efectos en el posicionamiento web, divulga como en el algoritmo de búsqueda de Google ya no es tan importante las etiquetas que ponemos a un artículo o post cuanto la estructuración "ontológica" de su contenido.

    Lo que Google está valorando son aquellas fuentes que le proporcionan un conocimiento claro y distinto, es decir, que le dan la información sobre qué entidades existen en su contenidos, cuales son sus atributos y con qué están relacionados. Cuando al publicar un contenido digital, estás publicando datos en RDF/OWL, haciendo transparente a Google cuales son los "hechos" y las "entidades" de este contenido, Google lo aprecia y lo premia con un mejor posicionamiento.

     

     

    ...

    Pdf

    /

    Published on 3.8.2018 by Equipo GNOSS

    Google: conocimiento basado en hechos. De enlaces a hechos. Knowledge based Trust. Un grafo de conocimiento "verdadero"

    En el año 2012, Google, en su blog, explicó como estaba transitando de la búsqueda por secuencia de caracteres a la búsqueda de entidades. En su artículo "Things, not Strings" explicaba la construcción de su Grafo de Conocimiento y como éste estaba condicionando la búsqueda, tras la compra dos años antes de Metaweb, empresa creadora de la gran base de entidades llamada Freebase.

    Siguiendo en esta línea y avanzando más, en el año 2015, como se expone en el resumen del paper que adjuntamos "Knowledge Based Trust: Estimating the Trustworthiness of Web Sources" escrito por Xin Luna Dong, Evgeniy Gabrilovich, Kevin Murphy, Van Dang, Wilko Horn, Camillo Lugaresi, Shaohua Sun, Wei Zhang, Google explica como está basándose en hechos y no tanto en links a la hora de seguir avanzando en la construcción de un Grafo de Conocimiento "verdadero".

    Así, los investigadores, apuntan en el resumen del paper que la calidad de las fuentes web se ha evaluado tradicionalmente utilizando señales exógenas como la estructura de los hipervínculos. Desde hace algún tiempo Google está identificando entidades del mundo y proponiendo un nuevo enfoque para sus búsquedas basado en señales endógenas, es decir, en la exactitud de la información objetiva proporcionada por la fuente. Una fuente que tiene pocos hechos falsos se considera confiable. Los hechos se extraen automáticamente de cada fuente mediante métodos de extracción comúnmente utilizados para construir bases de conocimiento (DBPedia, Yago, etc). Se está investigando la forma de distinguir errores cometidos en el proceso de extracción de entidades mediante el uso de inferencias conjuntas en un novedoso modelo probabilístico multicapa.


    Llaman puntaje de confiabilidad al cálculo basado en el conocimiento Confianza (KBT). En datos sintéticos, muestran que con este método pueden calcular los verdaderos niveles de confiabilidad de las fuentes. De este modo lo aplican
    luego a una base de datos con millones de hechos extraídos de la web, y así pueden estimar la confiabilidad de millones de páginas web.

    ...

    Pdf

    /

    Published on 1.8.2018 by Equipo GNOSS

    Xin Luna Dong, responsable de investigación del Product Graph de Amazon, expone en esta presentación algunos de los desafios más importantes con los que se están enfrentando a la hora de construir un Grafo de Productos que sea, ya no una parte o subconjunto del Knowledge Graph de Google, sino un Grafo de Productos con características y atributos propios. Todo ello, claro está, con el objetivo de responder mejor y dar una mayor satisfacción al usuario cuando quiere encontrar un producto. La misión es ofrecerle todo el conocimiento existente sobre este producto y ofrecer una experiencia digital mejorada que además le recomiende de forma pertinente ¿Qué otros libros, películas, artículos, han comprado las personas que también han comprado lo mismo que yo?

    En la presentación hace un recuento del conjunto de problemas y retos a los que se enfrentan para abordar este gran desafío:

    No hay fuentes estructuradas que ayuden a la creación del grafo de productos:

    • La Wikipedia ayuda poco, no está centrada en esto
    • Mucho texto estructurado está enterrado en el texto de la descripción del producto
    • Los minoristas y vendedores juegan con el sistema introduciendo ruido en los datos

    Se crean productos nuevos todos los días

    • La curación es imposible
    • Refrescar los nuevos productos es un gran desafío

    Hay un gran número de categorías de productos:

    • Definición muy manual de la ontología necesaria
    • Dificultad para capturar la tendencia de nuevas categorías de productos y sus propiedades

    Muchas entidades no son nombradas como entidades

    • No es aplicable el reconocimiento de entidades
    • Nuevos desafíos para la extracción, enlazado y búsqueda

    La presentación aborda los diversos escenarios de investigación que se están planteando.

    ...

    Note

    /

    Published on 1.8.2018 by Equipo GNOSS

    YAGO es una gran base de conocimiento semántico, derivada de Wikipedia, WordNet, WikiData, GeoNames y otras fuentes de datos. Actualmente, YAGO identifica más de 17 millones de entidades (como personas, organizaciones, ciudades, etc.) y contiene más de 150 millones de datos sobre estas entidades.

    YAGO tiene una serie de propiedades de interés:

    •     La precisión de YAGO se ha evaluado manualmente, lo que demuestra una precisión confirmada del 95% (*). Cada relación está anotada con su valor de confianza.
    •     YAGO combina la taxonomía limpia de WordNet con la riqueza del sistema de categorías de Wikipedia, asignando las entidades a más de 350,000 clases.
    •     YAGO está anclado en el tiempo y el espacio. YAGO concede una dimensión temporal y una dimensión espacial a muchos de sus hechos y entidades.
    •     Además de la taxonomía, YAGO tiene dominios temáticos como "música" o "ciencia" de WordNet Domains.
    •     YAGO extrae y combina entidades y hechos de 10 Wikipedias en diferentes idiomas.

    YAGO se desarrolla conjuntamente en el grupo DBWeb en la Universidad Télécom ParisTech, el grupo de Bases de Datos y Sistemas de Información en el Instituto Max Planck de Informática y Ambiverse.

    https://en.wikipedia.org/wiki/YAGO_(database)

    https://github.com/yago-naga/yago3

     

    ...

    Categorías:

    Hyperlink

    /

    Published on 1.8.2018 by Equipo GNOSS

    Thomson Reuters explica la importancia de construir un Grafo de Conocimiento

    En este artículo la compañia Thomson Reuters hace un repaso de qué es un Grafo de Conocimiento y la importancia que esto tiene en la configuración de la web actual y en las explotaciones para el negocio. Es un artículo divulgativo sobre el estado de la cuestión.

    Esto le da pie para explicar como su servicio de Knowledge Graph Feed permite a los clientes de Servicios Financieros acelerar sus estrategias digitales y de inteligencia artificial. El grafo de conocimiento con 2.000 millones de relaciones da vida a una visión completa del ecosistema financiero para que los usuarios puedan descubrir conocimiento sobre la base de las relaciones no previstas ni preadministradas que el grafo presenta.

    ...

    Hyperlink

    /

    Published on 1.8.2018 by Equipo GNOSS

    El Grafo de Conceptos de Microsoft

    El llamado Gráfico Conceptual de Microsoft intenta duplicar las diversas entidades existentes en el mundo. Se conforma como un gran grafo de conceptos, aprovechando la información  de miles de millones de páginas web y registros de búsqueda de años, aunque podemos decir que Google, Facebook, Amazon y otras empresas le llevan una ventaja considerable.

    https://concept.research.microsoft.com/Home/Introduction

    ...

    Hyperlink

    /

    Published on 1.8.2018 by Equipo GNOSS

    La construcción del Grafo de Conocimiento en Linkedin

    El director de Inteligencia Artificial de Linkedin explica en este artículo como Linkedin está construyendo su Grafo de Conocimiento.

    LinkedIn knowledge Graph es una gran base de conocimiento construida sobre "entidades" en LinkedIn, como miembros, trabajos, títulos, habilidades, compañías, ubicaciones geográficas, escuelas, etc. Estas entidades y las relaciones entre ellas forman la ontología del mundo profesional y son utilizados por LinkedIn para mejorar sus sistemas de recomendación, búsqueda, monetización y productos de consumo, negocios y análisis del consumidor.

    En este artículo el autor explica como aplican técnicas de Machine Learning para resolver los desafíos al crear el grafo de conocimiento, que es esencialmente un proceso de estandarización de datos sobre contenido generado por el usuario y fuentes de datos externas, en el que el aprendizaje automático se aplica:

    • la construcción taxonómica de entidades
    • la inferencia de relaciones entre entidades,
    • la representación de datos para consumidores de datos descendentes
    • la penetración de conocimiento (información) a partir del grafo 
    • la adquisición activa de datos de los usuarios para validar nuestra inferencia y recopilar datos de capacitación.

    El grafo de conocimiento de LinkedIn es un grafo dinámico. Las nuevas entidades se agregan al grafo y las nuevas relaciones se forman continuamente. Las relaciones existentes también pueden cambiar. Por ejemplo, el mapeo de un miembro a su título actual cambia cuando tiene un nuevo trabajo. Por tanto, hay que actualizar el grafo de conocimiento de LinkedIn en tiempo real cuando se produzcan cambios en el perfil de los miembros y nuevas entidades emergentes.

    ...

    Hyperlink

    /

    Published on 1.8.2018 by Equipo GNOSS

    Congreso: Grafos de Conocimiento en turismo

    El pasado 5 de junio de 2018 se celebró en Cáceres el TourismKG 2018, el primer workshop internacional que abordó la aplicación de Grafos de Conocimiento al sector de los viajes y el turismo. Este evento fue organizado por Ontology Engineering Group, responsables de la DBpedia del español, el mayor dataset semántico en nuestro idioma. En el mismo participó GNOSS exponiendo el proyecto realizado para Turismo de La Rioja.

     

    ...

    Categorías:

    Hyperlink

    /

    Published on 1.8.2018 by Equipo GNOSS

    Gartner: glosario sobre Inteligencia Artificial

    Artificial intelligence is technology that appears to emulate human performance typically by learning, coming to its own conclusions, appearing to understand complex content, engaging in natural dialogs with people, enhancing human cognitive performance (also known as cognitive computing) or replacing people on execution of nonroutine tasks. Applications include autonomous vehicles, automatic speech recognition and generation and detecting novel concepts and abstractions (useful for detecting potential new risks and aiding humans quickly understand very large bodies of ever changing information).

    ...