Next Web: web 3.0, web semántica y el futuro de internet > grafo de conocimiento

    sortFiltrar Ordenar
    13 resultados

    Artículo

    /

    Publicado el 12.7.2021 por Equipo GNOSS

    Los grafos de conocimiento, entre las 10 principales tendencias de Gartner para 2021

    Los Grafos de Conocimiento siendo tendencia según el informe de Garner de 2021. Son un total de 10 las tendencias de datos y análisis, de las cuales los grafos de conocimiento ocupan el octavo lugar.

    Cada una de las tendencias encaja en uno de estos tres temas principales

    1. Acelerar el cambio en los datos y el análisis: aprovechar las innovaciones en inteligencia artificial, mejorar la componibilidad y una integración más ágil y eficiente de fuentes de datos más diversas.
    2. Poner en funcionamiento el valor empresarial a través de XOps más eficaces: permite una mejor toma de decisiones y convierte los datos y el análisis en una parte integral del negocio.
    3. Todo distribuido: requiere la relación flexible de datos y conocimientos para empoderar a una audiencia aún más amplia de personas y objetos.

    Los grafos forman la base de los datos y análisis modernos ya que poseen capacidades para mejorar y mejorar la colaboración del usuario, los modelos de aprendizaje automático y la inteligencia artificial explicable. Aunque las tecnologías de gráficos no son nuevas para los datos y el análisis, ha habido un cambio en la forma de pensar en torno a ellas a medida que las organizaciones identifican un número cada vez mayor de casos de uso. De hecho, hasta el 50% de las consultas de los clientes de Gartner sobre el tema de la IA implican una discusión sobre el uso de la tecnología gráfica. 

    Desde 2019 podemos observar la presencia de los grafos como parte de las tendencias de Garner en el Hype Cycle que publican cada año. Tanto en 2019 como en 2020, el concepto de grafo de conocimiento o knowledge graph se situaba al alza en el ciclo.

     

    Es interesante resaltar la predicción que Garner realizaba en su informe de 2020: 

    "Para 2023, las tecnologías gráficas facilitarán la contextualización rápida para la toma de decisiones en el 30% de las organizaciones en todo el mundo. La analítica gráfica es un conjunto de técnicas analíticas que permite la exploración de relaciones entre entidades de interés como organizaciones, personas y transacciones. Esto ayuda a los líderes de datos y análisis a encontrar relaciones desconocidas en los datos y a revisar los datos que no se analizan fácilmente con los análisis tradicionales.

    Por ejemplo, a medida que el mundo se apresura a responder a las pandemias actuales y futuras, las tecnologías de gráficos pueden relacionar entidades en todo, desde datos geoespaciales en los teléfonos de las personas hasta sistemas de reconocimiento facial que pueden analizar fotos para determinar quién podría haber entrado en contacto con personas que luego probaron positivo para el coronavirus.

     

    Cuando se combinan con algoritmos de aprendizaje automático, estas tecnologías se pueden utilizar para examinar miles de fuentes de datos y documentos que podrían ayudar a los expertos médicos y de salud pública a descubrir rápidamente nuevos tratamientos o factores posibles que contribuyan a resultados más negativos para algunos pacientes.

    Los líderes de datos y análisis deben evaluar las oportunidades para incorporar análisis de gráficos en sus carteras y aplicaciones de análisis para descubrir patrones y relaciones ocultos. Además, considere investigar cómo los algoritmos y tecnologías de gráficos pueden mejorar sus iniciativas de IA y ML".

    Para más información, puedes consultar los tres análisis:

    ...

    Página Web

    /

    Publicado el 26.8.2019 por Equipo GNOSS

    ¿Cuál es la diferencia entre Grafo de Conocimiento y Base de Datos de Grafos? - Kingsley Idehen

    Kingsley Idehen, Fundador y CEO de Openlink, los creadores de Virtuoso, explica en Quora cuáles son las diferencias entre Grafos de Conocimiento (Knowledge Graph) y bases de datos de grafos (Graph Database).

    Para Idehen, un Grafo de Conocimiento es un tipo genérico de datos estructurados, operados por un Sistema de Gestión de Bases de Datos de Grafos usando algún tipo de lenguaje declarativo de interrogación (estándares como SQL, SPARQL u otros lenguajes propietarios).

    ...

    Página Web

    /

    Publicado el 7.5.2019 por Equipo GNOSS

    Wikidata y DBpedia: viaje al centro de la web de datos

    "A partir de Wikipedia, como fuente de conocimiento organizado en forma de artículos enciclopédicos, editada mediante la colaboración masiva online, se han desarrollado dos proyectos de carácter semántico: DBpedia y Wikidata. Se analizan las diferencias y similitudes entre ambos modelos de datos y modelo de producción, y se especula sobre la posible evolución y coexistencia de ambos a partir de sus puntos fuertes. Su fortaleza como grafo abierto de conocimiento multidominio aporta un gran valor a la extensión de la web de datos, al actuar como punto de interconexión entre diferentes dominios".
    Saorín, Tomás; Pastor-Sánchez, Juan-Antonio (2018). “Wikidata y DBpedia: viaje al centro de la web de datos". Anuario ThinkEPI , v. 12, pp. 207-214. https://doi.org/10.3145/thinkepi.2018.31

    ...

    Página Web

    /

    Publicado el 17.1.2019 por Equipo GNOSS

    Chomsky Knowledge Graph, el primer Grafo de conocimiento semántico para una figura pública

    Noam Chomsky, el filósofo, científico cognitivo, historiador, crítico social y padre de la lingüística moderna, ha escrito más de 1.000 artículos y 130 libros. El intelectual de 89 años también ha escrito películas y ha aparecido en muchos documentales. El trabajo sustancial que ha realizado en lingüística y política le ha valido el título de "autor vivo más citado".

    Todo su trabajo quedará reflejado en el Grafo de conocimiento de Noam Chomsky (Chomsky Knowledge Graph), el primer Grafo de conocimiento semántico para una figura pública. "Hacer un proyecto semántico de todo lo que ha escrito o dicho es un fabuloso homenaje a un hombre que ha hecho una gran contribución al estudio del lenguaje y su significado", dice Fred Davis, Director Ejecutivo del proyecto Chomsky Knowledge Graph.

    Franz Inc., con su tecnología AllegroGraph (bases de datos de grafos), y Semantic Web Company, desarrolladores de PoolParty Semantic Suite , son socios en el proyecto que se alojará en el Internet Archive.  Además de las obras publicadas, las entrevistas con los medios y las películas de Chomsky, el proyecto también incluirá documentos personales que ha donado al MIT, donde ha sido profesor durante 66 años.  

    El equipo comenzó a trabajar en el Chomsky Knowledge Graph hace aproximadamente un año y el plan, dice Davis, es lanzar una versión beta el próximo año y luego mejorarlo continuamente. Aproximadamente un tercio de los libros de Chomsky ya se han escaneado, y todavía está escribiendo. Por este motivo, no es de extrañar que el proyecto tenga aún cierto camino por recorrer. 

    Internet Archive, cuyo proyecto de Open Library está trabajando para construir un catálogo de biblioteca editable y abierto para cada libro publicado, fue designado recientemente como una biblioteca pública de los Estados Unidos y está ayudando a escanear el trabajo de Chomsky. Un investigador (o cualquier otra persona) que busque algo en el trabajo de Chomsky puede "revisar" uno de sus libros de la biblioteca, y la colección de su trabajo que estará disponible para el control continuará creciendo.

    "Internet Archive ha estado respaldando Internet durante 20 años", dice Davis. El Gráfico de conocimiento de Noam Chomsky será un proyecto piloto para la organización sin fines de lucro que analice el valor del análisis semántico de los datos que ha compilado.

    "Esperamos crear un nuevo tipo de herramienta", dice Davis. “Una Grafo de conocimiento es más precisa, accesible y valiosa que una simple biografía. Reúne todo lo que una persona ha escrito y hecho, y lo mejor de la tecnología semántica es la idea de vinculación profunda ".

    Los datos existentes no estructurados y estructurados de los libros de un autor o las transcripciones de videos, podcasts y similares se pueden vincular entre sí en una capa semántica. La información adicional de fuentes semánticas como dbPedia, Wikidata y Geonames también se puede incluir en modo triples RDF o en formatos de bases de datos semánticas para vincularse. 

    “Lo bueno de la tecnología semántica es que es más fácil agregar información nueva que si tiene una base de datos altamente estructurada. Esto se debe a la manera en que las cosas se almacenan en triples, donde hay un sujeto, un predicado y una relación de objeto, para que pueda aportar nueva información que se conecte instantáneamente con otra información ", dice el Dr. Jans Aasman, CEO de Franz.

    Las obras y fuentes de un autor que tienen una relación con otras de las obras del autor o con datos externos se podrán buscar en el contexto de los temas y conceptos, legibles en extractos y fácilmente disponibles para periodistas, científicos, tecnólogos, estudiantes, filósofos y historiadores y el público en general.  

    Hay un gran valor si Internet Archive comienza a aplicar la tecnología semántica al proyecto de la Open Library y a la WayBack Machine  que es la historia de la web. Incluso un enlace simple puede crear un recurso real y permitir consultas más sofisticadas. Con el enlace semántico en su lugar, la máquina Wayback también podría proporcionar una valiosa verificación de hechos.  

    La interconexión habilitada por la tecnología semántica entregada por AllegroGraph y PoolParty Semantic Suite permitirá descubrir, por ejemplo, que un término que habla de Chomsky se relaciona con otros términos, dice Aasman. 

    "Es posible descubrir cuáles son las relaciones ocultas en su pensamiento", indica. Como ejemplo, si una persona en el trabajo de Chomsky se discute muchas veces, existe una mayor probabilidad de que Chomsky también hable sobre el país en el que vive la persona. 

    Cuando el acceso al sitio web de Chomsky Knowledge Graph esté disponible, Davis espera poder agregar otras capacidades basadas en enlaces semánticos. Por ejemplo, cuando un usuario investiga y saca un pasaje de uno de sus libros, las notas finales se mostrarán justo al lado de la cita. "Debido a la naturaleza semántica, podría obtener citas mucho más relevantes", en primer lugar, dice. 

    Hasta el momento, Chomsky solo está involucrado tangencialmente en el proyecto, dice Davis, pero el próximo año, cuando una gran parte de su trabajo esté disponible en la Gráfica de conocimiento, el equipo podrá mostrarle algo muy poderoso para él (y otros).  

    "Este ha sido un trabajo de amor y pasión para nosotros", dice Davis. "Tenemos la esperanza de que esto sirva de inspiración para otros proyectos en áreas similares".

    ...

    Pdf

    /

    Publicado el 3.8.2018 por Equipo GNOSS

    Google: conocimiento basado en hechos. De enlaces a hechos. Knowledge based Trust. Un grafo de conocimiento "verdadero"

    En el año 2012, Google, en su blog, explicó como estaba transitando de la búsqueda por secuencia de caracteres a la búsqueda de entidades. En su artículo "Things, not Strings" explicaba la construcción de su Grafo de Conocimiento y como éste estaba condicionando la búsqueda, tras la compra dos años antes de Metaweb, empresa creadora de la gran base de entidades llamada Freebase.

    Siguiendo en esta línea y avanzando más, en el año 2015, como se expone en el resumen del paper que adjuntamos "Knowledge Based Trust: Estimating the Trustworthiness of Web Sources" escrito por Xin Luna Dong, Evgeniy Gabrilovich, Kevin Murphy, Van Dang, Wilko Horn, Camillo Lugaresi, Shaohua Sun, Wei Zhang, Google explica como está basándose en hechos y no tanto en links a la hora de seguir avanzando en la construcción de un Grafo de Conocimiento "verdadero".

    Así, los investigadores, apuntan en el resumen del paper que la calidad de las fuentes web se ha evaluado tradicionalmente utilizando señales exógenas como la estructura de los hipervínculos. Desde hace algún tiempo Google está identificando entidades del mundo y proponiendo un nuevo enfoque para sus búsquedas basado en señales endógenas, es decir, en la exactitud de la información objetiva proporcionada por la fuente. Una fuente que tiene pocos hechos falsos se considera confiable. Los hechos se extraen automáticamente de cada fuente mediante métodos de extracción comúnmente utilizados para construir bases de conocimiento (DBPedia, Yago, etc). Se está investigando la forma de distinguir errores cometidos en el proceso de extracción de entidades mediante el uso de inferencias conjuntas en un novedoso modelo probabilístico multicapa.


    Llaman puntaje de confiabilidad al cálculo basado en el conocimiento Confianza (KBT). En datos sintéticos, muestran que con este método pueden calcular los verdaderos niveles de confiabilidad de las fuentes. De este modo lo aplican
    luego a una base de datos con millones de hechos extraídos de la web, y así pueden estimar la confiabilidad de millones de páginas web.

    ...

    Pdf

    /

    Publicado el 1.8.2018 por Equipo GNOSS

    Xin Luna Dong, responsable de investigación del Product Graph de Amazon, expone en esta presentación algunos de los desafios más importantes con los que se están enfrentando a la hora de construir un Grafo de Productos que sea, ya no una parte o subconjunto del Knowledge Graph de Google, sino un Grafo de Productos con características y atributos propios. Todo ello, claro está, con el objetivo de responder mejor y dar una mayor satisfacción al usuario cuando quiere encontrar un producto. La misión es ofrecerle todo el conocimiento existente sobre este producto y ofrecer una experiencia digital mejorada que además le recomiende de forma pertinente ¿Qué otros libros, películas, artículos, han comprado las personas que también han comprado lo mismo que yo?

    En la presentación hace un recuento del conjunto de problemas y retos a los que se enfrentan para abordar este gran desafío:

    No hay fuentes estructuradas que ayuden a la creación del grafo de productos:

    • La Wikipedia ayuda poco, no está centrada en esto
    • Mucho texto estructurado está enterrado en el texto de la descripción del producto
    • Los minoristas y vendedores juegan con el sistema introduciendo ruido en los datos

    Se crean productos nuevos todos los días

    • La curación es imposible
    • Refrescar los nuevos productos es un gran desafío

    Hay un gran número de categorías de productos:

    • Definición muy manual de la ontología necesaria
    • Dificultad para capturar la tendencia de nuevas categorías de productos y sus propiedades

    Muchas entidades no son nombradas como entidades

    • No es aplicable el reconocimiento de entidades
    • Nuevos desafíos para la extracción, enlazado y búsqueda

    La presentación aborda los diversos escenarios de investigación que se están planteando.

    ...

    Página Web

    /

    Publicado el 1.8.2018 por Equipo GNOSS

    Thomson Reuters explica la importancia de construir un Grafo de Conocimiento

    En este artículo la compañia Thomson Reuters hace un repaso de qué es un Grafo de Conocimiento y la importancia que esto tiene en la configuración de la web actual y en las explotaciones para el negocio. Es un artículo divulgativo sobre el estado de la cuestión.

    Esto le da pie para explicar como su servicio de Knowledge Graph Feed permite a los clientes de Servicios Financieros acelerar sus estrategias digitales y de inteligencia artificial. El grafo de conocimiento con 2.000 millones de relaciones da vida a una visión completa del ecosistema financiero para que los usuarios puedan descubrir conocimiento sobre la base de las relaciones no previstas ni preadministradas que el grafo presenta.

    ...

    Página Web

    /

    Publicado el 1.8.2018 por Equipo GNOSS

    El Grafo de Conceptos de Microsoft

    El llamado Gráfico Conceptual de Microsoft intenta duplicar las diversas entidades existentes en el mundo. Se conforma como un gran grafo de conceptos, aprovechando la información  de miles de millones de páginas web y registros de búsqueda de años, aunque podemos decir que Google, Facebook, Amazon y otras empresas le llevan una ventaja considerable.

    https://concept.research.microsoft.com/Home/Introduction

    ...

    Página Web

    /

    Publicado el 1.8.2018 por Equipo GNOSS

    La construcción del Grafo de Conocimiento en Linkedin

    El director de Inteligencia Artificial de Linkedin explica en este artículo como Linkedin está construyendo su Grafo de Conocimiento.

    LinkedIn knowledge Graph es una gran base de conocimiento construida sobre "entidades" en LinkedIn, como miembros, trabajos, títulos, habilidades, compañías, ubicaciones geográficas, escuelas, etc. Estas entidades y las relaciones entre ellas forman la ontología del mundo profesional y son utilizados por LinkedIn para mejorar sus sistemas de recomendación, búsqueda, monetización y productos de consumo, negocios y análisis del consumidor.

    En este artículo el autor explica como aplican técnicas de Machine Learning para resolver los desafíos al crear el grafo de conocimiento, que es esencialmente un proceso de estandarización de datos sobre contenido generado por el usuario y fuentes de datos externas, en el que el aprendizaje automático se aplica:

    • la construcción taxonómica de entidades
    • la inferencia de relaciones entre entidades,
    • la representación de datos para consumidores de datos descendentes
    • la penetración de conocimiento (información) a partir del grafo 
    • la adquisición activa de datos de los usuarios para validar nuestra inferencia y recopilar datos de capacitación.

    El grafo de conocimiento de LinkedIn es un grafo dinámico. Las nuevas entidades se agregan al grafo y las nuevas relaciones se forman continuamente. Las relaciones existentes también pueden cambiar. Por ejemplo, el mapeo de un miembro a su título actual cambia cuando tiene un nuevo trabajo. Por tanto, hay que actualizar el grafo de conocimiento de LinkedIn en tiempo real cuando se produzcan cambios en el perfil de los miembros y nuevas entidades emergentes.

    ...

    Página Web

    /

    Publicado el 1.8.2018 por Equipo GNOSS

    Congreso: Grafos de Conocimiento en turismo

    El pasado 5 de junio de 2018 se celebró en Cáceres el TourismKG 2018, el primer workshop internacional que abordó la aplicación de Grafos de Conocimiento al sector de los viajes y el turismo. Este evento fue organizado por Ontology Engineering Group, responsables de la DBpedia del español, el mayor dataset semántico en nuestro idioma. En el mismo participó GNOSS exponiendo el proyecto realizado para Turismo de La Rioja.

     

    ...

    Categorías: