Uso de cookies

GNOSS usa cookies, propias y de terceros, con finalidad principalmente técnica y necesaria para prestación de nuestros servicios y mostrarles contenido relevante. Más información en nuestra política de cookies.

ACEPTA para confirmar que has leído la información y aceptado su instalación. Puedes modificar la configuración de tu navegador.

13 results

Published by Equipo GNOSS

12/07/2021

Los Grafos de Conocimiento siendo tendencia según el informe de Garner de 2021. Son un total de 10 las tendencias de datos y análisis, de las cuales los grafos de conocimiento ocupan el octavo lugar.

Cada una de las tendencias encaja en uno de estos tres temas principales

  1. Acelerar el cambio en los datos y el análisis: aprovechar las innovaciones en inteligencia artificial, mejorar la componibilidad y una integración más ágil y eficiente de fuentes de datos más diversas.
  2. Poner en funcionamiento el valor empresarial a través de XOps más eficaces: permite una mejor toma de decisiones y convierte los datos y el análisis en una parte integral del negocio.
  3. Todo distribuido: requiere la relación flexible de datos y conocimientos para empoderar a una audiencia aún más amplia de personas y objetos.

Los grafos forman la base de los datos y análisis modernos ya que poseen capacidades para mejorar y mejorar la colaboración del usuario, los modelos de aprendizaje automático y la inteligencia artificial explicable. Aunque las tecnologías de gráficos no son nuevas para los datos y el análisis, ha habido un cambio en la forma de pensar en torno a ellas a medida que las organizaciones identifican un número cada vez mayor de casos de uso. De hecho, hasta el 50% de las consultas de los clientes de Gartner sobre el tema de la IA implican una discusión sobre el uso de la tecnología gráfica. 

Desde 2019 podemos observar la presencia de los grafos como parte de las tendencias de Garner en el Hype Cycle que publican cada año. Tanto en 2019 como en 2020, el concepto de grafo de conocimiento o knowledge graph se situaba al alza en el ciclo.

 

Es interesante resaltar la predicción que Garner realizaba en su informe de 2020: 

"Para 2023, las tecnologías gráficas facilitarán la contextualización rápida para la toma de decisiones en el 30% de las organizaciones en todo el mundo. La analítica gráfica es un conjunto de técnicas analíticas que permite la exploración de relaciones entre entidades de interés como organizaciones, personas y transacciones. Esto ayuda a los líderes de datos y análisis a encontrar relaciones desconocidas en los datos y a revisar los datos que no se analizan fácilmente con los análisis tradicionales.

Por ejemplo, a medida que el mundo se apresura a responder a las pandemias actuales y futuras, las tecnologías de gráficos pueden relacionar entidades en todo, desde datos geoespaciales en los teléfonos de las personas hasta sistemas de reconocimiento facial que pueden analizar fotos para determinar quién podría haber entrado en contacto con personas que luego probaron positivo para el coronavirus.

 

Cuando se combinan con algoritmos de aprendizaje automático, estas tecnologías se pueden utilizar para examinar miles de fuentes de datos y documentos que podrían ayudar a los expertos médicos y de salud pública a descubrir rápidamente nuevos tratamientos o factores posibles que contribuyan a resultados más negativos para algunos pacientes.

Los líderes de datos y análisis deben evaluar las oportunidades para incorporar análisis de gráficos en sus carteras y aplicaciones de análisis para descubrir patrones y relaciones ocultos. Además, considere investigar cómo los algoritmos y tecnologías de gráficos pueden mejorar sus iniciativas de IA y ML".

Para más información, puedes consultar los tres análisis:

Published by Equipo GNOSS

03/08/2018

En el año 2012, Google, en su blog, explicó como estaba transitando de la búsqueda por secuencia de caracteres a la búsqueda de entidades. En su artículo "Things, not Strings" explicaba la construcción de su Grafo de Conocimiento y como éste estaba condicionando la búsqueda, tras la compra dos años antes de Metaweb, empresa creadora de la gran base de entidades llamada Freebase.

Siguiendo en esta línea y avanzando más, en el año 2015, como se expone en el resumen del paper que adjuntamos "Knowledge Based Trust: Estimating the Trustworthiness of Web Sources" escrito por Xin Luna Dong, Evgeniy Gabrilovich, Kevin Murphy, Van Dang, Wilko Horn, Camillo Lugaresi, Shaohua Sun, Wei Zhang, Google explica como está basándose en hechos y no tanto en links a la hora de seguir avanzando en la construcción de un Grafo de Conocimiento "verdadero".

Así, los investigadores, apuntan en el resumen del paper que la calidad de las fuentes web se ha evaluado tradicionalmente utilizando señales exógenas como la estructura de los hipervínculos. Desde hace algún tiempo Google está identificando entidades del mundo y proponiendo un nuevo enfoque para sus búsquedas basado en señales endógenas, es decir, en la exactitud de la información objetiva proporcionada por la fuente. Una fuente que tiene pocos hechos falsos se considera confiable. Los hechos se extraen automáticamente de cada fuente mediante métodos de extracción comúnmente utilizados para construir bases de conocimiento (DBPedia, Yago, etc). Se está investigando la forma de distinguir errores cometidos en el proceso de extracción de entidades mediante el uso de inferencias conjuntas en un novedoso modelo probabilístico multicapa.


Llaman puntaje de confiabilidad al cálculo basado en el conocimiento Confianza (KBT). En datos sintéticos, muestran que con este método pueden calcular los verdaderos niveles de confiabilidad de las fuentes. De este modo lo aplican
luego a una base de datos con millones de hechos extraídos de la web, y así pueden estimar la confiabilidad de millones de páginas web.

Published by Equipo GNOSS

01/08/2018

Xin Luna Dong, responsable de investigación del Product Graph de Amazon, expone en esta presentación algunos de los desafios más importantes con los que se están enfrentando a la hora de construir un Grafo de Productos que sea, ya no una parte o subconjunto del Knowledge Graph de Google, sino un Grafo de Productos con características y atributos propios. Todo ello, claro está, con el objetivo de responder mejor y dar una mayor satisfacción al usuario cuando quiere encontrar un producto. La misión es ofrecerle todo el conocimiento existente sobre este producto y ofrecer una experiencia digital mejorada que además le recomiende de forma pertinente ¿Qué otros libros, películas, artículos, han comprado las personas que también han comprado lo mismo que yo?

En la presentación hace un recuento del conjunto de problemas y retos a los que se enfrentan para abordar este gran desafío:

No hay fuentes estructuradas que ayuden a la creación del grafo de productos:

  • La Wikipedia ayuda poco, no está centrada en esto
  • Mucho texto estructurado está enterrado en el texto de la descripción del producto
  • Los minoristas y vendedores juegan con el sistema introduciendo ruido en los datos

Se crean productos nuevos todos los días

  • La curación es imposible
  • Refrescar los nuevos productos es un gran desafío

Hay un gran número de categorías de productos:

  • Definición muy manual de la ontología necesaria
  • Dificultad para capturar la tendencia de nuevas categorías de productos y sus propiedades

Muchas entidades no son nombradas como entidades

  • No es aplicable el reconocimiento de entidades
  • Nuevos desafíos para la extracción, enlazado y búsqueda

La presentación aborda los diversos escenarios de investigación que se están planteando.

Loading...

Loading...