facetas
Tipo de contenido

Recursos > open+data

    sortFiltrar Ordenar
    17 resultados

    Artículo

    /

    Compartido el 13.11.2014 por Pablo Hermoso de Mendoza González

    La Web Semántica y sus aplicaciones. Linked Data y su evolución

    En junio de 2013, Andrés Pedreño, fundador de la Biblioteca Virtual Miguel de Cervantes e impulsor como CEO de Universia (2000-2004), nos invitó a participar en UniMOOC, una plataforma de cursos gratuitos para emprendedores promovida por varias universidades españolas y grandes instituciones privadas.

    Ricardo Alonso Maturana, CEO de GNOSS, compartió con los alumnos de la Universidad de Alicante, en una sesión grabada, los motivos que le llevaron a la creación de GNOSS. Hizo un repaso de las principales caraterísticas que definen la Web Semántica y Linked Open Data, que son las tecnologías, estandares y herramientas utilizadas como base para la creación de GNOSS. 

    Recopilamos aquí el conjunto de videos que conforman dicha intervención en la que se expone:

    ...

    Página Web

    /

    Compartido el 22.10.2012 por Equipo GNOSS

    Data Journalism and Visualization (Open Knowledge Foundation)

    Selección de vídeos del OK Festival (Open Knowledge Foundation) en el que se incide en las posibilidades de los datos y la web semántica en el trabajo del periodista:

    "The Data Journalism and Data Visualization stream combines two closely-related disciplines for hands-on practical sessions, discussions, demonstrations and debates. The stream will kick off on Monday with two satellite events, Visualizing Knowledge and Hacks/Hackers Helsinki. During the festival itself, join us to learn how to make data pretty, with tools demos and a session on using APIs for journalists. Join the debates on how to bring data journalism in the newsroom and make open data mainstream, and on how to use it to track powerful influence groups in the media. Our week ends with a Hackday co-organized with Helsingin Sanomat, pioneers of combining Open Data and Journalism in Finland. Whether you are a Hack, a Hacker or an interested bystander, we’ll make you into a data journalist – join us!"

    ...

    Página Web

    /

    Publicado el 20.8.2012 por Equipo GNOSS

    Libro de Luis Criado, 'Nosotros, los constructores de la Web Semántica'

    Luis Criado, ingeniero de Telecomunicación por la Universidad Alfonso X El Sabio (2001), doctor por la UNED (2009) y autor de la herramienta conocida como sw2sws, elabora en la actualidad un libro sobre la web semántica. El proyecto se titula 'Nosotros, los constructores de la web semántica' y el índice sobre el que está trabajando es el siguiente:

     

    CAPÍTULO 1: QUÉ ES LA WEB SEMÁNTICA Y HACIA DONDE NOS LLEVA
    1.1. QUÉ ES   
    1.2. ALCANCE   
    1.3. PARA QUÉ PUEDE SERVIR.   
    1.4. BREVE HISTORIA DEL MAYOR REPOSITORIO DE INFORMACIÓN DE LA HUMANIDAD.   
    1.5. LA WEB, LA NUEVA BIBLIOTECA DE ALEJANDRÍA.   
    1.6. INTELIGENCIA ARTIFICIAL Y WEB SEMÁNTICA   
    1.6. DAFO DE LA WEB SEMÁNTICA   
    1.7. EL PROBLEMA PARA IMPLANTAR LA WEB SEMÁNTICA   
    1.8. ANOTACIÓN SEMÁNTICA Y ENLAZADO DE DATOS, CLAVE PARA EL NUEVO PARADIGMA WEB   
     
    CAPÍTULO 2: DISEÑO Y UTILIZACIÓN DE ONTOLOGÍAS.   
    2.1. QUÉ ES UNA ONTOLOGÍA EN EL ÁMBITO DE LA WEB SEMÁNTICA.   
    2.2. ESTANDARES DE REPRESENTACIÓN.   
    2.2.1 XML   
    2.2.2 Semántica sobre XML   
    2.2.3 Semántica sobre RDF/RDFS   
    2.2.5 OWL 1   
    2.2.6 Semántica con OWL 1   
    2.2.7 OWL 2   
    2.2.8 RDFa   
    2.2.9 SPARQL   
    2.3. HERRAMIENTAS PARA DEFINIR ONTOLOGÍAS; PROTÉGÉ   
    2.3.1. Instalando y probando Protégé.   
    2.3.2. Clases y propiedades (LT).   
    2.3.3. Instancias (LT).   
     
    CAPÍTULO 3: Construyendo la Web Semántica
    3.1 QUÉ ES LA ANOTACIÓN SEMÁNTICA.   
    3.2. LA SUTIL DIFERENCIA ENTRE ANOTAR Y POBLAR ONTOLOGÍAS.   
    3.3. QUIEN ANOTA, QUIEN PUEBLA, QUIEN EXPLOTA.   
    3.4. HACIA DATOS ABIERTOS; ACCESIBLES Y REUTILIZABLES. OPEN DATA.   
    3.5. ENLAZADO DE DATOS.   
    3.6. REGLAS DE LINKED DATA   
    3.7. EXCELENCIA TECNOLÓGICA EN DATOS ABIERTOS. LAS CINCO ESTRELLAS.   
    3.9 REFLEXIONES SOBRE COHERENCIA EN EL CONTENIDO DE LA WEB SEMÁNTICA.   
     
    CAPÍTULO 4: CÓMO FORMALIZAMOS DATOS SEMÁNTICOS.   
     
    CAPÍTULO 5: EXPLOTAR LOS DATOS DE LA WEB SEMANTICA. SPARQL
     
    CAPÍTULO 6: EL DESARROLLADOR.
    Programación Java (Sesame, Jena)
    Repositorios de tripletas (TDB, SDB, Virtuoso, etc...)
     
    CAPITULO 7: QUIEN SE INTERESA YA POR LA WEB SEMANTICA.

    ...

    Pdf

    /

    Publicado el 30.7.2012 por Pablo Hermoso de Mendoza González

    En esta presentación realizada en el Museo Británico el 13 de enero de 2011 por Leif Isaksen, Kirk Martinez y  Graeme Earl de la Universidad de Southampton,  se hace un resumen de los datos obtenidos tras cursar una encuesta a más de 60 profesionales que trabajan en el ámbito del patrimonio cultural en el mundo, al respecto del uso de la Web Semántica en su trabajo y de su adecuación y enfoque hacia la linked open data web.

     

    ...

    Categorías:

    Página Web

    /

    Publicado el 27.4.2012 por Equipo GNOSS

    US government deploys open data standards created in Ireland

    El gobierno de los Estados Unidos ha adoptado un conjunto de herramientas y estándares de Web semántica desarrollados en Irlanda por investigadores de la Universidad Nacional de Irlanda en el centro Digital Enterprise Research Institute (DERI).

    Estas tecnologías están siendo utilizadas en el portal Data.gov permitiendo conectar datos que no estaban vinculados y vincular estos datos con otros de  organizaciones públicas y privadas.

    ...

    Categorías:

    Página Web

    /

    Compartido el 19.9.2011 por Equipo GNOSS

    GNOSS y Didactalia en la edición de Septiembre de 2011 de 'The Linking Open Data cloud diagram'

    GNOSS y Didactalia ya forman parte oficialmente de 'The Linking Open Data cloud diagram', que recoge todas aquellas webs, proyectos... que están abiertas y enlazables en la 'nube de los datos'Acceso directo a la LOD cloud 

    GNOSS & Didactalia in Linking Open Data Cloud (September 2011):

     

    ...

    Página Web

    /

    Publicado el 15.3.2011 por Pablo Hermoso de Mendoza González

    Red temática Open link Data

    En los últimos años, varios grupos de investigación en España han comenzado a trabajar en el área del Linked Data. Estos grupos participan por separado tanto en importantes iniciativas y consorcios europeos, como en colaboraciones con empresas e instituciones nacionales e internacionales.

    ...

    Página Web

    /

    Compartido el 15.3.2011 por Pablo Hermoso de Mendoza González

    Nace la Red Temática Española de Linked Data

    Una veintena de grupos de investigación españoles, que aglutinan a más de 150 investigadores de 18 universidades, han creado la Red Temática Española de Linked Data, con la finalidad de facilitar el intercambio y transferencia de conocimientos, incluso con investigadores españoles que se encuentren trabajando en el extranjero en áreas relacionadas, así como de aumentar la visibilidad internacional de la investigación española.

    ...

    Página Web

    /

    Compartido el 28.7.2010 por Ricardo Alonso Maturana

    Magnífica reflexión de Oliver Marks sobre la la Web 2.0 Expo celebrada a principios de mayo en San Francisco. El futuro es la Web Semántica, entendida como Linked Open Data Web. Una de las consecuencias más importantes de su extensión (en los próximos 2 o 3 años) será que nuestra experiencia de búsqueda cambiará de manera radical: no estará basada en criterios de relevancia, sino en la acumulación de contextos y su interpretación en función de las demandas iteradas de los usuarios. Completamente recomendable.

    "I attended last week’s Web 2.0 Expo in San Francisco with a sense of trepidation. A year ago this event was jam packed and had a celebratory, in some cases cocky atmosphere - I was worried this time the expo would be a washout as a result of the gloomy economy. in the event it was a far more mature, sober but well attended affair. As the always entrepreneurial Brian Zisk said to me at one point, times like these are when the real innovation and next generation business successes are spawned"

    ...

    /

    Compartido el 14.6.2010 por Equipo GNOSS

    El proceso general de digitalización de la realidad está generando una capa de representación de la totalidad de las cosas y personas, pero también, y esto resulta especialmente relevante, de sus relaciones. A, por ejemplo, ‘Juan Rulfo’ y, pongamos, ‘El llano en llamas’ les une el hecho de que el primero es el AUTOR del segundo, lo que queda expresado mediante la proposición: ‘Juan Rulfo es el autor de ‘El llano en llamas’ Como veremos, la web semántica posibilita computar (deducir, razonar, buscar...) con proposiciones de ese tipo, lo que ofrece grandes posibilidades. Cuando disponemos de los datos y de sus relaciones organizados de acuerdo con los lenguajes de la web semántica (de los que he hablado en ¿Mis datos en manos de terceros? Ventajas de expresar contenidos con estándares de la web semántica), decimos que “los datos están estructurados". Por desgracia, la mayor parte de los datos de la web no están expresados de ese modo. Sin embargo también están estructurados, aunque no del modo en el que lo entienden las máquinas. Buena parte del trabajo consiste, precisamente, en convertir nuestros documentos HTML, .doc, etc...en datos estructurados. En cualquier caso y en buena medida, todos nuestros datos los estamos organizando de forma útil para las personas gracias a las redes sociales. De hecho, construir una web más inteligente parece la condición necesaria para manejar y utilizar de manera eficiente esa enorme y creciente cantidad de datos que está produciendo la actividad humana en las redes. A esta clase de datos categorizados y organizados gracias al trabajo social de las redes les llamaremos Social Data.

     

    Social Data

    Habitualmente los Social Data incorporan el punto de vista de las personas que los editan, o bien, dependiendo de su naturaleza, el de un grupo. Esta información que añade información a una información original suele conocerse con el nombre de metadatos. Los Social Data son, por tanto, metadatos construidos gracias al trabajo social en la red de las personas. Las colecciones de metadatos más habituales en las redes sociales son conocidas por el nombre de folksonomías, que expresan el punto de vista personal o la perspectiva personal con relación a una información o documento determinado. En ocasiones, las redes sociales, en especial cuando se trata de redes profesionales, incluyen puntos de vista más normativos para calificar la información: las taxonomías o los tesauros. La acción de asignar un determinado metadato a una información o documento se conoce con el nombre de etiquetar. El etiquetado social es la fuente primaria de producción de Social Data.

     

    Google es demasiado idiota para entender lo que la gente necesita

    Dado que la racionalidad humana tiene un carácter intencional o finalista, los Social Data aportan una información muy relevante a la hora de recuperar la información con una determinada finalidad o intención. Este es el modo general en el que los humanos desean recuperar información, pero no el modo en el que resuelven este problema los sistemas y buscadores. Pensemos por ejemplo en nuestra experiencia de búsqueda y recuperación de información con Google, el buscador más extendido. Google nos ofrece como resultado de una búsqueda una, habitualmente larga, lista de resultados o posibilidades ordenados en función de la relevancia que atribuye a cada uno de ellos. Eso no estaría mal en primera instancia, pero lamentablemente es todo lo que podemos hacer con Google: no podemos hacer una segunda pregunta relacionada con la primera. Imaginemos que me gustaría conocer qué hay sobre ‘buscadores semánticos que utilicen procesamiento del lenguaje natural y, además, lógica borrosa, escrito por mujeres en 2008, en alguna universidad de California o en San Francisco y alrededores’. Podemos intentarlo introduciendo en la barra del buscador "buscador+semántico+procesamiento+del+lenguaje+natural+lógica+borrosa+san+francisco+2008", pero como puede imaginar casi cualquiera el resultado puede resultar sorprendente. En todo caso, a nadie se nos ocurriría utilizar ‘mujer’ o ‘alrededores’ o ‘alguna universidad de california’ como criterio de recuperación de información, porque conociendo a Google no resulta una expectativa razonable.

     

    Google padece el síndrome del savant o del sabio. Es un idiota con algunas capacidades muy desarrolladas, un idiota inteligente capaz de comparar todos los caracteres de un texto con la secuencia que le proponemos, pero incapaz de entender lo que le solicitamos. En nuestro ejemplo, las categorías ‘documentos escritos por mujeres’ o ‘producidos en una universidad de california’ son difícilmente traducibles a una secuencia de caracteres que ofrezca la perspectiva de un conjunto de resultados aceptable. ¿Por qué no podemos interrogar a nuestro buscador sucesivamente, tal y como hacemos en nuestra vida ordinaria, para resolver problemas que requieren manejar grandes cantidades de información? Nuestro cerebro no está diseñado para manejar enormes cantidades de información, sino relativamente poca pero significativa; por eso nuestra razón produce como resultado de nuestras indagaciones largas listas ordenadas por relevancia, sino que opera estableciendo sucesivas condiciones o restricciones crecientes que nos conducen a un resultado o a unos pocos cuyo valor relativo pueda establecerse de un sólo golpe de vista. En una partida de ajedrez, nadie en su sano juicio consideraría una estrategia razonable el ordenar en una lista en función de sus posibilidades de conducir a la victoria, todas las posibles jugadas vinculadas con una posición dada de las fichas. Obviamente lo puede hacer Deep Blue, pero los humanos carecen de esa capacidad para computar. A cambio ‘saben lo que quieren’, lo que les permite considerar sólo la información útil para ese fin. 

     

    Contextos de interpretación de la información que pueden ser entendidos por las máquinas

    Los Social Data añaden un contexto explícito de interpretación a cualquier información o documento, por lo que constituyen el elemento social de la dimensión semántica de la web. La semántica de la web se construye según vemos social o colectivamente y esa información es útil porque las personas no son demasiado diferentes. 

    Una ontología concreta expresa un modo de categorizar, modelar o representar nuestro conocimiento con relación a un campo, entidad u objeto determinado. Lo normal es que las ontologías representen las entidades, que en nuestro lenguaje natural son denotadas mediante los nombres propios y comunes, y sus relaciones. Como lo hacemos en un lenguaje que puede ser ‘comprendido’ por las máquinas, éstas pueden entenderse entre sí (interoperar o intercambiar datos con independencia de los formatos de almacenamiento y de las aplicaciones de gestión), pero también ‘entendernos’ e interactuar con nosotros de manera inteligente; también podemos verlo al revés, gracias a las convenciones de la web semántica nosotros podemos conversar con ellas utilizando nuestras capacidades de un modo natural, esto es, podemos razonar con ellas. ¡Esto representa una gran oportunidad para todos, que se añade a las que ofrecía el etiquetado social!

    En la práctica, hay muchas cosas que necesitan conocer los sistemas, especialmente en el contexto de una red social, para poder comunicarse con sentido con las personas y para que interoperen con otros sistemas. Para que esto sea realmente posible,  precisamos que todos ellos hablen con las mismas palabras, esto es, que utilicen las mismas ontologías. A estas ontologías sobre las que existe un acuerdo (que puede ser universal, muy amplio o...menos amplio) las denominamos vocabularios. Algunos vocabularios de carácter muy general resultan especialmente importantes. Dado que los sistemas funcionan sobre la base de documentos digitalizados y descripciones de personas, las ontologías que representan nuestra idea general de lo que es un recurso o documento digital, las que modelan la descripción de una persona y aquellas que describen un sistema de categorías o tesauro resultan especialmente importantes porque permiten conectar a la mayor parte de las entidades que existen en la webEllas representan del modo más inclusivo a casi cualquier contenido que puede encontrarse en internet y por ello hacen que las máquinas y los sistemas puedan interoperar entre sí con pocas restricciones.

    La web semántica puede definirse como el conjunto de convenciones que hace posible estructurar los datos contenidos en los distintos formatos de documentos (que generalmente están desestructurados, lo que en realidad significa que no pueden interpretarlos las máquinas), con el fin de que tanto las máquinas como las personas puedan interactuar (interoperar) entre sí de un modo más humanizado, intuitivo, eficiente y satisfactorio que lo que sucedía con la web basada en la computación. Es la base para el desarrollo de una web más inteligente y...autoconsciente.

     

    Open Data y Linked Data

    Open Data designa una filosofía y práctica que persigue que determinados datos estén disponibles de forma libre a todo el mundo, sin restricciones de copyright, patentes u otros mecanismos de control. Los datos pueden estar abiertos y, cuando no se utilizan los estándares de la web semántica, no resultar aprovechables por terceros.

    Aún cuando los datos de una determinada aplicación web se expresen de acuerdo con los estándares de la web semántica caben diversas posibilidades:

    • Los datos pueden ser abiertos, pero no estar enlazados
    • Los datos pueden ser enlazados, pero no estar abiertos

    La posibilidad de datos que sean tanto abiertos como enlazados es cada vez más viable, tanto desde el punto de vista tecnológico, como de negocio. La Web Semántica sólo puede funcionar con datos que sean tanto abiertos como enlazados. Nos referimos a esto en un post anterior. La figura representa el grafo del conjunto de iniciativas y aplicaciones enlazadas que constituyen la Linked Data Web o de la Web de los datos abiertos y enlazados

    Linked Data Web implica una manera de publicar contenidos en la Web que:

    •  favorece la reutilización
    •  reduce la redundancia
    •  maximiza la conectividad (real y potencial)
    •  hace posible el “efecto red” a la hora de añadir valor a los datos

     

    En definitiva:                                                    Linked Data = Open Data + Open Standars

     

    La web semántica tiene ya un tamaño considerable, que irá aumentando a medida en la que se vayan estructurando los datos de más espacios de la web (a la par que se crean espacios con los datos ya estructurados). Los datos estructurados permiten estrategias de búsqueda que en lugar de ordenar una lista de posibles soluciones en función de la relevancia (en lugar de obligar a los humanos a entender la lógica de las máquinas), permite ir razonando hasta localizar el resultado o pequeño número de resultados que responde a las restricciones o condiciones del razonamiento. En definitiva, permiten las búsquedas basadas en el razonamiento o búsquedas facetadas.

    Por otro lado, la web semántica posibilita ofrecer como resultado de una determinada búsqueda el conjunto de contextos relacionados con ella, como por ejemplo personas relacionadas, documentos relacionados, imágenes relacionas, etiquetas o metadatos relacionados, etc…Esto posibilita el poder desarrollar y evolucionar las búsquedas desde la perspectiva humana de la exploración.

    En resumen, Linked Data Web sería:

    •          Base de datos global
    •          Diseñada para que las máquinas ‘hablen’ y ‘piensen’ al modo humano·         Los objetos que maneja y conecta representan cosas (como personas, películas, imágenes, libros, plantas, etc…, esto es, cualquier cosa que podamos representar mediante una ontología) y no, como ocurre en la web HTML, documentos (páginas web)
    •          Los enlaces representan relaciones entre entidades o 'cosas'
    •          Para ello se precisa de un alto grado de estructuración en las descripciones de esas entidades
    •          Es preciso, por tanto, que la semántica de las cosas sea explícita

    Las tecnologías o estándares asociados con su desarrollo serían: URIs, HTTP, RDF, RDFS/OWL

     

    El siguiente grafo muestra el conjunto de iniciativas que forman parte de la web semántica y sus diferentes grados de interacción


     

     

    www.gnoss.com es un sistema de redes sociales enlazadas cuya ontología se expresa de acuerdo con los estándares de la web semántica. gnoss.com, además de ser un espacio Open Data, es un espacio de Linked Data, esto es, sus datos son enlazables, interpretables y expresables desde cualquier web que trabaje dentro de los estándares de la web semántica. Pero la web semántica son, en el fondo, social data pues la semántica expresa siempre un acuerdo formal o informal entre personas: no hay posibilidades de entendernos sin una idea común acerca del significado de las palabras. Esta semántica se va construyendo, es un ‘work in progress’ que se puede expresar de diferentes modo, pero que finalmente, dentro de la lógica evolutiva de la web semántica, tiende a concretarse en vocabularios estándar. Estos estándares son los que en el corto y medio plazo se irán imponiendo para resolver los profundos problemas de aislamiento a los que nos somete el no hacerlo así. Los sistemas de salud, las administraciones públicas y las grandes corporaciones están asumiendo la necesidad de trabajar con ellos si quieren aprovechar el potencial de sus sistemas y de la relación entre ellos y las personas. Poco a poco lo irán haciendo el resto de las empresas y personas. 

     

    Imagen: linkeddata.org 

     

    ...