Cargando ...
A Cross-Lingual Dictionary for English Wikipedia Concepts
21/05/2012
Google ha anunciado un recurso muy interesante para la investigación sobre la extracción de información de un texto. 175 millones de cadenas de texto cortos y únicos que se han utilizado para referirse a 7.6 millones de artículos de Wikipedia.
Los investigadores de google consideran cada artículo de Wikipedia como la representación de un concepto (una entidad o una idea), identificado por su dirección URL. El conjunto de datos contiene triples, cada uno consistente en (i) el texto, una cadena corta en lenguaje natural (ii) url del artículo habitual de Inglés Wikipedia; y (iii), un entero que indica el número de veces que el texto se ha observado conectado con el concepto de la url. A este entero le llaman medida de la asociación.
La base de datos puede ser descargada aquí.
Tags:
Copyright
- The original license is kept.
- Web 3.0 (vídeo en español)
- Web Semántica (vídeo en inglés)
- Introducing Linked Data And The Semantic Web
- Linked Open Data: The Essentials book
- Industrialized Linked Data
- Cómo reutilizar Open Linked Data
- Semantic Web Standards Wiki
- RDF Pro: Complete Semantic Web Tools Suite
- Could data save newspapers?
- Búsquedas facetadas