Recursos > procesamiento del lenguaje

    sortFiltrar Ordenar
    5 resultados

    Página Web

    /

    Compartido el 7.5.2009 por Ricardo Alonso Maturana

    El buscador Lexxe es un buscador basado en el procesamiento del lenguaje natural (tipo de buscadores que también se denominan "buscadores de tercera generación") que proporciona respuestas a preguntas concretas formuladas como tales, en lugar de con palabras clave. Cuando realizas una búsqueda en Lexxe en inglés en primer lugar te da una respuesta a tu pregunta. Por ejemplo: para la pregunta "Who is obama?" te ofrece la siguiente respuesta: "Answer: [1] Barack Hussein Obama II (; born August 4, 1961) is the junior United States Senator from Illinois and presidential nominee of the Democratic Party ... [2] An African (Luo) surname".
    Además, junto con la respuesta concreta, ofrece un conjunto de links que considera como resultados significativos en los que se puede encontrar la respuesta y crea grupos o categorías (cluster) para ordenar dichos enlaces. Puede considerarse que Lexxe funciona más o menos bien con preguntas sencillas de respuesta sencilla, pero cuando la cosa se complica puede que Lexxe no te de una respuesta adecuada.
    En español no parece poder calcular las respuestas concretas ni hacer búsquedas muy ajustadas, aunque sí realiza una propuesta de links y cluster que los agrupan.
    En los siguientes enlaces pueden leerse algunas valoraciones e información sobre este buscador:
    - Lexxe: Search Engine that Answers Queries, por Arun Radhakrishnan en Search Engine Journal.
    - Lexxe natural language search reviewed, en Panda Search Engine News.
    - Retrospective: My Day Without Google Fails to Impress, en Read Write Web (donde también habla del buscador Powerset).
    - Lexxe Search Technology, donde la propia empresa explica de forma resumida en qué consiste la tecnología que emplea Lexxe para realizar las búsquedas y generar las respuestas.

     

    ...

    Página Web

    /

    Compartido el 7.5.2009 por Ricardo Alonso Maturana

    Cognition's Semantic Natural Language Processing (NLP) adds word and phrase meaning and understanding to applications like Semantic Search.

    Cognition Technologies es una empresa con sede en Culver City (California) que se dedica a las tecnologías de procesamiento del lenguaje natural (Natural Language Processing, NLP), proyecto en desarrollo desde hace más de 23 años por la Dra. Kathleen Dahlgren, cofundadora de Cognition y CTO, y por un equipo de lingüistas y científicos computacionales.
    En 2007 la empresa lanzó el buscador semántico CognitionSearch, que emplea algoritmos lingüísticos y computacionales para analizar relaciones y asociaciones entre palabras clave con el fin de proporcionar resultados significativos y más precisos que atiendan al contexto de la búsqueda. La tecnología está basada en:
    - Ontología: para descifrar el sentido de una palabra
    - Morfología: para desambiguar las diferentes formas de una palabra (p.e. posible de posibilidad)
    - Sinonimia: para relacionar palabras con conceptos.
    El idioma en el que opera Cognition es inglés y ha seleccionado tres áreas temáticas para aplicar inicialmente su tecnología: salud (MEDLINE, PubMed, etc.), legislación y política. La base de datos que emplea el buscador contiene: 506.000 raíces de palabras, 536.000 conceptos, 17.000 palabras ambiguas, 191.000 frases y más de 4.000.000 de frases semánticas.
    Aquí hay un par de vídeos de demostración en los que explican cómo funciona la tecnología y la búsqueda de Cognition.
    Puedes leer también sobre Cognition en este review de Barbara Quint (abril de 2007) y en la revista Search Engine Journal: "Cognition Search: Doing Search the Not so Google Way", por Arnold Zafra (marzo de 2007), "Cognition Search: Formula for 'Meaning' in Search", por Arun Radhakrishnan (julio de 2007).

    ...

    Página Web

    /

    Compartido el 5.5.2009 por Ricardo Alonso Maturana

    Wolfram Alpha es un motor computacional que da respuestas concretas a preguntas en lenguaje natural, lo que va en contra de todo lo que se ve hoy en día en los buscadores y en la lógica de Internet. Lo más extraño de esto es que no usa ninguna tecnología de la Web Semántica. Este buscador lo está desarrollando Stephen Wolfram, creador de Mathematica y autor del libro A New Kind of Science. El objetivo de este proyecto, que está previsto que salga este mes (mayo 2009), es el de crear un sistema al cual le podamos hacer preguntas sobre hechos y este nos las responda. Pero no porque disponga de una enorme lista con respuestas, sino que sea capaz de calcularlas a partir de una serie de bases de datos y de algoritmos, heurísticas y conocimiento sobre ciertos campos introducido por expertos humanos. De este modo, podremos hacer preguntas como "cuál es la media de precipitación anual en España" o "cuál ha sido valor máximo de las acciones de Google" y el sistema nos calcula la respuesta. Para ello se han implementado métodos y modelos que convierten el conocimiento (de momento solo en ciertas áreas) en computable, una tarea complicada y que requiere la intervención de expertos humanos en cada uno de esos campos.
    En resumen, Wolfram Alpha no quiere ser otro nuevo buscador, sino un computador de conocimiento. Por ello, solo es capaz de dar respuestas objetivas y factuales. No tiene respuesta a preguntas como "cuál fue el mejor presidente de Estados Unidos" u otras que no impliquen respuestas que se puedan calcular.

     

    ...

    Página Web

    /

    Compartido el 5.5.2009 por Ricardo Alonso Maturana

    Powerset es un buscador basado en el procesamiento del lenguaje natural que ha sido desarrollado socialmente; la empresa que promueve este proyecto apuesta por una comunidad abierta de desarrolladores que en un número de 10.000 están colaborando con el ambicioso objetivo de "sustituir el corazón de los motores de búsqueda". En el verano de 2008 la empresa y la tecnología fueron adquiridas por Microsoft, que utilizará esta tecnología en el motor de búsqueda de Windows Live.
    Su objetivo es encabezar la nueva generación de buscadores "inteligentes", que permitirán contextualizar las búsquedas, basándose en el lenguaje natural de las personas. Por ejemplo, si buscas "Libros para Niños",  en teoría el objetivo de Powerset es entender el significado de la frase que se ha escrito y entender que estás buscando Libros para Niños, en lugar de ofrecerte resultados de búsquedas que tengan las palabras clave "Libros" y "Niños".
    Este proyecto, que comenzó en 2005, fue lanzado al público en mayo de 2008. Su única aplicación comercial hasta la fecha es una herramienta que permite realizar búsquedas sobre wikipedia.

     

     

    ...