Patentes

   Aplicaciones a medida relacionadas con Extracción de Información

   Tecnologías de Voz

   Acceso a Bases de Datos en Lenguaje Natural

   Aplicaciones basadas en Diccionarios Electrónicos

Patentes

Jesús Martínez Barbero, Eugenio Santos Menendez. Patente P200802356, “Método de transmisión de contenidos multimedia” presentada el 8 de agosto del 2008 ante la Oficina Española de Patentes y Marcas y concedida el 6 de junio del 2009. Presentada y aprobada la extensión internacional PCT con número de solicitud PCT/ES2009/000382 y fecha de presentación 20/07/2009.
Principio de la página

Aplicaciones a medida relacionadas con Extracción de Información

  • Dentro del Proyecto de la Comisión Europea FLEX-Esprit IV nº 29158, se ha desarrollado un conjunto de aplicaciones aplicables a cualquier otro entorno. Una de ellas es un sistema de Extracción de Autor de artículos periodísticos. El conjunto de documentos puede estar escrito en cualquier soporte, (Word, HTML,..) y pueden constituir un conjunto de documentos ya dentro de una base de datos o simplemente la colección de documentos. El sistema funciona con igual eficacia para ingles o español y la misma tecnología puede dedicarse a la extracción de unidades de información relevante o bajo petición, autor o cualquier otro tipo de información. Este tipo de tecnología tiene un especial interés como aplicación que aumenta enormemente el rendimiento de buscadores ya sea en base de datos o Internet y aumenta enormemente el rendimiento si se hace a medida de un conjunto de documentos. Lo más destacable hasta el momento en las pruebas reales efectuadas ha sido la rapidez y la precisión (97% de aciertos).

  • Un tema de especial interés y al que nuestro equipo de trabajo ha prestado un interés especial ha sido la tecnología dedicada a la determinación del tema del que trata un documento determinado. Es frecuente que cuando alguien busca información sobre un tema en una base documental o en Internet se le pida que defina un conjunto de palabras clave que representen el dominio de lo que quiere buscar. Lo cierto es que este tipo de búsqueda ofrece unos resultados muy limitados. Las tecnologías desarrolladas por nuestro grupo parten del artículo o texto que constituyen la información y se extrae de forma automática el conjunto de palabras clave que definen el dominio o tema del artículo. Estas palabras clave pueden compararse con la petición hecha por el usuario y determinar cual de los documentos se acerca más a su petición. Determinado ese primer documento el sistema puede buscar el conjunto de documentos que se refieren a ese mismo tema o al menos que se acercan en contenidos al mismo.
Las aplicaciones son múltiples, pues van desde búsquedas más eficaces de documentación hasta redireccionamiento automático de información que llega a una organización hacia unos u otros departamentos según el tema determinado en los mismos. Esta aplicación es de especial interés para redireccionamiento de cartas electrónicas enviadas a direcciones corporativas. Cualquier búsqueda de información similar a una determinada, desde anuncios en periódicos digitales, a programas similares en la publicidad en la WEB de canales de TV u otros eventos que tengan un contenido descriptivo. Más aún, este tipo de técnicas llega a mediante observación de las peticiones de información hechas por un usuario durante un tiempo, determinar su perfil de gustos o intereses, lo que permitiría entre otras cosas el ofrecerle de forma directa una información a su medida y que supone una mejor explotación de los contenidos de un proveedor de información, o inlcuso ofrecerle de forma directa por el sistema un conjunto de programas asociados a su perfil de espectador, sin necesidad de que defina el mismo una lista de favoritos.
  • En un grado más avanzado de uso de estas técnicas puede llegarse la confección de resúmenes automáticos, sobretodo de artículos periodísticos, e incluso generar a partir de un artículo, un titular del mismo. En dominios concretos, estas técnicas ofrecen una buena precisión. Por ejemplo la elaboración de noticias relacionadas con cambios en los directivos de empresas u otras cuestiones bajo demanda. La generación de resúmenes en entornos abiertos requiere ya un grado de complejidad tecnológica mucho más significativo. La prestación es clara. Se parte de un texto de entrada de cualquier extensión y se acaba generando un resumen del mismo. Digamos que más que una aplicación es una herramienta que ayudaría a quienes han de hacer este trabajo, herramienta que como ya se ha comentado tiene un grado de complejidad tecnológica mucho mayor que las anteriores tecnologías.

  • Se ha desarrollado igualmente un corrector ortográfico de español adaptable a cualquier aplicación. Este mismo módulo puede extenderse en prestaciones a medida para validar la corrección de datos introducidos mediante texto de cualquier tipo en cualquier otra aplicación. Principio de la página

Tecnologías de voz

El grupo de trabajo ha desarrollado modelos de lenguaje que permitan manejar cualquier aplicación mediante comandos y que van desde el manejo de aplicaciones informáticas (Browser de correo electrónico u otras aplicaciones) hasta acceso a la información de una base de datos WAP sin necesidad de recorrer el árbol de información. Este es una gran problema pues el usuario no suele conocer el árbol y en ocasiones debe recorrerlo casi enteramente antes de encontrar la información que busca y aún peor, nada le dice si la información que necesita sencillamente no se encuentra allí. Las aplicaciones que permiten manejar una aplicación informática mediante voz, aumentan enormemente la rapidez en su manejo al no tener el usuario que mover sus manos continuamente del teclado al ratón, pero donde tienen una especial importancia es en el manejo de dichas aplicaciones por personas que tienen alguna dificultad motora ya sea para el manejo de una aplicación informática, ya para cosas mucho más simples, como cambiar de canal en la TV o el manejo de cualquier dispositivo. (personas mayores, etc...,)

Acceso a Base de datos en Lenguaje Natural

Esta aplicación fue desarrollada hace años por asociación de nuestro grupo con la empresa Software AG, de gran experiencia en desarrollo de aplicaciones del lenguaje. Esta tecnología puede ser desarrollada a medida y soportada dicha compañía y nuestro grupo de trabajo.

Aplicaciones basadas en Diccionarios Electrónicos

Cualquier aplicación de un diccionario electrónico incluso para desarrollo de sistemas de lenguaje Natural, es importante en las aplicaciones de interfaces inteligentes. Nuestro Grupo de trabajo ha desarrollado a los largo de los últimos años, un diccionario electrónico de más de 30.000 entradas de español, cada una de las cuales asocia información riquísima agrupada en sus más de 30 atributos. Las aplicaciones son múltiples y van desde sistemas de traducción automática a sistemas de procesamiento de lenguaje natural y cualquier otro. Mezclando las técnicas antedichas de extracción de información con las herramientas de mantenimiento de diccionarios podemos definir el diccionario de términos a medida que esté presente en una colección de documentos.

  • Junto a los sistemas anteriores hemos desarrollado un analizador léxico de español que cubre la práctica totalidad del idioma y se está construyendo un analizador sintáctico que permita mediante heurísticas llegar a la representación semántica de una oración. Las aplicaciones van desde la enseñanza de nuestro idioma hasta en un futuro inmediato disponer de un corrector de estilo a quien escriba en español, cuestión de la máxima importancia si queremos llegar a los sistemas de traducción multilingüe.

Podemos ofrecer demostraciones a quienes estén interesados en aplicar estas tecnologías a sus productos y en cualquier caso pueden consultarnos para desarrollos conjuntos o a medida bajo petición. Principio de la página