|
Patentes
Aplicaciones
a medida relacionadas con Extracción de Información
Tecnologías de Voz
Acceso a Bases de Datos en Lenguaje Natural
Aplicaciones basadas en Diccionarios Electrónicos
Patentes
Jesús Martínez Barbero, Eugenio Santos Menendez. Patente P200802356,
“Método de transmisión de contenidos multimedia” presentada el 8 de agosto del 2008 ante la
Oficina Española de Patentes y Marcas y concedida el 6 de junio del 2009. Presentada y aprobada
la extensión internacional PCT con número de solicitud PCT/ES2009/000382 y fecha de presentación
20/07/2009.
Aplicaciones a medida
relacionadas con Extracción de Información
- Dentro del Proyecto
de la Comisión Europea FLEX-Esprit IV nº 29158, se ha desarrollado
un conjunto de aplicaciones aplicables a cualquier otro
entorno. Una de ellas es un sistema de Extracción
de Autor de artículos periodísticos. El conjunto
de documentos puede estar escrito en cualquier soporte,
(Word, HTML,..) y pueden constituir un conjunto de documentos
ya dentro de una base de datos o simplemente la colección
de documentos. El sistema funciona con igual eficacia para
ingles o español y la misma tecnología puede dedicarse a
la extracción de unidades de información
relevante o bajo petición, autor o cualquier otro
tipo de información. Este tipo de tecnología tiene un especial
interés como aplicación que aumenta enormemente el rendimiento
de buscadores ya sea en base de datos o Internet y aumenta
enormemente el rendimiento si se hace a medida de un conjunto
de documentos. Lo más destacable hasta el momento en las
pruebas reales efectuadas ha sido la rapidez y la precisión
(97% de aciertos).
- Un tema de especial interés y al que
nuestro equipo de trabajo ha prestado un interés especial
ha sido la tecnología dedicada a la determinación
del tema del que trata un documento determinado.
Es frecuente que cuando alguien busca información sobre
un tema en una base documental o en Internet se le pida
que defina un conjunto de palabras clave que representen
el dominio de lo que quiere buscar. Lo cierto es que este
tipo de búsqueda ofrece unos resultados muy limitados. Las
tecnologías desarrolladas por nuestro grupo parten del artículo
o texto que constituyen la información y se extrae de forma
automática el conjunto de palabras clave que definen el
dominio o tema del artículo. Estas palabras clave pueden
compararse con la petición hecha por el usuario y determinar
cual de los documentos se acerca más a su petición. Determinado
ese primer documento el sistema puede buscar el conjunto
de documentos que se refieren a ese mismo tema o al menos
que se acercan en contenidos al mismo.
- Las aplicaciones son
múltiples, pues van desde búsquedas más eficaces
de documentación hasta redireccionamiento automático de
información que llega a una organización hacia unos u otros
departamentos según el tema determinado en los mismos. Esta
aplicación es de especial interés para redireccionamiento
de cartas electrónicas enviadas a direcciones corporativas.
Cualquier búsqueda de información similar a una determinada,
desde anuncios en periódicos digitales, a programas similares
en la publicidad en la WEB de canales de TV u otros eventos
que tengan un contenido descriptivo. Más aún, este tipo
de técnicas llega a mediante observación de las peticiones
de información hechas por un usuario durante un tiempo,
determinar su perfil de gustos o intereses, lo que permitiría
entre otras cosas el ofrecerle de forma directa una información
a su medida y que supone una mejor explotación de los contenidos
de un proveedor de información, o inlcuso ofrecerle de forma
directa por el sistema un conjunto de programas asociados
a su perfil de espectador, sin necesidad de que defina el
mismo una lista de favoritos.
- En un grado más avanzado de uso
de estas técnicas puede llegarse la confección
de resúmenes automáticos, sobretodo de artículos
periodísticos, e incluso generar a partir
de un artículo, un titular del mismo. En dominios
concretos, estas técnicas ofrecen una buena precisión. Por
ejemplo la elaboración de noticias relacionadas con cambios
en los directivos de empresas u otras cuestiones bajo demanda.
La generación de resúmenes en entornos abiertos requiere
ya un grado de complejidad tecnológica mucho más significativo.
La prestación es clara. Se parte de un texto de entrada
de cualquier extensión y se acaba generando un resumen del
mismo. Digamos que más que una aplicación es una herramienta
que ayudaría a quienes han de hacer este trabajo, herramienta
que como ya se ha comentado tiene un grado de complejidad
tecnológica mucho mayor que las anteriores tecnologías.
- Se ha desarrollado igualmente un corrector
ortográfico de español adaptable a cualquier aplicación.
Este mismo módulo puede extenderse en prestaciones a medida
para validar la corrección de datos introducidos mediante
texto de cualquier tipo en cualquier otra aplicación.

Tecnologías
de voz
El grupo de trabajo ha desarrollado modelos de lenguaje
que permitan manejar cualquier aplicación mediante comandos
y que van desde el manejo de aplicaciones informáticas (Browser
de correo electrónico u otras aplicaciones) hasta acceso a
la información de una base de datos WAP sin necesidad de recorrer
el árbol de información. Este es una gran problema pues el
usuario no suele conocer el árbol y en ocasiones debe recorrerlo
casi enteramente antes de encontrar la información que busca
y aún peor, nada le dice si la información que necesita sencillamente
no se encuentra allí. Las aplicaciones que permiten manejar
una aplicación informática mediante voz, aumentan enormemente
la rapidez en su manejo al no tener el usuario que mover sus
manos continuamente del teclado al ratón, pero donde tienen
una especial importancia es en el manejo de dichas aplicaciones
por personas que tienen alguna dificultad motora ya sea para
el manejo de una aplicación informática, ya para cosas mucho
más simples, como cambiar de canal en la TV o el manejo de
cualquier dispositivo. (personas mayores, etc...,)
Acceso a Base de datos
en Lenguaje Natural
Esta aplicación fue desarrollada hace años por asociación
de nuestro grupo con la empresa Software AG, de gran experiencia
en desarrollo de aplicaciones del lenguaje. Esta tecnología
puede ser desarrollada a medida y soportada dicha compañía
y nuestro grupo de trabajo.
Aplicaciones basadas
en Diccionarios Electrónicos
Cualquier aplicación de un diccionario
electrónico incluso para desarrollo de sistemas de
lenguaje Natural, es importante en las aplicaciones de interfaces
inteligentes. Nuestro Grupo de trabajo ha desarrollado a los
largo de los últimos años, un diccionario electrónico de más
de 30.000 entradas de español, cada una de las cuales asocia
información riquísima agrupada en sus más de 30 atributos.
Las aplicaciones son múltiples y van desde sistemas
de traducción automática a sistemas de procesamiento
de lenguaje natural y cualquier otro. Mezclando las técnicas
antedichas de extracción de información con las herramientas
de mantenimiento de diccionarios podemos definir el diccionario
de términos a medida que esté presente en una colección de
documentos.
- Junto a los sistemas anteriores hemos
desarrollado un analizador léxico de español que cubre la
práctica totalidad del idioma y se está construyendo un
analizador sintáctico que permita mediante heurísticas llegar
a la representación semántica de una oración. Las aplicaciones
van desde la enseñanza de nuestro idioma hasta en un futuro
inmediato disponer de un corrector de estilo a quien escriba
en español, cuestión de la máxima importancia si queremos
llegar a los sistemas de traducción multilingüe.
Podemos ofrecer demostraciones a quienes
estén interesados en aplicar estas tecnologías a sus productos
y en cualquier caso pueden consultarnos
para desarrollos conjuntos o a medida bajo petición. 
|