Los programas que agrupamos aquí utilizan las herramientas básicas del análisis gramatical para dar lugar a aplicaciones más sofisticadas. Entre ellas se cuentan los buscadores “inteligentes” de información y los resumidores automáticos.
Otro campo importante que requiere insumos lingüísticos es el de los buscadores sofisticados, que combinan herramientas de búsqueda (simple coincidencia) y el análisis de elementos lingüísticos (semántico-pragmáticos y morfosintácticos). Los buscadores “borrosos” [fuzzy finders] permiten reconocer qué parte de la palabra o expresión solicitada es relevante y cuál no. Ello incluye despejar la parte no conceptual del pedido:
por ejemplo, los verbos de acto de habla (e.g., quiero/ necesito/ dame documentos sobre...) o el “ruido” proveniente de las formas flexivas o derivativas (así, por ejemplo, se requiere una herramienta morfológica que permita relacionar una secuencia como comercio exterior con el paradigma verbalde comerciar o el uso nominal de exterior). Un ejemplo de este tipo de productos puede obtenerse en http://stilus.daedalus.es/demoIL.php?demo=busbor.
Idealmente, los buscadores “inteligentes” deberían disponer de herramientas semánticas para reconocer expresiones sinónimas (en el caso anterior, por ejemplo, se podría ligar comercio exterior con expresiones como mercados externos o extranjeros, importaciones, exportaciones, etc.). El mismo tipo de análisis semántico se hace necesario, en combinación con traductores, para los buscadores multilingües que permiten expresar una búsqueda en una lengua determinada y localizar todos los documentos relevantes en diversas lenguas.
Los resumidores automáticos permiten extraer resúmenes de textos electrónicos de cualquier tipo (noticias de prensa, textos legislativos, documentos internos de empresas o instituciones, etc.). Los sistemas de resúmenes automáticos se usan también para resumir noticias para los formatos SMS de los teléfonos celulares o para presentar descripciones comprimidas de los resultados de una búsqueda en sistemas como Google, por ejemplo.
Un ejemplo de este tipo de programas en internet se encuentra en: http://swesum.nada.kth.se/index-eng.html (la página está en inglés, pero realiza resúmenes de páginas web en diversos idiomas, entre ellos el español). Otro ejemplo de resumidor automático es el que se presenta en http://www.daedalus.es/docs/DAEDALUS-RP-SEPLN_2003.pdf (para una demostración, puede consultarse http://stilus.daedalus.es/demoIL.php?demo=res). Allí se describe un sistema que consta de cinco módulos: análisis morfosintáctico, ponderación de oraciones, detección de anáforas, selección de oraciones y post-procesado del extracto. Las principales funciones de cada módulo son las siguientes:
Este módulo determina la categoría léxica de cada palabra del texto de entrada (sustantivo, artículo, verbo, etc.), así como su lema y formantes. La categoría de las palabras permite distinguir entre palabras pertenecientes a clases abiertas (sustantivo, adjetivo, verbo) y cerradas (artículo, pronombre, preposición, etc.). El lema permite considerar como un único concepto todas las formas flexivas de una palabra.
Este módulo recibe como entrada el texto etiquetado por el módulo de análisis morfosintáctico y entrega a su salida una tabla con puntuaciones de las oraciones y una lista de oraciones candidatas a conservarse en el resumen.