Las herramientas que agrupamos bajo la etiqueta de programas básicos realizan alguna clase de análisis lingüístico (no incluimos aquí los diccionarios, por ejemplo, en los que la principal herramienta informática es la memoria y carga de datos). Se trata de programas de análisis morfológico, sintáctico y léxico, que dan lugar a aplicaciones con poco impacto en el público general:
por ejemplo, recursos para el aprendizaje de lenguas extranjeras o para el análisis metalingüístico de la lengua materna (que permiten autonomizar el estudio al contrastar y corregir información automáticamente), fuentes de consulta para profesionales de la lengua (docentes, investigadores, periodistas), etc.
Estos programas básicos sirven además como herramienta para obtener análisis completos de los textos, que se necesitan para los programas más complejos y que interesan a un número potencialmente mayor de usuarios: por ejemplo, buscadores “inteligentes”, traductores o redactores automáticos (ver los links correspondientes). Entre los programas básicos incluimos los siguientes:
Estos programas permiten obtener la información morfológica ligada con una palabra: el usuario introduce una palabra y el programa la descompone en todos los posibles formantes (morfemas) presentes en la base de datos léxicos. Posteriormente, determina qué análisis pueden ser correctos, de acuerdo con las reglas de formación de palabras y utilizando la información asociada a los distintos formantes. Algunos programas contemplan únicamente la información flexiva; otros incorporan todos o algunos fenómenos derivativos. En este segundo caso, algunos programas de análisis morfológico pueden intentar dar un análisis tentativo de palabras desconocidas por medio de diversos procedimientos (por ejemplo, tomando en cuenta los prefijos y/o sufijos involucrados, considerando el contexto de aparición o posibles antecedentes lingüísticos, etc.).
La contraparte informática de estos programas de análisis morfológico son los llamados lematizadores, que utilizan la misma base de datos léxicos. Los lematizadores permiten reconocer cuál es la palabra (i.e., el lexema) que subyace a determinada forma. Para ello realizan el procedimiento inverso al que hemos detallado antes: contrastan la forma introducida por el usuario con la base de datos hasta reconocer la/s entrada/s con la/s que podría ser compatible.
Para experimentar un programa de estas características en forma gratuita, puede consultarse en la web la dirección http://stilus.daedalus.es/demoIL.php?demo=pos.
Estos programas se llaman también generadores morfosintácticos. El tipo de información que proporcionan estas herramientas depende en buena parte de las decisiones teóricas tomadas por la parte lingüística de la investigación. Así, por ejemplo, el conjugador del Grupo de Estructuras de Datos y Lingüística Computacional de la Universidad de Las Palmas de Gran Canaria (ULPGC) incluye como opciones de información morfológica el paradigma completo del verbo (formas simples y compuestas), los pronombres clíticos, la flexión del participio como adjetivo verbal (género, número) y el diminutivo del participio. La contraparte de los conjugadores verbales son los analizadores de flexión, que permiten reconocer todas las formas que incluyen esos parámetros. En el caso de las formas no verbales, además de la información flexiva se consideran también morfemas considerados derivativos (como la derivación apreciativa en nombres, adjetivos y adverbios) y otras posibles fuentes de variación como género y número en sustantivos, adjetivos, pronombres y artículos, grado superlativo en adjetivos y adverbios, variantes gráficas en todas las categorías gramaticales, etc.
El conjugador verbal del Grupo de Estructuras de Datos y Lingüística Computacional se encuentra en la dirección http://gedlc.ulpgc.es/investigacion/scogeme02/flexver.htm; también pueden consultarse los flexionadores de adjetivos (http://gedlc.ulpgc.es/investigacion/scogeme02/flexadj.htm) y de nombres, http://gedlc.ulpgc.es/investigacion/scogeme02/flexsus.htm).