Cultura

Politécnicos desarrollan software para conocer uso del español antiguo

Desarrollaron un sistema informático especializado para lingüistas que permite conocer a profundidad el uso de ciertas palabras del español antiguo

Investigadores del Instituto Politécnico Nacional (IPN) desarrollaron un sistema informático especializado para lingüistas que permite conocer a profundidad el uso de ciertas palabras del español antiguo, a través de un acervo de tres mil 534 documentos escritos en América entre los siglos XVI y XIX.Los especialistas del Centro de Investigación en Computación (CIC), Alexander Gelbukh y Grigori Sidorov, desarrollaron este sistema informático que proporciona al usuario herramientas para trabajar desde cualquier computadora.

Detalló que este software integra el Corpus Diacrónico y Diatópico del Español de América (Cordiam), de la Academia Mexicana de la Lengua, el cual se conforma por una base de datos de tres millones de palabras, extraídas de archivos de 19 países americanos hispanohablantes, además del suroeste de Estados Unidos, Jamaica, Haití y Guyana.

Mediante Cordiam se busca crear la infraestructura filológica e informática para poder integrar las diferentes variedades dialectales del español de América y así conformar una historia general e integral del lenguaje que será útil para historiadores y antropólogos de este continente.

En un comunicado, Gelbukh, jefe del Laboratorio de Lenguaje Natural y Procesamiento de Texto, explicó que el primer documento corresponde al año 1494 y el último a 1905, abarca el período fundacional, el virreinal/colonial y el primer siglo de la mayoría de las independencias americanas.

El programa tiene cuatro características innovadoras: ofrece una plantilla de metadatos para acotar los resultados, proporciona información cuantitativa del universo de palabras ingresadas al buscador, analiza documentos completos que presentan concordancias, guarda automáticamente en una base de datos el historial de las búsquedas y hace selecciones preliminares y comparativas.

El científico politécnico destacó que este corpus es único en su tipo por su calidad en el soporte informático; además, cuenta con una interfaz amigable que brinda a los lingüistas certeza y precisión en los datos, ya que su motor de búsqueda cuenta con filtros específicos, como siglo, año, país de origen, autor, procedencia del escrito y grupo étnico.


NOTAS RELACIONADAS

ÚLTIMOS

MÁS VISTOS

HOY EN

PROYECTO 40