Lingüística y Computación


CONGRESO NACIONAL PASADO, PRESENTE Y FUTURO DE LA COMPUTACIÓN

MAURICIO SWADESH, LA LINGÜÍSTICA Y LA COMPUTACIÓN EN MÉXICO

-Las computadoras en la lingüística prehistórica e histórica, la descripción de lenguas, el descifre y la traducción automática-

Daniel Cazés

División de Estudios de Posgrado

Facultad de Economía UNAM.

UNAM, 6-10 de junio, 1988.

RESUMEN

En esta ponencia se describen las condiciones académicas en las que se inició en la UNAM la utilización de computadoras en las ciencias sociales. Uno de los primeros proyectos que recurrieron a la IBM-650 y luego a las otras máquinas del Centro de Cálculo Electrónico, fue encabezado por Mauricio Swadesh, a cuyas principales aportaciones como pionero y cabeza de un grupo de lingüistas me refiero aquí.

La comparación masiva de lenguas de los orígenes más diversos sólo fue posible gracias al método de la glotocronología y a las técnicas del cálculo léxico estadístico establecidos por Swadesh. El recurso a la computación no sólo facilitó este trabajo comparativo, sino que la exigencia de codificaciones uniformes permitió establecer claves de clasificación léxica (fonologías y semánticas), que condujeron en muy poco tiempo a la formulación de una teoría sobre el origen, la diversificación del lenguaje y abrieron el campo de su exploración prehistórica.

Los modelos del árbol genealógico caducaron y fueron sustituidos por el de las redes lingüísticas basadas en la comparación sistemática de las lenguas, el establecimiento de la medida de su diversificación (siglos mínimos) y en su clasificación genética.

Varias protolenguas (formas de la lenguas madres antes de su diversificación) pudieron ser reconstruidas, y la comparación de varios cientos de idiomas de los más variados orígenes condujeron a la reconstrucción de los rasgos básicos del proto-afro-eurasiático-americano y el establecimiento de la red lingüística mundial.

El método, probado con lenguas documentadas cuando menos hace mil años, resultó particularmente productivo para las lenguas americanas cuya historia escrita data, en el mejor de los casos, de menos de cinco siglos.

Simultáneamente con estos trabajos de lingüística comparada, histórica, reconstructiva y clasificatoria, en la misma época se inició la elaboración de concordancias electrónicas de textos, valioso instrumento para el análisis de las estructuras lingüísticas y por ello para la descripción gramatical de idiomas de origen prehispánico, la elaboración de diccionarios de varios tipos y la exploración de las combinaciones de glifos mayas en los niveles del cartucho, la frase y el texto. Fue a partir de la utilización de computadoras en México (para revisar algunos resultados parciales alcanzados en Leningrado y Novosibirsk) como se inició un auge en los estudios de la escritura maya que se prolonga hasta la actualidad.

En la elaboración de diccionarios, las claves obligadas para trabajar con la computadora abrieron el camino hacia los diccionarios de elementos, que no contienen palabras sino formas básicas combinables y las fórmulas de su combinación. Se han publicado ya varios, sobre todo de lenguas mexicanas de origen prehispánico.

La mayoría de estos trabajos se realizaron en México desde 1958 hasta 1967; los métodos, los sistemas y las técnicas aquí establecidos fueron luego adoptados por lingüistas sudamericanos, norteamericanos, japoneses, canadienses y ghaneses. En la ponencia se hacen descripciones breves de sus aportes fundamentales.

Finalmente, en colaboración con las universidades de Berkeley y Grenoble, durante un tiempo se hicieron trabajos destinados a traducir automáticamente el ruso y el alemán al español. Se hicieron importantes análisis gramaticales y clasificación de rasgos estructurales de las tres lenguas, y se elaboraron los diccionarios de máquina de la primera y la última, pero nunca se llegó a nada que se pareciera a una verdadera traducción.

Lo que se describe en este trabajo es únicamente el trabajo pionero en lo que alguna vez se llamó lingüística computacional, porque fue entonces cuado se establecieron las líneas básicas. Vinieron de la práctica de la lingüística desarrollada por antropólogos, que con la utilización de computadoras se redujo mucho desde mediados de los setenta. Hoy vale la pena preguntarse qué nuevas perspectivas se ofrecen mutuamente la lingüística y la computación, y qué medios hay para desarrollarlas y ampliarlas.

Hace unas semanas, alguien a quien hasta entonces no conocía me invitó a participar en un congreso sobre computación en México. Le advertí que sólo soy usuario de computadoras y no un verdadero computólogo, a lo que repuso que se me invitaba como uno de los precursores del uso de las computadoras en la investigación, y que el Congreso conmemoraría el 30 ↑ o ↓ aniversario de la computación e nuestro país. Entonces debo haber enmudecido unos segundos al darme cuenta de que ha pasado tanto tiempo y de que casi desde el principio, a partir de 1960, yo estaba ahí. Creo que todavía antes de decir que aceptaba pensé en la primera computadora que conocí (la vetusta 650 del Centro de Cálculo de la UNAM), y en los cambios enormes y vertiginosos que han sufrido las máquinas para convertirse en las micros con que trabajo hoy. Con rapidez pasó por mi cabeza la imagen de un arqueólogo que reconstruiría una prehistoria vivida por él mismo. Quizá un día podré participar más activamente que hoy en el relato del uso de las computadoras en la lingüística mexicana.

Por lo pronto, me replanteé algunas preguntas que varias veces me propuse contestar pero que por negligencia he dejado todavía sin respuesta: ¿Cuándo se utilizó por primera vez una computadora en la investigación lingüística, cuál fue el primer proyecto en que eso sucedió, cuánto tiempo pasó para que lo mismo sucediera en México? Supongo, sin ninguna base documental, que la formulación misma de las bases de la cibernética exigió una reflexión sobre el lenguaje humano, y que el diseño de la Univac I –con el que por primera vez en el mundo de la computación se pudo manejar información alfabética y numérica por igual-, previó o intuyó la posibilidad de las investigaciones lingüísticas. De manera muy poco científica, imagino que además de las estadísticas censales norteamericanas, entre las primeras investigaciones sociales asistidas por computadora debieron estar relacionadas con mi disciplina. Esto debió suceder, cuando más temprano, hacia 1952 o 1953. En esas épocas, cinco o seis años todavía eran periodos cortos para el desarrollo tecnológico, así que se puede decir que no tardaron mucho en iniciar su desarrollo en México tales búsquedas.

Sí puedo afirmar que desde 1958, cando se inició la computación electrónica en México, también comenzó su aplicación a la investigación lingüística. La iniciativa fue de Mauricio Swadesh, con quien en 1961 colaboraban ya cinco de sus discípulos.

En otro trabajo he expuesto la idea de que a mediados de este siglo ha tenido lugar lo que, siguiendo a Gordon Childe, he llamado la más reciente revolución humana, cuya concreción se manifiesta, en dos hechos: la humanidad desarrolló la capacidad de destruirse íntegramente a sí misma con todo y su hábitat, y al mismo tiempo alcanzó la posibilidad de manejar, procesar y transmitir cantidades infinitas de información. Recordemos que fue durante la Segunda Guerra Mundial, al mismo tiempo en que avanzaba con rapidez el Proyecto Maniatan, cuando la cibernética y la computación también iniciaban lo que sería un avance vertiginoso, en gran parte en torno a estudios de balística que se llevaban a cabo en el MIT.

Es curioso que lo que luego comenzaría a llamarse lingüística computacional inició su desarrollo mexicano en conexión con otra derivación de la guerra: Swadesh, que era norteamericano y comunista, había apoyado en 1948 un movimiento estudiantil antirracista y antisemita que tuvo lugar en el City College de Nueva Cork. Por esa razón, su contratación para el año escolar que se iniciaría en el otoño de ese año, fue cancelada después de haber sido aprobada, para lo que se alegaron razones presupuestarias. Durante un par de años Swadesh, que era veterano de la guerra, se dedicó a estudiar y a buscar trabajo. Cuando se dio cuenta de que permanecería desempleado demasiado tiempo, vino a México, en donde ya había trabajado en proyectos de alfabetización y de investigación de lenguas de origen prehispánico durante el sexenio cardenista. Aquí halló trabajo en la UNAM al lado de los doctores Juan Comas, antropólogo físico, y Pedro Bosch-Gimpera, prehistoriador, ambos españoles perseguidos por el franquismo, y Paul Kirchhoff, etnólogo e historiador judío alemán que había huido a tiempo del nazismo. Así pues, el azar de las persecuciones reunió en la UNAM a uno de los grupos de antropólogos más brillantes que se hayan coincidido en una misma institución. En cierta forma, podemos decir que debemos a la caída de la República Española el despertar en México de la antropología física y de los estudios de la prehistoria del viejo mundo; la formulación del concepto de Mesoamérica al nazismo, y el inicio del desarrollo científico de la lingüística así como de la utilización de las computadoras en la investigación cultural, al macartismo. Era la época, además, en la que culminaba uno de los procesos de modernización del capitalismo mexicano. Concluía la austeridad ruizcortinista y se iniciaba un crecimiento del estado social que exigía equilibrios políticos entre las ganancias empresariales y el control de los trabajadores. La administración privada y la pública requerían de una gestión moderna y eficaz. El mercado mexicano para las business machines estaba abierto, y la UNAM debería preparar a los técnicos que las pondrían en marcha y las manejarían. El espacio académico en que se daría esta preparación permitió que de inmediato se usaran para realizar investigaciones científicas no relacionadas directa e inmediatamente con el fin primordial para el que fueron producidas y vendidas.

Cuando comenzó la segunda mitad del siglo 20, en la atmósfera intelectual mexicana aun se sentía intensamente la presencia de esa generación de víctimas de la intolerancia armada que del derrumbe europeo y de la cacería de brujas norteamericana llegaron aquí, un poco por casualidad, en busca de refugio y estímulo para su creatividad en este país. Los cuatro maestros a quienes he nombrado, junto con el Dr. Pablo Martínez del Río, conformaron el primer cuerpo académico que, enfrascado en un debate científico interminable sobre las obras de cada uno de sus miembros, discutió la obra lingüística de Swadesh y se asombró con el recurso a la extraña maquinaria que a través de él comenzó a conocer.

El otro marco, sin el cual esta improvisada descripción no significaría nada, fue el formado por el círculo de especialistas de todas las ramas de la ciencia y la filosofía que formó el Dr. Eli de Gortari y que se llamó Seminario de Problemas Científicos y Filosóficos. Un puñado de estudiantes de la ENAH nos alimentábamos del contacto con esos maestros y guías de lectura y discusiones que habían sido excluidos de nuestra escuela debido a otras intolerancias y absurdas xenofobias.

Evangelina Arana, Leonardo Manrique, Roberto Escalante y poco después Madalena Sancho, Juan José Rendón y yo fuimos los discípulos de Swadesh que primero supimos de sus hallazgos en lingüística, y aprendimos de él –unos más que otros- el uso de las computadoras.

Conocí a Swadesh en 1960. Yo había comenzado a estudiar antropología y trabajaba en Radio UNAM, entre otras cosas entrevistando a mis maestros y reseñando publicaciones. Había leído dos artículos de Swadesh aparecidos en el suplemento cultural del diario Novedades, que dirigía Fernando Benítez: uno sobre el origen de la lengua nahua y el otro sobre el origen de las dos mil lenguas de América. El día que en la misma publicación me enteré de que Swadesh hablaría sobre la lingüística y prehistoria en el Seminario que dirigía el Dr. de Gortari, pude oírlo por primera vez y le pedí que viniera a mi emisión radiofónica. Me citó para el día siguiente en el Instituto de Investigaciones Históricas.

Cuando salí de su cubículo, iba cargando un buen tambache de tarjetas cuyas perforaciones debía confrontar con una lista escrita en una antigua máquina. Cada tarjeta se iniciaba con una clave de letras y líneas que identificaba a una lengua (incluyendo su clasificación genética y la fuente de la que provenían los datos); seguían luego una clave fonética y una clave semántica; venía después de una forma léxica y después una o varias traducciones y otras indicaciones. Estos materiales, me había dicho Swadesh, serán procesados pronto el en cerebro electrónico. No pudimos preparar la entrevista para Radio Universidad. El trabajo de revisión era algo realmente mecánico y el contenido de las tarjetas aun me parecía confuso. Comprendí que el método de enseñaza de Swadesh consistía en suscitar preguntas en sus alumnos, para sólo responder las realmente planteadas y orientar las búsquedas para aclarar las dudas. Era una buena iniciación a la investigación para un estudiante de primer ingreso. Pero además, por la vía del aprendizaje de la técnica más avanzada en el manejo de materiales lingüísticos.

De ahí pasamos al CCE.

Ambiente.

Los fundamentos de la comparación, para Swadesh.

La glotocronología: el índice de retención, los siglos mínimos, las redes lingüísticas.

Mi primera comparación masiva.

Las derivaciones ineludibles: los diccionarios de elementos: la teoría de los mil a 2 mil elementos básicos de las lenguas clásica, de los 100 mil y más de las lenguas contemporáneas.

La reunión latinoamericana de ling. y comp.

La creación de la Sección y luego Depto. de Invs. Lings. Del CCE.

La epigrafía maya y la CEEM: URSS, Ruz, Rockefeller, Chicago.

ALILEME

El manejo de textos, las concordancias (JJR y DC)

Los diccionarios. David Brambila y el tarahumara.

La frustrada consulta automática de las fuentes de la historia antigua de México.

La traducción automática, su inicio y su abandono.

El deterioro de las condiciones de investigación en el CCE: el beltraneo, la prioridad a procesamientos no científicos, la visita del príncipe Felipe.

La posición de la rectoría de Chávez en que no se abrían plazas de investigación.

Barros Sierra y el SEEM de la Coordinación de Humanidades: quizá el primer centro de investigaciones humanística que contó con una plaza de programador.

Deja un comentario