The Word in the Machine

miércoles, 16 de noviembre de 2011

Ateneo a las consecuencias

Ayer di una charla en el Ateneo Riojano con el título "Lo que los lingüistas hacen y lo que dicen que hacen: la lingüística como ciencia" dentro del ciclo o curso filosofía, tuercas, algoritmos. Teorías sobre la ciencia y la técnica, que han organizado David San Martín y Sergio Pérez . El programa está aquí.

La conferencia dedicó una parte importante a la exposición de la lingüística de Chomsky y otra al análisis digamos que filosófico de la misma. Yo, a la vista del público asistente, adapté como me pareció oportuno el nivel.

Si lo primero, bien o mal hecho, queda claro qué es, la segunda parte de la intervención es un poco más difícil de resumir. Los temas que tratamos fueron:

1. La lingüística como ciencia alfa y ciencia beta (estos son términos de la teoría del cierre categorial de Gustavo Bueno; se puede hallar una introducción en un diccionario en red: http://filosofia.org/filomat/index.htm).

2. La lingüística y sus relaciones con la psicología, la biología y otras ciencias.

3. Ciencia del lenguaje vs. teoría del lenguaje.

Sobre el punto 1 mi posición personal es distinta a la habitual en los autores que han trabajado dentro de la teoría del cierre categorial. Se basa en la diferencia entre las operaciones de la gramática, las del procesamiento (como el 'parsing') y las de los hablantes mismos.

Pensaba haber tratado el asunto con bastante hincapié en el asunto del lenguaje humano y su representación como lenguaje formal (porque ese enfoque de la lingüística es el más alejado de las operaciones de los hablantes, aunque pierde fácilmente las referencias empíricas), pero no era lo más adecuado para el tipo de intervención y el lugar.

La idea básica es que una teoría es científica cuando se produce un cierre sintáctico, semántico y pragmático de su campo (el análogo sería el cierre algebraico del cuerpo de los complejos). Ahora bien, en ocasiones en el campo que estudia el científico hay operaciones realizadas por sujetos que son análogas a las de aquél. El cierre se puede producir porque se cancelan las operaciones, se da cuenta de ellas "objetivamente", y e tiene un cierre alfa. Si las operaciones, como el dinosaurio de Monterroso, siguen allí, hay un cierre beta, que como tal es problemático.

Pues bien la postura defendida sería que en el caso de las teorías de la sintaxis chomskianas el cierre -más o menos efectivo- sería alfa, mientras que en la lingüística cognitiva, en la funcional (pienso en Givón, como claro ejemplo), por no hablar de la retórica o de la 'linguistique de la parole', el cierre, si lo hay sería beta.

La razón para esto es que la gramática de Chomsky no representa operaciones del hablante: Merge o Move, por ejemplo, no son algo que los hablantes hagan. Tendrán un correlato en el procesamiento, pero serán otra cosa, otra operación.

Acabamos anoche discutiendo un ejemplo sencillo:

El inglés "They say that..." puede corresponder a un sujeto indeterminado y a un sujeto determinado. No existe un *"Say that...". En cambio, en español "Dicen que..." corresponde o a un sujeto determinado o a uno indeterminado. En "Ellos dicen que..." tiene una referencia concreta bien especificada. Por tanto, el equivalente de "They say that..." es "Dicen que...". Ahora bien, disponer de una estructura en inglés y de dos en español (hay más en ambas lenguas, pero no entramos en ello) es un hecho dictado, cabe Chomsky, por la parametrización en una y otra. El hablante puede cambiar el "They say..." por un "It is said that...", pero una vez que toma por el primer camino, está sujeto a unas restricciones absolutamente objetivas.

Incluso, la interpretación semántica se puede dejar muy fuera y muy poco dentro de la sintaxis. En los conocidos ejemplos de tipo "Two men were talked to by everybody" y "Everybody talked to two people", podemos pensar que, al igual que en los casos anteriores, un sujeto con más contenido que el mero 'they' sólo admite una interpretación especificada. Si tematizamos en la posición de sujeto, convendrá evitar que el sujeto sea indeterminado e inespecífico. Nótese, en cambio, que un 'dummy subject' va seguido de un sintagma nominal con la misma referencia, por lo que los tales serían casos que escapan a este principio. A lo que vamos es a que una regla interpretativa de este tipo cae más bien fuera de la sintaxis. Y a que los tipos de oraciones gramaticales con sus descripciones son generadas por operaciones con cuyos resultados deben converger los de las operaciones del hablante. Lo de Chomsky sería lo primero y el cierre ahí sería alfa.

jueves, 27 de octubre de 2011

Muerte de John McCarthy

Las estructura habituales del lisp (las listas) son las estructuras de los marcadores de frase (PM) binarios habituales en el programa minimalista (MP) (1) de la gramática generativa, o mejor digámoslo al revés que será más propio:

(reverse '( PM MP ))

Seguramente la isología no es ni medio punto menos que perfecta, lo cual aparte de la coincidencia histórica en el lugar y el tiempo en que se fundaron el LISP y la lingüística transformacional, nos hace sospechar que la lingüística ha tendido hacia el instrumento formal a la vez más simple y más potente, algo que nos revela el carácter escalar de la simplicidad, que la simplicidad es mera apariencia o es categorización según nuestros intereses y posibilidades de cada momento.

(1) (I (like (tomatoes Æ)))

jueves, 13 de octubre de 2011

Nuestra gran contribución

Las sutiles cavilaciones acerca de la autonomía de las autonomías deberían aprovecharse (o al menos utilizarse para trazar los ilustrativos paralelismos y analogías a que alcancemos) en una renovada formulación de la tesis de la 'autonomía de la sintaxis', la cual no es independencia ni pretende serlo. O tal vez lo pretenda, pero la semántica y la humana falta de formalidad que nos caracteriza lo impiden con notable eficacia.

miércoles, 1 de junio de 2011

haberlo, haylo

A la performance, frente a la competence o competencia; o mejor al parsing o, digamos generalizando, procesamiento, frente a la gramática, les puede calzar el diálogo habido entre dos sujetos, entendemos que católicos de origen:

- Yo creo en Dios, algo que tiene que haber, pero no creo en la Iglesia.

-Pues yo no creo en Dios, pero creo en la Iglesia.

- ¿?

- ¡Los curas existen!

Aunque esté menos claro de lo que pudiera parecer, procesamiento de la señal tiene que haber -y ello incluiría, aunque algunos puedan ver más turbiedades que otros en este asunto, parsing sintáctico-; que haya gramática y que domine todo desde su atalaya apenas recursiva es ya teología.

Por eso, reducir la gramática al parsing es una tentación recurrente (Colin Phillips habló del modelo Parsing is Grammar, PIG, acrónimo que nos recuerda el lema famoso: Ich bin mehr Angst vor den Deutschen, wenn sie ohne Panzerdivisionen kommen), pero esta reducción es sólo una de las posibilidades con las que contamos.

De hecho, lo más interesante sería negar que el lenguaje sea recursivo e investigar cómo puede funcionar algo que no sea recursivo. La idea sería que hay un componente de contingencia insalvable en la posibilidad de procesamiento exitoso de una oración, que vendría determinado (cabe Matthews) por las oraciones procesadas con anterioridad.

El lenguaje, sus oraciones, no formarían un conjunto recursivo, ni recursivamente enumerable quizás. De hecho, cada cuál accedería a una colección de oraciones marcada hasta cierto punto por el orden en que se accede y por vaya uno a saber qué determinaciones. Dentro de esta heterogeneidad, habría una notable estabilidad, pero no sería total.

Adviértase, no obstante y para nuestro por si acaso, que esa colección de oraciones se conceptuaría como una muestra, y las muestras lo son de algo; con lo que el lenguaje y la gramática que han salido por la puerta, entrarían por la gatera.

Salvo si no hubiera gramática y tampoco hubiera procesamiento lingüístico, que éste fuera tan de bricolage que le valiera todo. Que la gramática y las grandes regularidades y las grandes prohibiciones surgieran de un pequeño componente formal del procesamiento, tan mínimo y minimalista que se disolviera como gominolas en la lluvia.

jueves, 26 de mayo de 2011

The proof of the prezies

Estoy probando con prezi. Lo que sigue es una mini presentación chapuza a ver cómo se encaja.

Language and Literature on Prezi

lunes, 24 de enero de 2011

One step beyond

NLTK era un ejemplo, pero hay más que decir. Uno puede ser usuario de nltk, pero quedarse allí. Tal cosa le permitirá desde luego familiarizarse con ciertos recursos del ordenador y con ciertas maneras de hacer (que se parecen más a cómo se hacen las cosas) que las GUIs han ocultado a casi todos los guys; pero eso tampoco es saber cómo se han programado las funciones y estructurado los módulos. Es preciso situarse en un zona en que no se sea sólo usuario y uno se empiece a parecer a un desarrollador. Esto es un objetivo ambicioso y plantea problemas serios en la estructuración de la enseñanza. La pregunta sería qué módulo empezar a analizar, qué se enseña primero a programar. Aquí hay alguna sorpresa y por ejemplo el orden de los capítulos del libro de Bird y compañía no es una guía obligada ni la mejor.
Las secciones "How it works" del libro de Jacob Perkins son un buen paso en este sentido.

sábado, 22 de enero de 2011

¿Qué enseñamos (esto es, qué aprendemos nosotros primero)?

Una pregunta muy sencilla: ¿Qué enseñamos a los alumnos de lo que un día se llamó Filologías: un programa como Wordsmith o les enseñamos NLTK?

¿Puede un programa como Wordsmith detener el aprendizaje? O, lo que es peor, llevar la investigación empírica por aquellos territorios donde nos puede conducir Wordsmith y no por otros que requieren herramientas de las que no disponemos, que no sabemos manejar y que nunca nos atrevimos a fabricar?
Aplíquese la cuestión a otros recursos y herramientas que pueblan lo que se conoce como "nuevas tecnologías" y contémplese los dos caminos que se abren.

Páginas