Elizabeth Brody

Durante la primera mitad de este siglo, las corrientes iinguiiticas predominantes se preocuparon por describir la estructura del lenguaje solo hasta el nivel de la oracion. Tanto los generativistas como los estructuralistas concentraron sus esfuerzos en lograr descripciones de la fonologia y la sintaxis de la oracion, sin tomar en cuenta unida'desmas extensas del lenguaje. Sin embargo, desde los anos setenta las fronteras de la linguistica, como disciplina, se han abierto para incluir el estudio de fenomenos que rebasan los limites de la oracion. Aun los generativistas, incluyendo a Chomky, ahora hablan tanto de una gramatica de la oracion como de una gramhtica del discurso (veanse Chomsky 1975a, 1975b; Williams 11977). Uno de los fenomenos que rebasa los limites de la oracion y que ha constituido un problema fundamental para una gramatica del discurso, es el de los recursos linguisticos que tienen los hablantes de una lengua para organizar secuencias de oraciones o enunciados; es decir, los elementos que proporcionan coherencia y cohesion a un discurso. Entre estos recursos se encuentra un grupo de palabras y expresiones provenientes de varias categorias sintacticas,que en anos recientes se les ha nombrado "nexos","conectivos", "conjuntivos", "marcadores de discurso", o 'knlaces extraoraciona&ts".Este conjunto de elementos incluye: 1:) conjunciones (simples y compuestas), p. ejem. pero, sin embargo; 2) adverbios (con alcance al nivel de la oracion), p. ejem. despues, alternativamente, 3:) frases prepositivas, p. ejem. en conclusion, por un lado; 4) particulas e interjecciones,p. ejem. bien, 5) elementos lexicos referenciales y oraciones completas, p. ejem. De estopodemos concluir..., Para resumir... La numeracion ascendente representa un continuo de

ANUARIO DE INVESTIGACION

los elementos mas gramaticalizados hasta los recursos meramente semanticos, es decir, menos codificados. En esta investigacion se estudia un numero amplio de elementos que se clasifican en las cuatro primeras categorias, en su uso como organizadores del discurso en espanol. La investigacion espera encontrar las respuestas a las siguientes preguntas- jcuales son los nexos conjuntivos que sirven para organizar el discurso en espanol?; jcuales se usan con mis frecuencia?; jcual es la distribucion de los nexos por generos discursivos?;jhay correlaciones de unos nexos con otros?; jcomo funcionan los nexos piara contribuir a la coherencia de un discurso?; jcuales son las regularidades que se pueden observar en el uso de los nexos?; ja que nivel de la gramatica pertenecen?; ja partir del uso de estos conectivos, se detectan estrategias distintas para organizar el discurso? Responder a estas preguntas hara posible una definicion mas precisa, a nivel operacional y teorico, de los nexos, como una clase de elementos linguisticos.

MARCO CONCEPTUAL Se trabaja dentro de la tradicion que busca describir y formular un modelo para el lenguaje en uso, es decir, el habla, la actuacion. Asi, se presupone que el lenguaje en uso siempre es coinunicativo y siempre refleja la presencia de los ineerlocutores. Ademas, el lenguaje siempre se usa en un contexto al cual es "sensible". Aqui se incluye no solamente el contexto extralinguistico (cultural, social, cognoscitivo), sino tambien el contexto linguistico. Se ha senalado que las unidades de analisis mas grandes que la oracion forman uno de los temas principales del analisis del discurso. Asi muchos investigadores han postulado el texto' como la unidad maxima de analisis lingui~tico.~ Las definiciones de Texto" difieren un poco entre los autores. La que adoptamos aqui representa una sintess de varias propuestas; a saber: el registro verbal de un acto comunicativo que representa una unidad (logicasemantica-referencia11 del lenguaje (oral o escrito) de cualquier longitud o duracion. Lo importante es, por una piarte, que la produccion verbal se da en un contexto real de uso y, por otra, que el texto no corresponde a una unidad

L O S N E X O S C O N J U N T l V O S C O M O O R G A N I Z A D O R E S DEL D I S C U R S O

grarnai.ica1 como la oracion o el periodo, sino a una unidad de significado comunicativo. De la misma manera que hay grados de gramaticalidad para oraciones, siempre habra casos de incertidumbre en cuanto a si un texto esta "bien formado" o no. Sin embargo, aunque no siempre es po:jible dar un juicio definitivo, los hablantes de una lengua si son sensibles a ia distincion y en la mayoria de los casos no tienen problemas para identificar trozos de lenguaje que no forman un texto. Ahora bien, si los hablantes de una lengua saben cuando una secuencia de oraciones o enunciados se siguen y forman un texto, deben existir factores susceptibles a la descripcion para caracterizar lo que e.i un texto. Varios investigadores han hecho el intento de llegar a criterios especificos para tal caracterizacion (veanse, por ejemplo, van Dijk 1972; de Beaugrande 1980; de Beaugrande y Dressler 1981; Halliday y Hasan 1976). Entre estos criterios, hay dos que figuran en casi todas las discusiones: la cohesion y la coherencia. Bajo cohesion, s e agrupan todos los mecanismos que propisrciona el sistema linguistico para asegurar que los elementos de la superficie estan relacionados y que estas relaciones sean recuperables. La nocion de "coherencia" generalmente se reserva para describir las relaciones no explicitas entre oracionedenunciados -relaciones que dependen d e diferentes tipos de conocimiento que el emisor presupone que son comparticios con el receptor. Incluyen conocimiento del mundo y de ciertas relaciones logicas, saberes culturales, conocimiento del tema y de la informacion transmitida hasta un momento dado en el acto comuniicativo mismo. De estas dos propiedades, la coherencia es obligatoria para la comprension, y los receptores siempre intentan buscarla en un texto. En resumen, la coherencia de un texto tiene que ver con las relaciones semanticas (en sentido amplio) subyacen~es,mientras que la cohesion se refiere a los recursos formales que el sistema linguistico pone a la disposicion del eniunciador para hacer explicitas estas relaciones. Los recursos linguisticos quse proporcionan cohesiim a un texto son muchos y de categorias muy heterogeneas. Algunos de ellos incluyen la sintaxis, la correferencia, las pro-formas, las conjunciones, etc. Estos recursos operan dentro de la oracion, que en la tradicion linguistica se ha considerado como la unidad maxima de estructura gramatical. De hecho, porsu estructura, e independientemente de la presencia de otros elementos, cualquier unidad

gramatical es afortzoricohesiva. Si todos los textos estuvieran limitados a una sola oracion, la cohesion pudiera ser explicada como una funcion de la estructura. Sin embargo, la mayoria de los textos estan formados por mas de unai oracion. Entonces, la pregunta es: que sentido podemos hablar de estructura" mas alla del nivel de la oracion? Mandelbrot (1965: 263) ha expresado la paradoja de esta manera: "El discurso humano es a la vez altamente estructurado y altamente impredecible". Es decir, en un texto cualquier enunciado/oracion puede seguir a cualquier otro. Somos libres de decidescribir lo que queramos Sin embargo, cada enunciado/oracion establece ciertas expectativas de tal manera que el receptor se da cuenta cuando no se cumplen. Se ha sugerido que el concepto de "bien formado" aplicado a la nocion de texto es relativo en id mismo sentido que en su aplicacion a la nocion de oracion; sin embargo es probable que las restricciones sobre que unidades puedan seguir a que otras no sean tan fuertes como en la sintaxis, dado que el enunciador siempre tiene la opcion de producir un enunciado/oracion que no es pertinente, que "no se sigue". Por otra parte, la nocion de estructura en sintaxis se basa en las relaciones entre constituyentes. Sea cual sea la irelacion entre las partes de un texto (oraciones, parrafos o enunciados), no es e1 mismo tipo de estructura (:relacion) que se encuentra entre elementos de una oracion. Por ejemplo, no es posible caracterizar los parrafos en terminos de las combinaciones posibles y no posibles de tipos de oraciones, como se hace al hablar de oraciones coomrdinadas y subordinadas. Este hecho, sin embar,go, no excluye la posibilidad de hablar de la "estructura" (pero en otro sentido) de unidades de texto mas grandes que la oracion. Esta claro que por lo menos algunos generos de di:jcurso (quiza la mayoria) consisten en un cierto conjunto d e elementos obligatorios que, por lo general, aparecen en un cierto orden. El analista, entonces, se enfrenta :a dos problemas distintos: 1) explicar las relaciones entre entidades linguisticas que son estructuralmente independientes, pero que se siguen temporal y espacialmente en la construccion de un texto; y 2) explicar como cada enunciado/oracion contribuye a la coherencia del texto entero, como una unidad. Para solucionar estos problemas, varios linguistas, y otros investigadores que tambien se ocupan del lengualie, han propuesto un nuevo nivel de analisis: el pragmatico o el discursivo. Aunque su estatus y alcance con respecto a la teoria linguistica constituyen todavia un asunto polemico, su propuesta de analisis intenta cubrir fenomenos de coherencia como actos de habla, presu-

LOS N E X O S C O N J U N T I V O S C O M O O R G A N i Z d D O R E S D E L D I S C U R S O

posiciones, implicaciones convecjacionales (implicatures), deixis, conocimiento del mundo, etc. Mientras que hay mucho desacuerdo en cuanto a que incluir en "pragmatica"y/o "discurso"(muchos usan los terminos para referirse a fenomenos distintos), en general hay consenso en excluir condiciones de verdad, inferencias (entailments), el comportamiento de los cuantificadores y otros aspectos del significado que tradicionalmente han sido objeto de estudio de la semantica per se. Los argumentos a favor de la existencia de un nivel de analisis distinto de los niveles tradicionales de analisis linguistica, se basan parcialmente en los problemas que ciertos elementos siempre han ofrecido para uin tratamiento gramatical. Entre ellos se incluyen los adverbios y locuciones adverbiales con alcance a nivel de la oracion, las conjunciones coordinantes y las particulas e interjecciones, como bien, bueno, etc. Estos tres grupos de elementos tienen en comun el hecho de que todos pueden utilizarse para enlazar secuencias de enunciados/oraciones en un texto. Ellos forman el objeto de estudio de esta investigacion. El uso de los nexos conjuntivos es el recurso por excelencia para organizar unidades grandes del discurso y siempre resalta las relaciones logcas o interactivas entre las partes que urien. Ademas, a excepcion de las conjunciones coordinantes, los nexos conjuntivos son elementos poco estudiados pero merecedores de un lugar en las gramaticas de una lengua.

El corpus , y el estudio piioto El corpus que sirve de base para ia investigacion se conforma de muestras del lenguaje oral y escrito. La mayor parte del corpus de lenguaje escrito forma parte del correspondiente al proyecto del Diccionario &Espanol de M i c o (DEM), que se desarrolla bajo la direccion del Dr. Luis Fernando Lara, con el patrocinio de E1 Colegio de Mexico. El corpus escrito esta integrado por muestras de cuatro generos de discurso escrito: literatura, ciencias, tecnicas y periobsmo. La parte que proviene del DEM consiste en textos publicados entre 1921 y 1973. Su seleccion corresponde a criterios tales como tiraje, numero de ediciones e importancia en el medio. Los textos pertenecen a diferentes autores, excepto en dos o tres casos, pero

ANUARIO

DE ~NvESTICACION

cuando hay mas de un texto por autor, es en diferentes generos. La parte del corpus que esta computarizado esta integrado por muestras de textos de dos mil palabras cada uno. Mediante una tabla de numeros aleatorios se selecciono la pagina y un parrafo de Ia publicacion (un parrafo equivale a lo que esta entre dos puntos y aparte); se repitio el proceso hasta acumular el numero de parrafix necesarios para completar la cifra de aproximadamente dos mil palabras. El corpus del DEM ha sidlo complementad con muestras de discurso de textos publicados entre 1973 y 1994 siguiendo los mismos criterios. El corpus de discurso oral cc~nsisteen muestras recolectadas a partir de los anos sesenta. Otra vez se decidio aprovechar de un corpus ya existente, el del Proyecto de Habla de la Ciudad de Mexico realizado bajo la direccion del Dr. Juan M. Lope Blanch, con el patrocinio de la Universidad Nacional Autonoma de Mexico, y se le esta complem~cntandocon muestras de habla de los noventa. Usamos los mismos criterios que se usaron con las muestras escrita~spara determinar cuales partes del corpus se computarizan. El analisis cuantitativo se basa solamente en las muestras computarizadas. Para el analisis cualitativo, sin embargo, se recurre al contexto mas amplio de cada parrafo siempre que se considera necesario. Para esbozar problemas metodologicos, obtener una lista preliminar de elementos conectivos y explorar la posibilidad de utilizar un corpus computarizado, se llevo a cabo un estudlio piloto. Fueron revisados dos libros de temas cientificos, un libro de ensayos politicos y literarios, una novela y un ejemplar de periodico. La muestra total suma mas de 300 mil palabras o aproximadamente 27% del corpus final. Se da prioridad al genero cientifico (lSl%), ya que un bosquejo preliminar sugirio la hip6tesis de que en este genero se encuentra con mas frecuencia y variedad el uso de los nexos conectivos. Se observo que, por lo general, la oracion (sentence) empezaba con letra mayuscula y terminaba con alguno de los siguientes signos de puntuacion: punto'(.), punto y coma(;), y dos puntos(:). Tambien la oracion podia ser encenrada por signos de interrogacion(i?) o admiracion(i!). Esta correlacion es alta pero, por supuesto, no es perfecta ya que, por ejemplo, un uso comun d e los dos puntos(:) es el de introducir una lista de elementos. Por otro lado, existe el problema de las oraciones coordinadas separadas por una coma. En cada una de las publicaciones se identificaron los nexos que relacionabari una oracion con otra, y se conto el numero de oraciones graficas. Luego

LOS N E X O S C O N J U N T I V O S C:OMO O R G A N I Z A D O R E S D E L D I S C U R S O

se ficharon los nexos, anotando su posicion en la oracion. Finalmente se ordenaron los nexos por frecuencia y se hicieron agrupaciones tentativas. Se encontro que, en todos los generos, mas de 95% de los nexos aparecieron dentro de las primeras cinco palabras de cada oracion grafica. El promedio de nexos que aparecieron en esta posicion, para los cinco generos, fue dt. 97.7%. Este hecho sugirio la posibilidad de utilizar un programa, con un coirpus computarizado, que pudiera identificar los nexos en las primeras cinco palabras de cada oracion. Asi se cubriria practicamente el 98% de los enlaces que relacionan las oraciones graficas del corpus. Eri los cinco textos analizados se encontraron 141 nexos diferentes (tipos), repartidos de la siguiente manera 77 (0.55) comun a los cinco textos 25 (0.18) solo en Moulines (ciiencia) 14 (0.10) solo en Aguilar (ciencia) 11 (0.08) solo en Fuentes (ensayo) 12, (0.09) solo en LaJornada (periodismo) 2 solo en Azuela (novela) TOTAL 141 Los dos nexos que aparecen solo en la novela (pos, bueno) son caracteristicas del discurso oral y, de hecho, en la medida que la literatura incorpora dialogos o lenguaje que intenta reproducir el discurso oral, esta representa un genero mixto que debe ser analizado como tal. La variacion que se observa en los cuatro generos restantes oscila entre 8 y 18 por ciento; sin embargo, poco mas de la mitad (55%) son comunes a los cinco teritos. Ademas, comparando los 30 nexos mas frecuentes en los cinco textos, se encontro que 14 eran compartidos por los cinco textos y 8 mas aparecieron en dos generos cada uno. Este hecho sugeria que los generos no se distinguen por el tipo de nexo j>erse, o por lo menos que lai cuestion es mas complicada. Por otro lado, habia suficiente variacion individual entre los textos para advertir la importancia de eliminar este factor como una variable en el corpus final. Ahora bien; se hizo un intento de ordenar los 141 elementos identificados de acuerdo con las relaciones senlanticas que marcaban. Se comprendio que muchos de los nexos senalaban mas de una relacion, de acuerdo con el contexto en que aparecian, y que solamente analizando cada ejemplo se podria

determinar la funcion desempenada. Asi, por ejemplo, aunque el nexo ahora estaba entre los mas frecuentes en los cinco textos, en lo:; textos cientificos siempre se referia al tiempo en el discurso o servia como marcador de transicion en el discurso. En la novela, en cambio, funciona.ba como adverbio deictico de tiempo. Tomando en cuenta este problema, se hizo un analisis preliminar, con atencion especial :a los elementos que marcaban mas de una funcion, para poder clasificar tentativamente a los nexos. El trabajo en computadoray la lista de nwxos

resultados del estudio piloto habian indicado que aproximadadamente 98% de los nexos interoracionales se encuentran dentro de los primeras cinco palabras despues de los signos de puntuacion ya mencionados. Asi se determino la posibilidad de hacer un programa de computadora que leyera las primeras cinco palabras de cada oracion grafica e identificara el nexo o nexos que encontrara.3 Se decidio incluir el guion (-) como signo de puntuacion, ya que aparecia con frecuencia en el corpus de literatura para marcar el dialogo. Tambien el programa identificaba, con su clave correspondiente, el texto en que aparecia el nexo, para facilitar el tra.bajo de recurrir al texto completo en el momento de realizar el analisis cua1,itativo.Finalmente fue posible hacer que se imprimieran las primeras siete palabras de cada ofacion con un nexo, para asi proveer un poco mas contexto IinguLstico. Para que la computadora reomociera los nexos era necesario darle una lista de los mismos. Del estudio piloto se habia compilado unos 141 elementos. A estos se les agregaron los nexos encontrados de una revision de los generos de ensayo, ciencias y tecnicas del corpus del DEM. Tambien se reviso el Diccionario de uso de espanol de Maria Moliner (1987) y el Diccionario ideoldgico de lengua espanola de Julio Casares (1988) para poder compilar una lista tan exhaustiva como fuera posible. Se termino con un conjunto de elementos de la siguiente conformacion: 382 palabras sericillas; 103 frases, y 44 raices. Las palabras sencillas incluian algunas "palabras claves" que servirian para identificar frases Iexicas de variacion minima. Se incluyeron raices para poder captar unas frases Iexicas u oraciones que serian de interes, aunque no formaran parte del conjunto de elementos analizados.

LOS N E X O S C O N J U N T I V O S C O M O O R G A N I Z A D O R E S D E L ' D I S C U R S O

Una vez que la computadora habia procesado la mformacion, fue necesaria una primera revision para eliminar aquellos elementos que habian sido identificados pero que no funcionaban como conectivos. Luego se procedio a organizar los datos en una base de datos de computador (D-Base, versijn 4.0) para realizar el anallisis cuantitatnio. Como se habia identificado mas de 500 elementos conjuntivos diferentes en el corpus, se decidio limitar el analisis cualitativo a unos 60-70, seleccionados con base en la frecuencia de aparicion y el grado de gramaticalizacion.A la fecha se esta llevando a cabo esta fase de la investigacion.

De Beaugrande, Robert. 1980. T a t , a!iscourse,andprocess towaid a multidisciplinay science of t e a . Londres: Longman. -y Wolfgang Ulrich Dressler. 1981. Introduction to textlinguisti-stiu.Londres: Longman. Buhler, Karl. 1934. Sprrrcbtheorie: Die Darstellungsfirnktion der Sprache. Jena: Fischer. Version espanola de Julian Marias. Teorla del Cenguaje Madrid: Aiianza, 1979. Casares, Julio. 1988, 2a. ed. [la ed. 19421. Diccionario deologico de la lengua espanola. Barcelona: Gustavo Gili. Chomsky, Noam. 1975a. Reflctions on hnguage. Nueva York: Pantheon. -197% Questions of form and interpretation. Linguistic Analyris 1:1, 75-109. Coseriu, Eugenio. 1955. Determinacio11 y entorno: dos problemas de una linguistica del hablar. En Teoria del lenguaje y linguistica g e w a l . Cinco estua!ias.Madrid: Gredos. van Dijk, Teun A. 1972. Some aspects qf ttxtgrrrmma,: La Haya: Mctuton. Firth, J. R. 1935. The techniques of semantics. En Fapers in linguistics 1934-1951.Londres: Oxford University Press, 1957. Halliday, M. A. K. y Ruqaiya Hasan. 1976. Cohesian in English. Londres: Longman. Harris, Zellig S. 1952. Discourse analysis. Language 28:1, 1-30 y 4, 474-94. Mandelbrot, B. 1365. Infonnation theory and psycholinguistics. En Iknjamui B. Wolman y Emest Nagel, eds. [email protected] York: Basic Books. Nloliner, Maria. 1987 [la ed. 1366171. Dicciaario de use del esp&rGol.2 tomos. Madrid: Gredos. Pike, Kemeth L. 1367. hnguage in ~ h t i o nto a un$ed theoy cf human behauior. La Haya: Mouton. Williams, Edwin. 1977. Discourse and logical form. Linguistic Inquiiy 8 1 , 101-140.

NOTAS Otros d i r i a "discurso" pero quisieramos reservar este termino para referimos al nivel de analisis y no a la unidad.

Veame Buhler 1934; Coseriu 1955; Firth 1935; Harris 1952; y Pike 1967 para ejemplos de propuestas tempranas que el texto o el discurso debe ser el objeto de estudio de la linguistica. 3 Tengo que agradecer a la Lic. Ma. Isabel Garcia Hidalgo, quien realizo, de manera magistral, el trabajo de programacion y procesamiento de los datos. Sin su paciencia y meticulosidad en el trabajo, este estudic no hubiera sido posible.