ESTUDIO EXPERIMENTAL DE LAS UNIDADES PROSÓDICAS DEL DISCURSO Y SUS FUNCIONES

 

clac 18

 

 

Gorka Elordieta Alcibar, Magdalena Romera Ciria

Universidad del País Vasco-Euskal Herriko Unibertsitatea, Universitat de les Illes Balears

fepelalg@vc.ehu.es, mromera@uib.es

 

 

 

Palabras clave del proyecto: entonación, discurso, español, experimental, unidades prosódicas, patrones entonacionales, estructuras discursivas.

Investigador Principal: Gorka Elordieta Alcibar (Universidad del País Vasco-Euskal Herriko Unibertsitatea y LEHIA).

Miembros del equipo investigador: Magdalena Romera Ciria (Universidad de las Islas Baleares) y José Ignacio Hualde (University of Illinois at Urbana-Champaign).

Entidad financiadora: Ministerio de Ciencia y Tecnología. Referencia: BFF2001-1593. Duración: 28-12-01 a 27-12-04.

 

1. Introducción

Lingüísticamente aceptamos que ‘discurso’ es algo más que un conjunto secuencial de frases. El discurso tanto oral como escrito se puede segmentar en unidades básicas que forman una estructura cuya característica principal es la coherencia interna. Esto es lo que diferencia un fragmento discursivo, de un conjunto de oraciones unidas al azar, el primero puede ser interpretado de manera coherente mientras que el segundo no. Siendo esto así, parece razonable suponer que estas unidades tengan unas características propias dependiendo de la información que transmiten y del tipo de relación con el que se conectan entre sí. Por ejemplo, el orden en el que se sitúan dos segmentos discursivos unidos mediante una relación de adición puede ser alterado (S1+adición+S2 o S2+adición+S1), mientras que dos segmentos en relación causal o adversativa no. Dentro del discurso oral además, también parece lógico pensar que entonacionalmente estas unidades puedan presentar asimismo características propias dependiendo de ciertos factores.

Las investigaciones recientes sobre la aportación de la entonación a la estructura del discurso y la interpretación que de ella se hace permiten aventurar resultados muy satisfactorios que pueden ser aplicados en muchos campos, entre ellos en un área en creciente demanda: la sistematización de los sistemas automáticos de interpretación y producción de habla. Mientras que en otras lenguas, particularmente en inglés, las investigaciones en esta área se siguen sucediendo constantemente desde hace más de dos décadas (Hakoda et. al. 1980), el español todavía carece de estudios sistemáticos que permitan identificar patrones entonacionales en correspondencia con diferentes estructuras discursivas. Hasta el momento la mayoría de las investigaciones se centran en frases aisladas y no en datos obtenidos de conversaciones naturales.

En este proyecto nos proponemos investigar la contribución de los distintos tipos de estructuras prosódicas en relación a la interpretación de los distintos tipos de unidades discursivas y al tipo particular de relación que se establece entre ellas. Más concretamente, investigamos la conjunción de varios aspectos prosódicos como los tonos de frontera, acentos tonales, acentos de frase, naturaleza y distribución de pausas, estudio de la frecuencia fundamental (F0) en su inicio, final y ratio de valores absolutos, para tipificar cómo y en qué medida estos parámetros cambian correspondiendo a los distintos tipos de estructuras discursivas.

En la última década el estudio de la entonación del discurso ha recibido cada vez más atención, en primer lugar dentro de las nuevas perspectivas lingüísticas del estudio del lenguaje como instrumento social (Hymes 1972) y en segundo lugar, atendiendo a la demanda creciente de soluciones en la investigación del procesamiento del lenguaje natural. En ambos casos el objetivo fundamental ha sido y sigue siendo la sistematización de la estructura del discurso oral.

Dentro de la perspectiva social del estudio de la lengua, una de las corrientes más productivas de investigación se ha dado en EE. UU. en el estudio del discurso conversacional en inglés (Chafe 1992, Dubois et al. 1993). Así, se considera que el discurso se puede estructurar en unidades entonativas que se correlacionan con unidades de pensamiento (idea units). Estas unidades presentan ciertos rasgos suprasegmentales que permiten identificarlas: pausas al principio y al final de la unidad, un patrón de aceleración en el comienzo seguido de deceleración en el final, bajada en el nivel de timbre y tonema final descendente. Estos estudios han sistematizado hasta cierto punto la estructura del discurso. Sin embargo todavía presentan serias carencias. En primer lugar, se han realizado únicamente desde el punto de vista perceptual, sin contar con métodos experimentales computerizados. Como indican Schuetze et al. (1991), las unidades entonativas determinadas a través de la percepción auditiva pocas veces suelen coincidir con rasgos relevantes desde el punto de vista acústico. Por ejemplo, las fronteras entre unidades prosódicas no siempre están representadas por pausas. En segundo lugar, identificar una sola unidad discursiva deja de lado el hecho de que hay diferentes tipos de estructuras dependiendo de factores como el contenido que se expresa en ellas o las relaciones de coherencia que se establecen entre las mismas.

En este sentido, la corriente de investigación que hasta ahora ha ofrecido mejores resultados sobre la contribución de la entonación a la interpretación y estructuración del discurso es aquella que acomete el estudio experimental computerizado de las propiedades prosódicas sobre la base de una tipología previamente definida de unidades discursivas y de relaciones estructurales de coherencia entre ellas. Este es el marco teórico en el que basamos nuestra investigación. Como mencionábamos anteriormente, hasta ahora los estudios más importantes llevados a cabo desde este punto de vista se han desarrollado primordialmente para el inglés (Hirschberg y Pierrehumbert 1986, Pierrehumbert y Hirschberg 1990, Nakajima y Allen 1993, Ferrara 1997, 2001, entre otros), aunque también se encuentran trabajos sobre otras lenguas, como por ejemplo el holandés (Swerts y Geluykens 1993), el sueco (Horne et al. 2001) y el francés (Simon y Grobet 2002). Entre nosotros, algunos trabajos constatables realizados sobre el español dentro de este marco teórico se han comenzado a realizar sólo muy recientemente (Hidalgo y Pons 2001, Elordieta y Romera 2002, Romera y Elordieta 2002, Dorta y Domínguez 2002, Martín Butragueño 2003). Los resultados obtenidos hasta el momento indican que así como para el inglés se han podido identificar ciertos patrones entonacionales discursivos, para el español es posible la obtención de resultados similares. Estos resultados pueden tener una aplicación práctica inmediata en la derivación de algoritmos para la identificación automática de estructuras discursivas.

 

2. Objetivos generales y específicos

Los objetivos generales de este proyecto que pueden tener mayor repercusión dentro de las teorías lingüísticas son dos. En primer lugar, profundizar en el conocimiento de las estructuras prosódicas discursivas en español desde un punto de vista experimental. En segundo lugar, y a través de este conocimiento, llegar a delimitar con mayor precisión el papel de la elección de un determinado patrón entonacional para la consecución de ciertos objetivos (semánticos, pragmáticos y textuales) dentro del discurso. Así pues, nuestro objetivo final es obtener una tipificación de los modelos prosódicos correspondientes a las estructuras discursivas elementales en el español oral, de tal modo que sea fácilmente aplicable a otras áreas científicas relacionadas con la lingüística, como el procesamiento del lenguaje natural. Para la consecución de estos objetivos teóricos nos hemos fijado los siguientes objetivos prácticos o particulares que definirán la subdivisión de este proyecto en sus distintas partes.

En primer lugar, se pretende obtener un corpus oral del español que reúna las condiciones prosódicas adecuadas para un estudio de estas características. Hasta el momento los córpora existentes no garantizan la precisión acústica que requiere el estudio de los parámetros prosódicos de los tonos de frontera, acentos tonales, acentos de frase, naturaleza y distribución de pausas, estudio de la frecuencia fundamental (F0) en su inicio, final y ratio de valores máximos.

En segundo lugar, será necesario lograr una delimitación tipológica previa de las unidades discursivas en español de acuerdo a los criterios de coherencia, dentro del marco teórico general de la teoría de Relaciones Retóricas o de Coherencia que tan buenos resultados ha dado para otras lenguas (cf. Sanders et al. 1992, Romera 2003).

En tercer lugar, deberemos determinar los principales aspectos prosódicos de estas estructuras discursivas, analizando estadísticamente en qué medida existe una correspondencia entre los cambios de cada uno de los parámetros entonacionales estudiados de manera individual o en su conjunto, y los diferentes tipos de estructuras en el discurso.

Finalmente, se pretende obtener una serie de conclusiones claras sobre la tipificación prosódica del discurso y sus condiciones.

Para lograr estos objetivos, hemos formado un equipo con demostrada experiencia investigadora en aspectos de prosodia, entonación y análisis del discurso. Los profesores Elordieta y Hualde son investigadores especialistas en el campo de la prosodia y la entonación de lenguas como el español, el catalán y el euskera. A su vez, la profesora Magdalena Romera es especialista en el área del análisis del discurso y de variación lingüística. En su libro recientemente publicado (Romera 2003), la profesora Romera lleva a cabo un estudio analítico y cuantitativo de las principales características de las Unidades Funcionales del Discurso en español, también denominadas Marcadores del Discurso.

 

3. Metodología y plan de trabajo

El plan de trabajo preparado por el quipo investigador consta de los siguientes pasos, ordenados cronológicamente:

 

1) Obtención del corpus oral. En primer lugar se debe obtener un corpus oral que reúna la calidad prosódica adecuada. Se diseñará la obtención de materiales de la muestra teniendo en cuenta los siguientes parámetros lingüísticos: sexo, edad, lugar de origen. La muestra se toma de hablantes monolingües nativos de español peninsular de la zona norte de España. Se elaborará un pre-test a cada uno de los informantes para lograr homogeneidad en las características del F0 de todos ellos (véase Nakajima y Allen 1993). Las grabaciones se harán en lugares cerrados, lo más aislados posible de ruidos interiores y exteriores. No se pudieron realizar grabaciones en cabinas insonorizadas de laboratorio debido a que las grabaciones se realizaron en campo, es decir, en el ambiente local de nuestros sujetos.

 

2) Análisis y codificación de las unidades discursivas de las grabaciones. Las grabaciones efectuadas se transcribirán con anotaciones prosódicas, es decir, con la división de textos en unidades discursivas atendiendo a criterios de segmentación prosódica tales como la presencia de pausas o niveles de juntura equivalentes o superiores a los de una Frase/Sintagma Entonativo, y entonación final descendente. Estas unidades se codificarán atendiendo a los siguientes parámetros: tipo de segmento discursivo 1, codificación de su contenido, tipo de segmento 2, relación de coherencia que los une; marcadores lingüísticos explícitos que señalan esta relación; relación con las unidades previas analizadas.

 

3) Identificación de las estructuras prosódicas. Se llevará a cabo un análisis de las principales propiedades acústicas de las unidades discursivas anteriormente segmentadas, como son la naturaleza y distribución de pausas o los contornos de F0 internos y de juntura. Estos datos se codificarán asimismo dentro de una base de datos para su posterior tratamiento estadístico.

 

4) Estudio estadístico de las correspondencias entre estructuras discursivas y patrones entonacionales. En esta fase se llevará a cabo el análisis de los datos obtenidos tanto de la estructura discursiva de las grabaciones como de los patrones entonacionales que se corresponden con cada una de ellas. Mediante su tratamiento estadístico se tratará de analizar hasta qué punto se pueden establecer correlaciones entre ambas. Asimismo se analizarán los datos desde un punto de vista cualitativo, tratando de obtener una serie de conclusiones fiables.

 

5) Redacción de conclusiones. En este punto se extraerán las conclusiones más representativas de cada uno de los objetivos marcados para este proyecto, intentando ofrecer una tipología de patrones prosódicos en el discurso en español con base en los análisis empíricos. Asimismo se evaluarán las implicaciones teóricas y prácticas de los resultados obtenidos y su posible proyección en campos afines.

 

4. Implicaciones de los resultados obtenidos

Como se explica en los apartados anteriores, uno de los principales atractivos de este proyecto es que hasta el momento existe un vacío en el estudio de la relación entre la prosodia y el discurso en español. Existen unos poco estudios que se han llevado a cabo a partir de frases sueltas y aisladas, no de habla natural, y el propósito de nuestro estudio es acometer por primera vez el análisis experimental de la prosodia en diálogos cooperativos. Los campos afines a la lingüística en los que se puede aplicar los resultados de la presente investigación son varios: en el procesamiento del lenguaje natural, la descripción detallada de una tipología entonacional en el discurso proporciona las bases para la asignación de reglas en la conversión de texto a habla, reconocimiento de habla, y sistemas de diálogo, que integran el reconocimiento y la comprensión semántica del habla, interactuando con el usuario.

Los resultados de nuestro estudio tienen asimismo aplicación inmediata al campo de la adquisición de lenguas. Dentro de los procesos de adquisición de primeras lenguas se sabe que la identificación de los rasgos prosódicos es uno de los mecanismos más claros y más tempranos que el niño utiliza como medio de segmentación del habla que recibe (Karmiloff-Smitth 1996, Saffran 1996). Se sabe asimismo que el niño utiliza como primera fuente de información semántica la información prosódica que recibe codificada en el habla de sus cuidadores. Esto le permite por un lado ser capaz de reaccionar a los mensajes que recibe y asimismo a comprender porciones de discurso. El hecho de que hasta el momento para el español no dispongamos de una tipología entonacional adecuada con base en mediciones experimentales dificulta en gran medida el estudio del aprendizaje de esta primera lengua (Ruiz Bikandi 2000). Del mismo modo, en la adquisición de lenguas extranjeras los educadores vienen solicitando desde hace años la necesidad de contar con estudios detallados de los patrones entonacionales del discurso en español. Hasta el momento no existe ningún trabajo que permita la comparación interlingüística de patrones entonacionales (por ejemplo, entre el inglés y el español), lo cual sería de gran ayuda para los aprendices de nuestra lengua.

Finalmente, otra consecuencia positiva de este proyecto sería que los colaboradores o becarios de este proyecto decidieran desarrollar una tesis doctoral sobre el tema del proyecto o alguno de sus aspectos concretos. Pensamos que es un tema que en sí es sumamente importante pero que de él se pueden derivar muchas ramificaciones o temas englobados dentro del tema más general de la relación entre prosodia y discurso. Los becarios resultarán beneficiados de dichas actividades, puesto que serán instruidos en la metodología de los trabajos experimentales, y concretamente de los trabajos sobre prosodia y discurso: métodos de anotación o división prosódica de textos, codificación y análisis cuantitativo de los datos, análisis entonacional de los mismos usando modernos programas de análisis acústico, y análisis estadístico de los datos almacenados (Excel, SPSS) para la elaboración de posteriores conclusiones.

 

5. Actividades realizadas hasta ahora

Durante el primer año se ha llevado a cabo la grabación, digitalización y análisis acústico de las primeras conversaciones naturales de nuestro corpus. Dichas grabaciones se efectuaron a 10 hablantes nativos de español peninsular (i.e., de España), 3 hombres y 6 mujeres, con edades comprendidas entre los 25 y 47 años. Las porciones de las grabaciones que contenían material relevante para nuestro estudio (concretamente aquellas porciones que contuvieran unidades funcionales del discurso, tradicionalmente conocidas como marcadores discursivos) se archivaron en formato de sonido digital por medio del programa Cool Edit Pro en un PC. Posteriormente, el material lingüístico de cada uno de los archivos fue analizado por medio del programa de análisis acústico PitchWorks, de Sicon R&D, centrándonos en la observación y estudio de los principales patrones prosódicos de los enunciados que precedían a las unidades funcionales del discurso.

Para un primer estudio, seleccionamos la unidad funcional del discurso entonces, y observamos que dependiendo de si la unidad entonces encabezaba o no una proposición que finalizaba la argumentación iniciada en el discurso anterior, el contorno entonacional que mostraba la unidad entonces variaba. Mientras entonces presentaba una entonación ascendente o de mantenimiento tonal si esta unidad encabezaba una proposición no final (es decir, que desde el punto de vista de la argumentación o de la narración iniciada por el hablante dicha proposición aún no constituyera el argumento final), la entonación de entonces presentaba un patrón descendente en la mayoría de los casos en los que la proposición encabezada por dicha unidad terminara la argumentación o narración del hablante. Los resultados de este estudio fueron presentados en el congreso internacional Speech Prosody 2002, celebrado en abril en Aix-en-Provence, Francia, y publicados en las actas de dicho congreso. Una versión más completa fue publicada en la revista Oralia, especializada en estudios de análisis del discurso. Véase Elordieta y Romera (2002), Romera y Elordieta (2002) en las referencias bibliográficas.

El tema de la segmentación o división de un enunciado en unidades entonacionales es un apartado importante dentro de nuestro proyecto de investigación. Nuestra actividad en este tema ha dado lugar a colaboraciones con investigadores de España y otros países que se encuentran trabajando sobre este mismo tema en otras lenguas románicas. Esta colaboración es importante puesto que pone de relieve las similitudes y diferencias que pueden encontrarse en las diferentes lenguas románicas. Estos investigadores son Pilar Prieto (U. Autònoma de Barcelona), Sónia Frota y Marina Vigário (U. de Lisboa y U. de Minho, Portugal), y Mariapaola D’Imperio (CNRS, Francia). El trabajo en conjunto ha dado lugar a presentaciones en congresos internacionales como el Workshop on Boundaries in Intonation (U. de Lund, 12 de abril de 2003), Phonetics and Phonology in Iberia 2003 (U. de Lisboa, 11-12 de junio de 2003), y el 15th International Congress on Phonetic Sciences (Barcelona, 3-9 de agosto de 2003). Las publicaciones resultantes de dichos trabajos aparecen en la lista de referencias bibliográficas como Elordieta, Frota, Prieto y Vigário (2003), Elordieta, Frota y Vigário (en prensa), y D’Imperio, Elordieta, Frota, Prieto y Vigário (en prensa).

 

 

Referencias bibliográficas

Chafe, W. (1992). “Prosodic and functional units of language”. En Edwards, J. and Lampert, M. (eds.), Talking data: transcription and coding in discourse research. Hillsdale, NJ: Erlbaum.

D’Imperio, M., Elordieta, G., Frota, S., Prieto, P. y Vigário, M. (en prensa). “Intonational phrasing and constituent length in Romance”. Aparecerá en un volumen de trabajos seleccionados del congreso Phonetics and Phonology in Iberia 2003, 11-12 de junio de 2003, Lisboa (Portugal), editado por Frota, S., Vigário, M. y Freitas, M.J. Berlin: Mouton de Gruyter.

Dorta Luis, J. y Domínguez García, N. (2002). “La prosodia y las funciones discursivas de los marcadores del discurso”. Comunicación presentada en el V Congreso de Lingüística General, Universidad de León.

Dubois, J., Schuetze-Coburn, S., Cumming, S. y Paolino, D. (1993). “Outline of discourse transcription”. En Edwards, J. y Lampert, M. (eds.), Talking data: Transcription and coding in discourse research. Hillsdale, NJ: Lawrence Erlbaum.

Karmiloff-Smith, A. (1981). “The grammatical marking of thematic structure in the development of language production”. En Deutsch, W. (ed.), The child’s construction of language. Londres: Academic Press, pp. 121-147

Elordieta, G. y Romera, M. (2002). “Prosody and meaning in interaction: the case of the Spanish discourse functional unit entonces ‘then’”. En Bel, B. y Marlien, I. (eds.), Proceedings of the Speech Prosody 2002 Conference. Aix-en-Provence: Laboratoire Parole et Langage, pp. 263-266.

Elordieta, G., Frota, S., Prieto, P. y Vigário, M. (2003). “Effects of constituent weight and syntactic branching on intonational phrasing in Ibero-Romance”. En Recasens, D., Solé, M.-J. y Romero, J. (eds.), Proceedings of the 15th International Congress of Phonetic Sciences. Barcelona, pp. 487-490.

Elordieta, G., Frota, S. y Vigário, M. (en prensa). “Subjects, objects and intonational phrasing in Spanish and Portuguese”. Aparecerá en Studia Linguistica.

Ferrara, K.W. (1997). “Form and function of the discourse marker anyway: Implications for discourse analysis”. Linguistics 35: 343-378.

Ferrara, K.W. (2001). “Intonation in discourse markers – the case of anyway”. En Wennerstrom, A. (ed.), The music of everyday speech. Oxford y Nueva York: Oxford University Press, pp. 117-130.

Hakoda, K. y Sato, H. (1980). “Prosodic rules in connected speech synthesis”. System computer controls 11: 28-37.

Hidalgo Navarro, A. y Pons, S. (2001). “Sobre las propiedades prosódicas de los marcadores discursivos y su grado de especialización funcional”. Comunicación presentada en el XXXI Congreso de la S.E.L.

Hirschberg, J. y Pierrehumbert, J. (1986). “Intonational structuring of discourse”. En Proceedings of 24th meeting of the association for computational linguistics. Nueva York, pp: 136-144.

Horne, M., Hansson, P., Bruce, B., Frid, J. y Filipsson, M. (2001). “Cue words and the topic of spoken discourse: The case of Swedish men ‘but’”. Journal of Pragmatics 33: 1061-1081.

Hymes, D. (1972). “Models of the Interaction of Language and Social Life”. En Gumperz, J. y Hymes, D. (eds.), Directions in Sociolinguistics. The Etnography of Comunication. Nueva York: Holt, Rinehart and Winston, pp. 35–71.

Martín Butragueño, P. (2003). “Hacia una descripción prosódica de los marcadores discursivos. Datos del español de México”. Ms, El Colegio de México.

Nakajima, S. y Allen, J. F. (1993). “A study on prosody and discourse structure in cooperative dialogues”. Phonetica 50: 197-210.

Pierrehumbert, J. y Hirschberg, J. (1990). “The meaning of intonational contours in the interpretation of discourse”. En Cohen, P. R., Morgan, J. y Pollack, M. E. (eds.) Intentions in communication. Cambridge: MIT Press, pp: 271-311.

Romera, M. (2003). Discourse Functional Units: The expression of coherence relations in spoken Spanish. Munich: Lincom Europa.

Romera, M. y Elordieta, G. (2002). “Características prosódicas de la unidad funcional del discurso entonces: implicaciones teóricas”. Oralia 5: 247-263.

Ruiz Bikandi, U. (2000). Didáctica de la segunda lengua en educación infantil y primaria. Madrid: Síntesis.

Saffran, J.R., Newport, E.L., y Aslin, R.N. (en prensa). Word segmentation: the role of distributional cues”. Journal of Memory and Language.

Schuetze-Coburn, S., Shapley, M. y Weber, E. (1991). “Units of intonation in discourse: A comparison of acoustic and auditory analyses”. Language and Speech 34: 207-234.

Sanders, T., Spooren, W. y Noordman, L. (1992). “Towards a taxonomy of coherence relations”. Discourse Processes 15: 1-35.

Swerts, M. y Geluykens, R. (1993). “The prosody of information units in spontaneous monologue”. Phonetica 50: 189-196.

 

 

 

© Gorka Elordieta Alcibar, Magdalena Romera Ciria. Círculo de Linguística Aplicada a la Comunicación 18, mayo 2004. ISSN 1576-4737.

http://www.ucm.es/info/circulo/no18/elorrome.htm

 

clac 18

 

portada