• No se han encontrado resultados

La prosòdia del friülà en el marc de l Atles Multimèdia de Prosòdia de l Espai Romànic

N/A
N/A
Protected

Academic year: 2021

Share "La prosòdia del friülà en el marc de l Atles Multimèdia de Prosòdia de l Espai Romànic"

Copied!
28
0
0

Texto completo

(1)

La prosòdia del friülà

en el marc de l’Atles Multimèdia

de Prosòdia de l’Espai Romànic

Paolo Roseano

ADVERTIMENT. La consulta d’aquesta tesi queda condicionada a l’acceptació de les següents condicions d'ús: La difusió d’aquesta tesi per mitjà del servei TDX (www.tdx.cat) ha estat autoritzada pels titulars dels drets de propietat intel·lectual únicament per a usos privats emmarcats en activitats d’investigació i docència. No s’autoritza la seva reproducció amb finalitats de lucre ni la seva difusió i posada a disposició des d’un lloc aliè al servei TDX. No s’autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant al resum de presentació de la tesi com als seus continguts. En la utilització o cita de parts de la tesi és obligat indicar el nom de la persona autora.

ADVERTENCIA. La consulta de esta tesis queda condicionada a la aceptación de las siguientes condiciones de uso: La difusión de esta tesis por medio del servicio TDR (www.tdx.cat) ha sido autorizada por los titulares de los derechos de propiedad intelectual únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro ni su difusión y puesta a disposición desde un sitio ajeno al servicio TDR. No se autoriza la presentación de su contenido en una ventana o marco ajeno a TDR (framing). Esta reserva de derechos afecta tanto al resumen de presentación de la tesis como a sus contenidos. En la utilización o cita de partes de la tesis es obligado indicar el nombre de la persona autora.

WARNING. On having consulted this thesis you’re accepting the following use conditions: Spreading this thesis by the TDX (www.tdx.cat) service has been authorized by the titular of the intellectual property rights only for private uses placed in investigation and teaching activities. Reproduction with lucrative aims is not authorized neither its spreading and availability from a site foreign to the TDX service. Introducing its content in a window or frame foreign to the TDX service is not authorized (framing). This rights affect to the presentation summary of the thesis as well as to its contents. In the using or citation of parts of the thesis it’s obliged to indicate the name of the author.

(2)

La prosòdia del friülà

en el marc de l’Atles Multimèdia

de Prosòdia de l’Espai Romànic

Paolo Roseano

Tesi presentada per optar

al grau de

Doctor en Lingüística

amb menció europea

en el programa de doctorat de

Lingüística i Comunicació,

Bienni 2006-2008

Departament de Lingüística General,

Universitat de Barcelona,

sota la supervisió de

Dra. Ana Ma. Fernández Planas

Universitat de Barcelona

(3)

65

3. METODOLOGIA

A banda de descriure la prosòdia de les principats varietats dialectals del friülà, l’altre gran objectiu d’aquesta tesi és el de definir una metodologia de recerca que permeti evitar dos dels límits que s’han subratllat més sovint quan s’han descrit les característiques dels models d’anàlisi prosòdica (veg. Capítol 1), és a dir:

1) Treballar amb una quantitat relativament escassa de dades empíriques;

2) Definir les estructures prosòdiques a partir d’una valoració (subjectiva i, per tant, potencialment arbitrària) d’un recercador.

Justament per evitar aquests dos riscs, s’han elaborat procediments i eines adequades per recollir una quantitat important de dades i per processar-les d’una manera que no estigui vinculada exclusivament i ineludiblement al judici del recercador.

3.1. Metodologia per a la recollida de les dades

El primer bloc de qüestions metodològiques és el que té a veure amb la recollida de les dades, és a dir, amb la definició del corpus que s’ha de recollir en cada punt d’enquesta, amb la tria dels informants i amb els mitjans tècnics per efectuar aquesta recollida.

3.1.1. Construcció del corpus

Com s’ha dit a l’apartat 1.3, aquesta tesi s’insereix en el marc del projecte de l’Atles Multimèdia de prosòdia de l’Espai Romànic (AMPER), per tant compleix amb les normes establertes en el seu marc. AMPER preveu que per a cada localitat escollida es recullin quatre tipus de corpus: un corpus lliure (que generalment consisteix en una narració espontània per part de l’informant), un corpus induït mitjançant un map task, un corpus de frases d’ús comú (també induïdes a partir del plantejament de supòsits contextuals als informants) i un corpus fix, format per frases declaratives i interrogatives absolutes que contenen paraules trisíl·labes oxítones, paroxítones i proparoxítones en un ordre establert. És justament aquest últim tipus de corpus el que

(4)

66

proporciona els materials que s’utilitzaran en aquesta tesi. Per aquest motiu, és oportú il·lustrar les característiques de les frases que el formen.

Cada frase conté un sintagma amb funció de subjecte (S1), un sintagma amb funció de verb (S2) i un sintagma complement verbal amb funció d’objecte directe o de complement circumstancial (S3). L’S1 i l’S3 són substantius i poden tenir expansions formades per adjectius (EXP1 i EXP3, respectivament). Segons les normes d’AMPER, S1, EXP1, S3 i EXP3 poden ser paraules oxítones, paroxítones i proparoxítones. L’S2 només pot ser una paraula paroxítona. Les combinacions possibles són, per tant, 63 per a cada modalitat oracional (declarativa i interrogativa), és a dir 126 en total per a cada informant.

En línies generals, la preparació d’un corpus friülà que compleixi amb aquestes característiques no hauria de presentar cap problema, ja que tenim a disposició verbs plans (para ocupar la posició S2) i també substantius i adjectius aguts, plans i esdrúixols (per ocupar, respectivament, S1 i S3, EXP1 i EXP3). Ara bé, en realitat entre els quatre dialectes del friülà hi ha diferències morfològiques que limiten el grau de llibertat de l’accent tònic (que s’explicaran al llarg dels propers apartats) i diferències importants en la sintaxi verbal-pronominal (que s’han explicat als apartats de 2.6 a 2.9). Per aquest motiu, com es veurà a continuació, els corpus dels quatre dialectes són força diferents entre ells; però tenen en comú algunes característiques que fan possible la comparació entre les diferents varietat entre elles i amb qualsevol altra varietat estudiada en el marc AMPER:

1) Les frases sense expansió sempre tenen 11 síl·labes, les frases amb expansió sempre en tenen 14. Això permet comparar les frases més senzillament i, a més, permet tenir les fronteres de mot en correspondència amb les mateixes síl·labes. 2) No hi ha cap element vocàlic tònic que sigui diftong ni –sempre que és

morfològicament possible- es formen diftongs per fonètica sintàctica entre la síl·laba pretònica i la posttònica. Això permet d’estudiar millor la durada vocàlica. De fet, si hi haguessin diftongs, no es podria comparar la seva durada amb la de les vocals aïllades en posició interconsonàntica.

3) Tots els verbs, els substantius i els adjectius son trisíl·labs, tal com preveuen les normes del projecte AMPER.

(5)

67 4) Totes les expansions són adjectius, tal com preveuen les normes del projecte

AMPER.

5) Tots els substantius van precedits per un element àton monosil·làbic (ja sigui un article o una preposició).

6) Tots els verbs van precedits per un pronom reflexiu, la qual cosa permet ometre sempre els pronoms personals subjecte àtons a les frases declaratives (veg. apartat 2.1.4.2). Això simplifica la comparació entre varietats que, d’altra manera, seria més complicada per les diferències morfosintàctiques interdialectals que s’han explicat a l’apartat 2.2.

7) Les paraules que s’utilitzen són patrimonials o neologismes d’alta freqüència d’ús. S’eviten neologismes d’ús tècnic o escàs.

8) Totes les frases tenen sentit complet i autònom.

El projecte AMPER inicialment no tenia en compte la possibilitat que una llengua romànica tingués vocals fonològicament llargues i breus. Ja que alguns dialectes del friülà en tenen, per a aquesta recerca hem hagut de contemplar la possibilitat de recollir també frases que continguessin vocals llargues. Per tal de fer-ho, hi havia dues possibilitats:

1) Crear frases que continguessin una barreja de paraules amb vocals llargues i paraules amb vocals breus;

2) Crear frases que continguessin només paraules amb vocals llargues o només paraules amb vocals breus.

La primera solució presentava un desavantatge pràctic molt evident: si haguéssim creat un corpus que contingués totes les combinacions possibles de frases amb vocals llargues i breus a cada posició sintàctica i accentual, hauríem obtingut per a cada informant 1.368 frases en lloc de les 126 d’un corpus estàndard d’AMPER. És evident que un corpus tan gran seria molt difícil d’enregistrar1 i gestionar. Per aquest motiu hem optat per construir un corpus “clàssic” d’AMPER amb 126 frases on les vocals són breus i, també, un corpus més reduït de 18 frases que contenen paraules les vocals tòniques de

1

Per enregistrar 126 frases són necessàries aproximadament tres hores. Per enregistrar-ne 1.368 se’n necessitarien, almenys, trenta.

(6)

68

les quals són totes llargues. En aquest segon corpus, cada frase conté només paraules agudes, o bé només planes o només esdrúixoles. Per tant, per a cada informant el corpus finalment queda constituït per 144 frases (126 + 18), en principi, però aquest nombre varia a cada punt d’enquesta per les característiques de cada varietat, com es veurà a l’apartat 3.1.1.5. A més, cal remarcar que la vocal tònica llarga que es privilegia al corpus és [a], ja que és l’única vocal fonològicament llarga que no es realitza mai fonèticament com a diftong a cap varietat friülana2 (veg. apartat 2.1.2.1).

3.1.1.1. El corpus d’Agrons

El primer corpus que s’ha definit ha estat el d’Agrons, perquè els dialectes septentrionals presenten menys limitacions que els altres i, de fet, són els únics que permeten de construir un corpus complet. Al llarg d’aquest apartat veurem, sintagma per sintagma, quines són les limitacions que existeixen i quines conseqüències tenen sobre el corpus. Primer efectuarem aquesta descripció per al corpus amb vocals breus i després continuarem amb el de vocals llargues.

Al dialecte d’Agrons no hi ha cap problema per trobar substantius aguts i plans (amb vocals breus) per ocupar la posició S1 i S3. Pel que fa la mots esdrúixols, s’ha de remarcar que en friülà no existeix cap substantiu patrimonial masculí esdrúixol. Per aquest motiu, els substantius esdrúixols que s’utilitzen a l’S1 i a l’S3 són femenins.

Tampoc és un problema trobar adjectius esdrúixols, plans i aguts (amb vocals breus) masculins o femenins per ocupar la posició S1 i S3. Això es possible gràcies al les característiques de la morfologia nominal que s’han explicat als apartats 2.5.1 i 2.6.

Pel que fa a l’S2, és a dir el verb (amb vocals breus), les formes declaratives no presenten dificultats. Les interrogatives, per contra, tenen un límit inevitable: el nucli de la síl·laba posttònica sempre és un diftong.

2

En realitat, també les vocals semiobertes [] i [] no es realitzen com a diftongs, però el nombre de paraules on apareixen és extremadament limitat, així que no és possible utilitzar-les en un corpus d’aquestes característiques.

(7)

69 La situació en el corpus amb vocals llargues és lleugerament diferent, en el sentit que hi ha una dificultat ulterior: una vocal a l’antepenúltima síl·laba pot ser llarga només per efecte del quart procés que s’ha esmentat a l’apartat 2.3.1, és a dir, per efecte del context. En concret, en el friülà d’Agrons una vocal tònica sempre és llarga si va seguida de [], [z], [lt] o [lt]. També ho és a la desinència [-e:za] d’alguns adjectius.

Per tant, al corpus d’Agrons trobarem vocals llargues que deriven de quatre processos fonològics diferents. La Taula 3.1 conté un exemple de cadascú d’aquests processos.

Procés Forma

profunda

Forma superficial

1) ensordiment d’una consonant oclusiva o fricativa

fonològicament sonora en posició VC# /deg adad/ [deg adat] 2) vocals tòniques davant [] o [l] finals de paraula que no

són etimològicament geminades o seguides d’una consonant

/kapo al/ [kapo al]

3) allargament compensatori en cas de muta cum liquida

en posició final absoluta de paraula /so egl/ [so eli]

4) context /kozula/ [kozula]

Taula 3.1 – Processos a la base de les vocals llargues al dialecte d’Agrons.

Com es veu en els exemples presentats a la Taula 3.1, encara que s’hagi intentat utilitzar només paraules que continguin com a vocal llarga la [a], ha estat possible només per a les paraules agudes. De fet, en friülà el cas de vocals llargues a la penúltima i a l’antepenúltima síl·laba és tan poc comú, que no ha estat possible trobar substantius paroxítons i proparoxítons que continguessin [a]. El resultat final del procés de preparació del corpus són les frases contingudes a l’annex “A1”.

(8)

70

3.1.1.2. El corpus de Beivars

A partir del corpus d’Agrons, s’ha definit el corpus de Beivars. Les diferències són mínimes pel que fa a les frases que contenen vocals breus, ja que els dialectes septentrionals i centrals comparteixen la majoria de les característiques que tenen influència sobre la preparació del corpus. De fet, l’única diferència evident és el fet que les marques morfològiques són diferents per al femení singular i plural. La diferència, tot i això, no és important per a aquesta recerca.

Per contra, hi ha una discrepància important en el corpus de frases que contenen vocals llargues. De fet, en el friülà de Beivars el quart tipus de procés fonològic que s’ha explicat a l’apartat 2.3.1, és a dir l’allargament vocàlic degut al context, és molt diferent en comparació al friülà d’Agrons. En el dialecte de Beivars, l’únic context en el qual hi ha un allargament vocàlic d’aquest tipus és [V #]. Això comporta que es poden trobar paraules amb la vocal llarga a l’última síl·laba (pràcticament totes les que són afectades pel primer i pel segon procés descrit a l’apartat 2.3.1) i amb la vocal llarga a la penúltima síl·laba (que són les que són generades pel tercer d’aquells processos), però no podem trobar casos de vocals llargues a l’antepenúltima síl·laba. Això implica que, en lloc de tenir nou frases amb vocals llargues per a cada modalitat oracional, en el corpus de Beivars en tindrem només quatre, que són les formades per paraules planes i agudes.

Al corpus de Beivars trobem vocals llargues que deriven de tres processos fonològics – sincrònics i diacrònics– diferents. La Taula 3.2 conté un exemple de cadascú d’aquests processos.

Procés Forma

profunda

Forma superficial

1) ensordiment d’una consonant oclusiva o fricativa

fonològicament sonora en posició VC# /deg adad/ [deg adat] 2) vocals tòniques davant [] o [l] finals de paraula que no

són etimològicament geminades o seguides per una C /kapo al/ [kapo al] 3) allargament compensatori en cas de muta cum liquida

en posició final absoluta de paraula /so egl/ [so eli]

(9)

71 Exactament com ha passat en el cas del corpus d’Agrons, encara que s’hagi intentat utilitzar només paraules que continguessin com a vocal llarga la [a], ha estat possible fer-ho només en el cas de les paraules oxítones. De fet, en el friülà de Beivars el cas de vocals llargues en penúltima síl·laba és tan poc comú, que no ha estat possible trobar substantius plans que continguessin [a]. El resultat final del procés de preparació del corpus són les frases contingudes a l’annex “A2”.

3.1.1.3. El corpus de Gradisca d’Isonzo

El corpus utilitzat per a les gravacions del friülà oriental és força diferent dels que s’han il·lustrat als dos apartats anteriors. Les raons de la diferència són quatre:

1) En primer lloc, hi ha algunes diferències lèxiques entre el friülà oriental i els altres dialectes, per això no s’han pogut fer servir algunes paraules (com ara la sorestant) i s’han hagut de substituir per d’altres.

2) En segon lloc, el friülà oriental no té vocals llargues, per tant al corpus només consten les 126 frases amb vocals breus.

3) En tercer lloc, hi ha una diferència morfològica important: mentre a les varietats centrals i septentrionals els adjectius acabats en /-ent/, /-ant/ i /-int/ formen part de la segona classe de flexió nominal (és a dir, que tenen una forma única per al masculí i el femení singular), en el friülà oriental formen part de la primera classe (és a dir, que la marca de femení singular és [+a]). Ara bé, en els corpus d’Agrons i Beivars s’ha hagut de fer servir aquests adjectius perquè eren els únics que permetien la combinació entre un substantiu esdrúixol i una expansió aguda amb vocal breu (veg. apartat 2.5.1). Per omplir aquesta posició sintàctica, en el dialecte de Gradisca d’Isonzo s’ha hagut d’utilitzar els adjectius que tenen una forma subjacent acabada en /Vl#/. Aquests adjectius, que a les altres varietats tenen la vocal tònica llarga (i, per tant, no es podien utilitzar), al dialecte de Gradisca tenen la vocal tònica breu i una forma única al singular per al gènere masculí i el femení, i per això poden ser emprats.

4) En quart lloc, hi ha també diferències pel que fa a la morfologia pronominal i verbal (veg. apartat 2.1.4.2). Les discrepàncies interdialectals en aquest sector fan que al corpus de Gradisca d’Isonzo no hi hagi cap distinció sintàctica entre la forma declarativa i la interrogativa.

(10)

72

El resultat final del procés de preparació del corpus són les frases contingudes a l’annex “A3”.

3.1.1.4. El corpus de Tesis

El corpus utilitzat per a les gravacions del friülà occidental es va construir a partir del corpus utilitzat per al friülà central, substituint només les paraules que –segons els informants de Tesis- no eren típiques de la seva varietat. El resultat final del procés de preparació del corpus són les frases contingudes a l’annex “A4”.

3.1.1.5. El corpus de friülà

La suma dels corpus de les quatre varietats que s’han descrit als apartats anteriors constitueixen, en conjunt, el corpus de 3.276 frases analitzades en el marc d’aquesta tesi. La Taula 3.3 detalla la distribució de frases per a cada informant i punt d’enquesta.

Punt d’enquesta Veu

N. de frases N. de repeticions Total Agrons femenina 144 3 432 Agrons masculina 144 3 432 Beivars femenina 138 3 414 Beivars masculina 138 3 414

Gradisca d’Isonzo femenina 126 3 378

Gradisca d’Isonzo masculina 126 3 378

Tesis femenina 138 3 414

Tesis masculina 138 3 414

Total 3.276

Taula 3.1 – Composició del corpus.

Com és habitual en el projecte AMPER, cada frase ha estat emesa diverses vegades amb l’objectiu de triar entre elles tres repeticions per analitzar. En raó de l’extensió del corpus, s’ha optat per no incrementar-lo amb distractors.

(11)

73

3.1.2. Informants i enregistraments

Els informants són vuit: un home i una dona parlants nadius de cada dialecte. Les emissions es van enregistrar a casa seva, mitjançant una gravadora digital Marantz model PMD620 que duia connectat un micròfon de condensador Fonestar BM-704BL i un micròfon direccional Shure SM58.

Per a la producció de les frases del corpus es va emprar el mètode d’elicitació textual: els informants van rebre un llistat amb les frases del corpus disposades en un ordre que evités el conegut “efecte de sèrie” (Llisterri, 1991). Se’ls va demanar que llegissin cada frase mentalment i que després la pronunciessin sense mirar el full, per tal d’obtenir una entonació el més natural possible. Com hem esmentat, de cada frase es van registrar diverses repeticions.

3.2. Metodologia per a l’anàlisi acústica de les dades

Per tal de passar de les dades acústiques a les estructures prosòdiques que s’han il·lustrat al Capítol 1, s’han utilitzat uns programes informàtics que han permès de processar una quantitat important de dades amb un procediment que permet reduir el risc de subjectivitat. Els programes utilitzats són Goldwave 4.25, AMPER-2006, AMPERReno i AMPERExtra. El primer és un programa de difusió molt àmplia que és un editor de so. El segon va ser creat en el marc del projecte AMPER per l’equip de treball de la Universitat d’Oviedo i serveix per efectuar l’anàlisi fonètica de les frases. Els últims dos programes han estat creats per l’equip de treball del Laboratori de Fonètica de la Universitat de Barcelona en el marc d’aquesta tesi i serveixen per preparar les dades acústiques per a l’anàlisi estadística.

3.2.1. AMPER-2006

Els enregistraments van ser processats en primer lloc amb el programa Goldwave 4.25, amb el fi d’eliminar-ne el possible soroll de fons i preparar els enregistraments per ser analitzats. Amb això aconseguíem crear arxius .wav separats per a cada repetició de cada frase.

(12)

74

En un segon estadi aquests arxius van ser analitzats mitjançant el programa AMPER-2006, desenvolupat en el marc del projecte AMPER (López Bobo et al., 2007) a partir de les línies guia metodològiques del projecte (Romano 2001, Romano et alii 2005). Gràcies a aquest programa –que en realitat és un conjunt de rutines ad hoc en l’entorn Matlab– es van poder extreure els valors de l’F03, de la durada i de la intensitat de cada vocal d’interès: la tònica, la pretònica i la posttònica4. Això provoca que tinguem 232.220 valors acústics en total (139.212 per a F0, 46.404 per a la durada i 46.404 per a la intensitat). El programa AMPER-2006 desa automàticament les dades en un arxiu en format txt que té el mateix nom dels arxius analitzats. Els noms en qüestió, codificats, segueixen les normes del projecte AMPER (se’n parlarà més detalladament a l’apartat 3.2.2.). Bàsicament, AMPER-2006 permet, en primer lloc, d’analitzar l’oscil·lograma i l’espectrograma d’una frase i segmentar-ne les vocals (veg. Figura 3.1).

Figura 3.1 – Exemple de procés de segmentació de les vocals amb AMPER-2006.

3

El programa extreu tres valors freqüencials (inicial, medial i final), tres d’intensitat (inicial, medial i final, dels quals en aquesta tesi només s’emprarà el central) i un de durada per a cada vocal.

4

(13)

75 Un cop segmentades les vocals, el programa extreu automàticament les dades d’intensitat i de durada i les desa a l’arxiu en format txt. Pel que fa a les dades d’F0, el procediment preveu una fase suplementària. De fet, AMPER-2006 dibuixa una corba melòdica estilitzada, tal com preveia també el mètode d’investigació del model d’Aix-en-Provence. Aquesta corba melòdica estilitzada està formada per tres punts a cada vocal (veg. Figura 3.2). Els punts en qüestió poden ser corregits manualment si l’investigador hi detecta algun error.

Figura 3.2 – Corba melòdica simplificada amb AMPER-2006.

Un cop efectuat l’eventual procediment de rectificació manual dels errors, també les dades d’F0 són guardades en l’arxiu txt (veg. Figura 3.3).

(14)

76

Figura 3.3 – Arxiu txt amb les dades acústiques extretes amb AMPER-2006.

A la fi del procés, el programa permet de calcular la mitjana de les tres repeticions que s’han enregistrat per a cada frase i guarda els valors en un nou arxiu txt. A partir de les dades dels txt (tant de les frases independents com de les mitjanes), crea també gràfics dels tres paràmetres, és a dir intensitat, durada i F0 (tant en Hz com en St). Els annexos A1, A2, A3 i A4 contenen els 3.276 gràfics que han estats generats d’aquesta manera.

3.2.2. AMPERReno

Per tal de poder analitzar fonèticament i estadísticament les dades acústiques contingudes als arxius txt, aquestes han de ser posades en una matriu de dades que permeti, en primer lloc, de calcular les estructures prosòdiques i, en segon lloc, d’analitzar-ne la freqüència estadística. Si el procés d’inserció de les dades acústiques a la matriu es fes manualment, requeriria un temps molt llarg i segurament es donarien errors. Per aquest motiu es va decidir crear un programa que efectués de manera automàtica el transferiment de dades dels arxius txt a la matriu de dades, com es veurà a l’apartat següent; però abans, calia canviar el nom dels arxius perquè el primer problema de programació que es va haver de solucionar va ser el de trobar el sistema per donar ordres a l’aplicació. De fet, cap programa és capaç de saber quines dades s’han de transferir a la matriu i quines no, ja que als txt les síl·labes tòniques no estan

(15)

77 marcades de cap manera. Per aquest motiu s’ha pensat utilitzar el nom de l’arxiu txt com a string per a donar aquestes informacions a l’aplicació (l’annex “B1” conté una descripció detallada de les codificacions que s’han emprat a l’string).

El nom dels arxius txt havia de contenir una sèrie d’informacions que el programa de transferència de dades necessitava per individualitzar les dades que havia d’exportar a la matriu i que no es poden deduir a partir dels codis de les frases que s’utilitzen habitualment en el marc AMPER:

1) Localitat, 2) Informant,

3) Número correlatiu de la frase, 4) Modalitat oracional,

5) Estructura sintàctica de la frase (és a dir, si hi havia o no EXP1 i EXP3),

6) Posicions accentuals de les paraules (és a dir, si cada paraula era aguda, plana o esdrúixola),

7) Número total de síl·labes de l’oració,

8) Posició des la síl·labes accentuades en l’oració, 9) Timbre de les vocals tòniques.

Totes aquestes informacions van ser codificades en el nom de l’arxiu txt. En aquest context seria inoportú explicar de manera detallada els criteris de classificació, que de tota manera queden aclarits exhaustivament a l’annex B1.

Un cop establerts els criteris de codificació, quedava el problema de canviar els noms dels arxius txt que havien estat posats segons la codificació d’AMPER pels noms nous, que contenen les instruccions per al programa d’extracció de dades. Aquesta operació de canvi de noms s’efectua amb un programa que ha estat creat especificadament per a aquesta tesi i que s’ha anomenat AMPERReno, que es troba al CD annex.

(16)

78

3.2.3. AMPERExtra

Un cop els arxius txt tenien els noms nous, s’havien d’extreure les dades importants i exportar-les a una matriu de dades en un format que en permetés l’elaboració i l’anàlisi estadística, concretament en una base de dades d’Excel. D’aquesta operació, se n’encarrega un altre programa que va ser creat especificadament per a aquesta tesi: AMPERExtra. Gràcies a les instruccions codificades als noms dels arxius txt, AMPERExtra exporta a un full en format .xls les dades següents:

1) Llengua, 2) Dialecte, 3) Localitat, 4) Informant, 5) Número de frase,

6) Frase amb vocals llargues o breus,

7) Tipus de paraula (aguda, plana, esdrúixola o cap) a cada accent lèxic,

8) F0 inicial, central i final de la vocal pretònica, tònica i posttònica de cada accent lèxic,

9) F0 inicial, central i final de les vocals adjacents a les fronteres,

10) Intensitat de la vocal pretònica, tònica i posttònica de cada accent lèxic, 11) Durada de la vocal pretònica, tònica i posttònica de cada accent lèxic, 12) Timbre de la vocal tònica de cada accent lèxic,

13) Modalitat oracional,

14) Número de síl·labes de l’oració.

Una explicació detallada del funcionament del programa, que seria massa extensa en aquest punt, està continguda a l’annex B2. El programa mateix es troba al CD annex.

3.3. Metodologia per a l’anàlisi entonativa de les dades (SPSS i AMPEREti)

Un cop les dades eren al full de càlcul en format .xls, es podien importar a una matriu de dades d’SPSS17, un paquet estadístic que permet d’efectuar dues operacions: calcular

(17)

79 les estructures prosòdiques a partir de les dades acústiques i analitzar la seva distribució estadística.

Pel que fa al càlcul de les estructures, en el marc d’aquesta tesi s’ha creat expressament un conjunt de 856 fórmules que permeten calcular-les i que estan impreses a l’annex B4. Constitueixen una rutina que hem anomenat AMPEREti que està continguda al CD annex, mentre les seves instruccions d’ús estan recollides a l’annex B3. Aquestes fórmules, inspirades en el marc teòric que s’ha descrit al Capítol 1 i en una primera versió d’algorismes d’etiquetatge entonatiu creats al Laboratori de Fonètica de la Universitat de Barcelona (Martínez Celdrán i Fernández Planas, 2003), determinen les següents unitats prosòdiques:

1) Les estructures entonatives superficials i profundes de cada accent lèxic (a partir de la diferència en semitons entre la freqüència de la vocal tònica i cada una de les vocals adjacents, tenint en compte el llindar psicoacústic de 1,5 st),

2) El to de frontera inicial de la frase entonativa, 3) El to de frontera final de la frase entonativa,

4) El to de frontera final de frase intermèdia, si n’hi ha,

5) Les estructures duratives de cada accent lèxic (a partir del llindar psicoacústic d’1/3 en més o en menys respecte de la durada de la vocal tònica),

6) Les estructures d’intensitat de cada accent lèxic (a partir del llindar psicoacústic del 15% en més o en menys respecte de la intensitat de la vocal tònica).

La finalitat d’AMPEREti és facilitar als investigadors una proposta d’etiquetatge automàtic de tipus Mètric Autosegmental tant en àmbit entonatiu com pel que fa als paràmetres de durada i intensitat. L’objectiu és que l’etiquetatge proporcionat per AMPEREti sigui el més semblant possible a un etiquetatge fonètico-fonològic realitzat per etiquetadors humans.

3.3.1. Etiquetatge entonatiu

Pel que fa a l’entonació, AMPEREti treballa a partir dels tres valors d’F0 de cada vocal (inicial, central, final). Compara, fonamentant-se en el llindar psicoacústic de perceptibilitat d’1,5 st (Pamies et al., 2002), els valors d’F0 a la pretònica, tònica i

(18)

80

posttònica de cada accent lèxic i obté un primer etiquetatge ‘superficial’, és a dir, coherent amb els fets acústics.

L’etiquetatge ‘superficial’ és successivament transformat en una proposta d’etiquetatge ‘profund’, que representa una aproximació a l’etiquetatge fonològic i constitueix la base per a l’última anàlisi duta a terme pels investigadors. La transformació de les etiquetes ‘superficials’ en etiquetes ‘profundes’ es fonamenta en les regles d’implementació fonètica dels tons que són pròpies de cada llengua. De fet, la transformació del fonètic en fonològic, tant en l’àmbit segmental com en l’àmbit suprasegmental, ha de tenir en compte les especificitats de cada llengua. En l’àmbit segmental, per exemple, la realització fonètica [wk] té representacions fonològiques diferents segons es tracti de la paraula polonesa <yk> /wk/ o de la paraula <vuic> /wik/ del furlà centreoriental, ja que en la primera llengua [] és la realització del fonema // mentre que en la segona és la realització al·lofònica del fonema / i / en posició tònica (Figura 3.4).

Figura 3.4 – Espectrograma amb els formants marcats mitjançant línies de punts de la paraula[wk] pronunciada per un parlant de polonès (panell de l’esquerra) i per un

parlant de friülà central (panell de la dreta).

Com en l’àmbit segmental, els mateixos fets acústics poden tenir representacions fonològiques diferents segons la llengua també en l’àmbit suprasegmental, ja que la mateixa corba entonativa pot correspondre a representacions fonològiques diferents en funció de la llengua. Un exemple d’aquest tipus es presenta a les Figures 20 i 21. A totes dues apareix la paraula [la liÖaÖ] pronunciada per un parlant d’espanyol

(19)

81

rioplatense de Buenos Aires (Figura 3.5) i per una parlant de friülà septentrional d’Agrons (Figura 3.6).

Les corbes entonatives presentades en les dues figures són extremadament semblants des del punt de vista acústic: presenten una síl·laba pretònica baixa, un to circumflex a la síl·laba tònica format per una pujada i una baixada de F0, un to baix en la síl·laba posttònica. No obstant la semblança entre les dues realitzacions fonètiques, les seves representacions fonològiques són diferents. L’enunciat espanyol, de fet, constitueix un focus contrastiu, que en la varietat argentina es caracteritza per una configuració nuclear L+H*+L L% (Gabriel et al., 2010). L’enunciat friülà, per contra, és una pregunta reiterativa que en la varietat septentrional d’aquesta llengua té una configuració nuclear L+¡H* L% (Roseano et al., 2011). La diferència en l’etiquetatge fonològic de dues corbes tan semblants s’explica a partir de les diferències en les regles d’alineament i de les diferències entre els inventaris tonals de totes dues llengües. Al Capítol 5 es tractaran més en detall les regles d’alineació que caracteritzen el friülà.

100 100 140 180 220 260 300 F recuen ci a f u n d ament al ( H z) 0 0.5 1 l a ਥl i৸ ޗ૊ a৸ ¡La lira!

Figura 3.5 – Oscil·lograma, espectrograma i corba entonativa de la paraula [la liÖaÖ]

(20)

82 50 50 90 130 170 210 250 Fr ecu encia f u nda m ental( H z) 0 0.5 l a ਥl i৸ ޗ૊ a৸ La lîra?

Figura 3.6 – Oscil·lograma, espectrograma i corba entonativa de la paraula [la liÖaÖ]

pronunciada per un parlant de friülà septentrional d’Agrons.

La versió actual de la part d’aMPEREti dedicada a l’etiquetatge entonatiu ha estat concebuda per al friülà, però s’està ampliant de manera que pugui ésser aplicada amb èxit a d’altres llengües romàniques on la fonologia entonativa és, lògicament, diferent.

La Figura 3.7 presenta, de manera esquemàtica, el càlcul de les estructures entonatives superficials possibles a partir de les dades acústiques d’F0 a cada accent lèxic i la següent transformació en estructures entonatives profundes per part d’aMPEREti. Cal destacar que, a diferència del que proposen Fernández Planas i Martínez Celdrán (2003: 173-174), s’ha considerat que les estructures monotonals són també profundes i, per això, no es converteixen en bitonals (veg. apartat 1.2.1.5.1).

(21)

83

Figura 3.7 – Representació esquemàtica del càlcul de les estructures entonatives superficials a partir de les dades acústiques de F0 i transformació en estructures

(22)

84

AMPEREti analitza també els esdeveniments tonals que tenen lloc en correspondència amb les fronteres de l’enunciat. Pel que fa a la frontera final, AMPEREti calcula en primer lloc la diferència en semitons entre el valor central d’F0 de l’última síl·laba tònica de la frase i el valor final d’F0 de l’enunciat (en el cas de mots esdrúixols són dos valors a la mateixa síl·laba). Si aquest valor és superior a 1,5 semitons (és a dir si hi ha un ascens final psicoacústicament significatiu), el programa considera que el to final és alt (H%). Si el valor en qüestió és superior a -1,5 st (és a dir si hi ha un descens psicoacústicament significatiu), AMPEREti considera que el to final és baix (L%). En els casos en què no hi ha cap diferència perceptible (és a dir que el valor està comprès entre -1,5 i 1,5 st), l’aplicació pren en consideració l’accent tonal anterior: si aquest és alt o ascendent, considera que el to final és alt, també. Si és baix o descendent, considera que el to final és igualment baix. La Figura 3.8 presenta, de manera esquemàtica, el càlcul dels tons de frontera final a partir de les dades acústiques d’F0 i dels tipus d’accents tonals de la síl·laba nuclear. A la figura en qüestió el rectangle gris representa la síl·laba tònica nuclear i els rectangles blancs les síl·labes posttòniques. Cal destacar que, encara que a l’esquematització que es proposa s’hagin representat dues síl·labes posttòniques, el mateix càlcul es pot aplicar també si n’hi ha només una (és a dir, si el mot és pla) o cap (és a dir, si la paraula és aguda).

=F0últimatònicaF0finalúltimavocal >1,5st ||<1,5st <1,5st Accent nuclear Baixo descendent Alto ascendent

Figura 3.8 – Representació esquemàtica del càlcul del to de frontera final per part d’AMPEREti.

A més a més, AMPEREti també proposa un etiquetatge del to inicial de l’enunciat, a partir de la comparació entre el valor inicial d’F0 de la primera vocal de la frase i el valor mitjà d’F0 de l’enunciat. Si el valor d’F0 inicial és més alt que el valor mitjà, el

L% H% L% H% L% H%

(23)

85 programa considera que el to és alt (%H) i si és inferior que és baix (%L). La Figura 3.9 presenta, de manera esquemàtica, el càlcul dels tons de frontera inicial a partir de les dades acústiques d’F0.

=F0inicialprimervocalF0mitjà

<0 >0

Figura 3.9 – Representació esquemàtica del càlcul del to de frontera inicial per part d’AMPEREti.

AMPEREti també proposa un etiquetatge de la frontera interna que apareix, a diferents llengües romàniques, entre el subjecte i el verb, tant als enunciats declaratius com als interrogatius. El programa considera que hi ha una frontera intermèdia baixa (L-) si, en correspondència a la frontera final del sintagma que fa de subjecte, es pot identificar el vèrtex d’una inflexió tonal còncava; és a dir, si F0 baixa (o es manté baix) a l’última síl·laba del subjecte i puja a la següent. Al contrari, AMPEREti considera que al final del subjecte hi ha una frontera intermèdia alta (H-) si, en correspondència a la frontera final del sintagma que fa de subjecte, es pot identificar el vèrtex d’una inflexió tonal còncava, és a dir si F0 puja (o es manté alt) a l’última síl·laba del subjecte i baixa a la següent. En tots els altres casos, és a dir quan no és possible d’identificar un vèrtex tonal a la frontera entre subjecte i verb, el programa considera que no hi ha cap esdeveniment tonal i, per tant, no proposa cap etiqueta. La Figura 3.10 presenta, de manera esquemàtica, el càlcul dels tons de frontera interna final del subjecte a partir dels valors inicial i final d’F0 de les vocals adjacents a la frontera entre subjecte i verb.

%H %L

(24)

86 1=F0finalúltimasíllabadelsubjecte– F0finalúltimasíllabadelsubjecte 1>0 1<0 2 =F0finalprimerasíllabadelverb F0final primerasíllabadelverb 2>0 Capfrontera L 2<0 H Capfrontera

Figura 3.10 – Representació esquemàtica del càlcul del to de frontera intermèdia per part d’AMPEREti.

3.3.2. Etiquetatge de la durada

Pel que fa a la durada, AMPEREti compara, fonamentant-se en el llindar psicoacústic de perceptibilitat de 1/3 de la durada (Pamies et al., 2002), els seus valors de la vocal pretònica, tònica i posttònica de cada accent lèxic i obté un etiquetatge coherent amb el marc teòric descrit a l’apartat 1.2.2. La Figura 3.11 presenta, de manera esquemàtica, el càlcul de les estructures de durada a partir de les dades acústiques per part d’aMPEREti.

(25)

87

Figura 3.11 – Representació esquemàtica del càlcul de les estructures superficials de durada a partir de les dades acústiques i transformació en estructures profundes per

(26)

88

3.3.3. Etiquetatge de la intensitat

Pel que fa a la intensitat, AMPEREti compara, fonamentant-se en el llindar psicoacústic de perceptibilitat del 15% de diferència d’intensitat (Riesz, 1928; Llisterri, 2012), els seus valors a la vocal pretònica, tònica i posttònica de cada accent lèxic i obté un etiquetatge coherent amb el marc teòric descrit a l’apartat 1.2.3. La Figura 3.12 presenta, de manera esquemàtica, el càlcul de les estructures d’intensitat a partir de les dades acústiques per part d’aMPEREti.

(27)

89

Figura 3.12 – Representació esquemàtica del càlcul de les estructures superficials d’intensitat a partir de les dades acústiques i transformació en estructures profundes

(28)

90

3.4. Sinopsi

Els processos d’anàlisi efectuats mitjançant les eines informàtiques que s’acaben de descriure es poden resumir en forma gràfica com es veu a la Figura 3.13.

Figura 3.13 – Sinopsi de les fases de recollida i anàlisi de les dades, és a dir, del procés metodològic seguit fins a l’obtenció dels resultats.

Gravadora

Enregistrament

Goldwave

Preparació dels arxius

Amper-2006 Anàlisi acústica arxius wav arxius wav Gràfics F0 Gràfics intensitat Gràfics durada AMPERReno Canvi de nom arxius txt arxius txt AMPERExtra

Creació matriu de dades

arxiu xls Excel

Exportació de dades

arxiu xls AMPEREti (SPSS17)

Etiquetatge prosòdic automàtic

Anàlisi de les freqüències estadístiques

Referencias

Documento similar

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

En junio de 1980, el Departamento de Literatura Española de la Universi- dad de Sevilla, tras consultar con diversos estudiosos del poeta, decidió propo- ner al Claustro de la

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

Sanz (Universidad Carlos III-IUNE): &#34;El papel de las fuentes de datos en los ranking nacionales de universidades&#34;.. Reuniones científicas 75 Los días 12 y 13 de noviembre

(Banco de España) Mancebo, Pascual (U. de Alicante) Marco, Mariluz (U. de València) Marhuenda, Francisco (U. de Alicante) Marhuenda, Joaquín (U. de Alicante) Marquerie,

[r]

SVP, EXECUTIVE CREATIVE DIRECTOR JACK MORTON

Social Media, Email Marketing, Workflows, Smart CTA’s, Video Marketing. Blog, Social Media, SEO, SEM, Mobile Marketing,