Le percentuali degli anglicismi nella stampa

Le parole sono importanti, certo, ma anche i numeri non scherzano, soprattutto quelli delle statistiche, che vanno interpretati. Troppo spesso non si spiegano ma si piegano, si usano per far loro dire quello che si vuole, o semplicemente si prendono delle cantonate nel leggerli in modo sbagliato. Per comprendere cosa intendo in modo intuitivo basta fare qualche semplice esperimento.

Mettiti a tuo agio. Rilassati e fa’ un bel respiro.
Adesso immagina…

Esperimento n. 1: gli anglicismi nei giornali

anglicismi nei giornaliImmagina un libro. Un libro normale, in italiano. Non quelli scritti troppo fitti o con i caratteri molto piccoli. Un libro nella media, di quelli che hanno magari 26 righe per ogni pagina, e ogni riga ha in media 10 parole. Anzi, per arrotondare, immagina un libro con qualche riga in più, diciamo 30. Trenta per dieci: ogni pagina ha in media 300 parole. È un esempio plausibile.
Stai leggendo questo libro, e nella prima pagina ti capita di notare che ci sono 3 parole inglesi. E lo stesso nella seconda, e poi nella terza… Ogni pagina contiene 3 anglicismi. Sono troppi? Ti danno fastidio? Ti piacciono e ti sembrano pochi? Non importa. Qualunque sia la tua percezione stai leggendo un testo che ha l’1% di anglicismi.

Adesso fermati, e guarda quando questo libro è stato pubblicato. Supponiamo che sia uscito nel 1996, e che sia un libro in linea con quanto risultava in qualche studio sulla presenza dell’inglese nei giornali dell’epoca. Per esempio quelli che aveva scandagliato Marja quando faceva la sua tesi di laurea e aveva rilevato che mediamente gli anglicismi erano l’1% nella rivista Chi e il 2,3% in Panorama (Marja Komu, “Anglicismi nella stampa italiana”, tesi di laurea in Filologia romanza, Università di Jyväskylä, maggio 1998, p.26).
Oppure immagina un libro più recente, diciamo del 2011, con un linguaggio un po’ meno anglicizzato, come i 7 giornali spogliati da Paola che ha calcolato percentuali di anglicismi tra lo 0,65% e l’1,87, una media più bassa, ma non molto diversa dal libro immaginario che stai leggendo. Paola aveva confrontato i suoi dati con quelli di uno studio precedente proprio sugli stessi giornali, compiuto da Moss nel 1992; erano tutti aumentati di un pochino, da +0,22% di Panorama, a +0,88% di Sorrisi e canzoni TV (Paola Deriu , “Gli anglicismi nella stampa italiana del XXI secolo”, in Letterature Straniere &. Quaderni della Facoltà di Lingue e Letterature Straniere, Università degli Studi di Cagliari, 2011, n. 13, pp. 165-190; e H. Moss, “The incidence of anglicism in modern Italian: considerations on its overall effect on the language”, in The Italianist: Journal of the Department of Italian Studies, University of Reading, 1992, pp. 129-136).

Ora immagina che gli anglicismi siano davvero di più dell’1%, e che siano come nei dati più alti, tra l’1,87% e il 2,3%. Diciamo il 2%.
Riprendi a leggere il libro dei tuoi sogni. Adesso ci sono 6 anglicismi per pagina. In ogni pagina. Sono ancora pochi per inquinare la lingua italiana in modo preoccupante?

Immagina allora che diventino 9 per pagina. Il 3%.
Hai immaginato? Bene. Dunque non resta che concludere l’esperimento numero 1.

Leggi la seguente affermazione e chiediti se sei d’accordo con il nesso tra le premesse e la conclusione:

“Un sondaggio recente sugli articoli dei maggiori quotidiani ha mostrato che gli anglicismi non sono poi tantissimi; si affollano nei titoli, dove le dimensioni contano e le parole brevi fanno comodo, ma restano meno del 3% nel testo degli articoli.”
Riccardo Gualdo, Anglicismi (vol. 8 de Le Parole dell’italiano), Rcs Corriere della sera, Milano 2020, p. 55.

Non sono riuscito a capire a quale studio si faccia riferimento, perché non lo trovo citato in bibliografia, ma non appena ho letto questa frase mi sono preoccupato parecchio. Sia per l’aumento rispetto alle percentuali più basse di cui si parlava fino a pochi anni fa, sia perché quel numerino “3%”, anche se approssimato per eccesso, sotto l’effetto psicologico del numero basso e innocente, nasconde altre enormità. Ma per comprenderle occorre un nuovo sforzo di immaginazione.

E domandarsi anche: ma “il 3%” di che, esattamente?

Esperimento n. 2: la frequenza degli anglicismi e dei sostantivi

emilio isgroFa’ finta che il libro immaginario che ha 300 parole per pagina sia un libro di 100 pagine, 30.000 parole in tutto. Se l’1% sono in inglese ci sono 300 anglicismi, cioè si può riempire una pagina intera, raccogliendoli (sarebbero 900 = 3 pagine, nelle statistiche citate da Riccardo Gualdo, ma preferisco non pensarci). Adesso aprilo in una pagina a caso e guardala concentrandoti non solo sulle parole, ma anche sugli spazi bianchi che le dividono, come è più facile fare in un’opera di Emilio Isgrò. Noterai che alcune parole sono lunghe o lunghette, mentre altre sono cortissime, di uno, due o tre caratteri. Quelle piccine non spiccano come le altre, ma sono tante. Tantissime di queste parole saranno “e”, “che”, gli articoli (il, lo, la, un), le preposizioni (a, di, da, per). La struttura di un testo è formata da poche manciate di parole che sono state definite “grammaticali” o “funzionali”, e ricorrono con un’altissima frequenza. Sono sempre le stesse, e tengono insieme le altre parole che invece hanno un’occorrenza bassissima. I nomi, per esempio, secondo gli studi di frequenza di Tullio De Mauro sono circa il 20% in un testo scritto di tipo giornalistico, e ognuno è diverso dagli altri, salvo eccezioni. Ognuno ricorre una volta sola, forse due o tre in casi meno comuni.

Adesso rileggi la tua pagina aperta a caso. Tra queste 300 parole, se guardi quelle più lunghette, potrai contare forse 60 sostantivi (il 20%), mentre i verbi saranno magari tra il 10% (calcolati nel Veli di De Mauro) e il 15% (Dizionario di riferimento raccolto da Ibm basato su 3,8 milioni di occorrenze di quotidiani e testi di agenzia). Dunque ci saranno 60 nomi e 30 o 40 verbi, e poi puoi sommare gli aggettivi e altre parole ancora, ma l’intelaiatura della pagina è fatta in buona parte dalle “parole funzionali” che si ripetono. Nella Divina Commedia, per esempio, la parola più usata è “e” che ricorre 3.884 volte.
Gli anglicismi, per il 90% sono nomi o locuzioni nominali. Non ci sono verbi, non ci sono “parole funzionali” inglesi. Le 3 parole inglesi della tua pagina saranno probabilmente comprese tra i 60 nomi che le statistiche prevedono: sono dunque il 5% dei nomi che designano le cose (ma se fossero il 3% delle parole, invece che solo l’1%, diventerebbero ben 9 nomi in inglese su 60, cioè il 15% dei sostantivi che hai letto).

Sono sempre pochi? Vogliamo dire che l’italiano non ha alcun problema e salvarlo conteggiando gli articoli e le preposizioni?
Va bene. Però non è ancora finita. Potrebbe andare peggio. Potrebbe piovere…

Esperimento numero 3: le forme, i lemmi e le parole che non valgono

potrebbe piovere frankenstein juniorRileggi la tua pagina casuale. Scommetto che incontrerai almeno una volta il verbo “avere” o il verbo “essere”. Certo, è probabile che non sia all’infinito come lo si trova sul vocabolario, ci sarà forse “è”, o “erano”, o “ha”, “avranno”, “avuto”… Non importa. Tutte queste parole sono “forme” diverse, sono tipi, ma sono tutte varianti di una stessa parola, cioè il verbo “essere”, oppure il verbo “avere”. Sono lo stesso lemma, il modello privo di flessioni registrato nei dizionari (dove non si trova “rossa”, “rosse” o “rossi”, c’è solo “rosso”).
E allora come valutare le 300 parole per pagina? “Parola” ha più di un significato, è una “parola” che può ingannare.
Quante parole ha la Divina Commedia? Ce ne sono 101.499, ma se invece di contarle in questo modo automatico, una per una, conteggiamo i tipi, le forme, il loro numero scende a 13.770. Se ordiniamo tutti questi tipi in ordine di frequenza si parte da “e” (una sola parola che ricorre 3.884 volte), poi c’è “che” (si trova 2.292 volte), “la” (2.254) e così via fino alle parole che ricorrono una sola volta. Tutte insieme, se si conteggiano anche i “doppioni”, sono oltre 100.000, altrimenti diventano meno di 14.000 (che è il 13,37% del totale).
Se ci mettiamo a “lemmatizzare” queste forme, cioè a conteggiare “avere”, “hanno”, “avrà”… non come parole diverse (tipi), ma come una sola parola flessa ricondotta la suo lemma come accade nei dizionari, il loro numero si riduce ancora di più.

Ecco, adesso tutto è più chiaro, spero. Si capisce forse meglio che bisogna sempre fare attenzione a parlare di “parole” e vedere di volta in volta che cosa si intenda, per non farsi fregare.
Anche se forse non lo sapevi, a questo punto hai compreso benissimo cos’è un andamento zipfiano per lemmi. Si chiama così dal nome dello studioso George Kingsley Zipf, che ha studiato per primo come in un testo le parole abbiano questo andamento. Un piccolo numero di parole funzionali che ricorrono tantissime volte, seguito da una lunghissima lista di parole che ricorrono poche volte, e da moltissime altre che compaiono una sola volta. Di sicuro è ciò che capita anche nella tua pagina aperta a caso.

Non resta che domandarsi: ma allora come si può valutare l’effettiva presenza degli anglicismi sui giornali?

Per capirlo ci può venire in aiuto un lavoro di Tullio De Mauro del 1989 che, supportato da Ibm, ha “macinato” con questi criteri scientifici di lemmatizzazione una gran quantità di articoli di Ansa, Il Mondo, L’europeo e La Domenica del Corriere (usciti tra il 1986 e il 1987), che complessivamente erano costituiti da 26 milioni di parole. Il suo scopo era di individuare i 10.000 lemmi più usati nella lingua italiana. I procedimenti statistici per questa scelta erano molto più complessi e rigorosi di quanto ho semplificato fin qui. Ma c’è almeno un altro criterio importantissimo da calcolare e che non si può trascurare.

Bisogna eliminare la parole “che non valgono”, per farla semplice e per non barare.

In un articolo di giornale non ci sono solo i vocaboli che si trovano nei dizionari, ci sono anche i numeri e le date, o i nomi di persona. Donald Trump o Giuseppe Conte, 4 parole, non sono propriamente né italiane né inglesi, ai fini dei conteggi sugli anglicismi. Anche i nomi delle aziende, poco importa se siano in italiano (Scavolini), in inglese (Microsoft) o in itanglese (Eataly). Fanno numero, ma sarebbe bene escluderle. I testi vanno insomma “puliti” prima di dare delle statistiche che altrimenti risultano inquinate, e sarebbe bene anche distinguere le parole che ricorrono tante volte da quelle che ricorrono una sola, oltre a ragionare sulle differenze tra forme e lemmi.

De Mauro, nella sua lemmatizzazione, si è posto persino il problema degli omografi, per essere davvero preciso: (io) sono e (essi) sono, sono parole diverse ma entrambe riconducibili al verbo essere, mentre (il) danno e (essi) danno sono due parole e due lemmi diversi, da conteggiare separatamente. Nel risultato di questo lavoro, il Veli (Vocabolario Elettronico della Lingua Italiana) con i 10.000 lemmi più utilizzati nel 1986-87, gli anglicismi erano il 2% (per l’esattezza l’1,9% attraverso il criterio statistico scelto, ma poiché veniva introdotto un algoritmo di correzione che poteva essere discutibile, senza questo intervento sarebbero stati il 2,1%).

Se oggi si utilizzasse lo stesso metodo di analisi, si scoprirebbe che gli anglicismi dei giornali sono almeno raddoppiati, se non triplicati, dagli anni Ottanta. Ma ciò richiede un lavoro colossale, dunque gli studi moderni a cui si è fatto riferimento operano in un altro modo che non è paragonabile a questo: non si possono confrontare i risultati del 2% di De Mauro con quelli del 3% di oggi, perché sono due cose completamente diverse, non sono dati omogenei (in sintesi: concludere che l’aumento è dell’1% significherebbe mettere assieme mele e pere, questo deve essere chiaro).

Oggi si fanno conteggi differenti, aggiungerei scompensati (avevo parlato anche di “statistiche drogate“), perché sono piuttosto grezzi da una parte e invece raffinati solo dall’altra: si conteggiano le parole di un articolo di giornale (in modo grezzo), si vanno a contare gli anglicismi, che come è noto sono invariabili e quasi sempre con funzione di sostantivo, e questa lista, bella pulita e raffinata, si confronta con il numero delle altre parole “sporche”, che per la maggior parte sono “e” e “parole funzionali”, includono le forme flesse di uno stesso lemma, e contengono anche le parole che non valgono. In questo modo il numero degli anglicismi si diluisce. Se, nonostante questo annacquamento, nei giornali fossero davvero il 3% sarebbe un’enormità di cui ci si dovrebbe preoccupare invece di concludere che “3” è un numero piccolo.

Dagli anni Ottanta a oggi, nei dizionari, gli anglicismi son più che raddoppiati. Nel Devoto Oli sono passati dai 1.600 del 1990 a oltre 3.500 (ma non è molto diverso da ciò che si evince dai conteggi dello Zingarelli). Questo dizionario ha poco più di 3.200 pagine. Ciò significa che, aprendolo a caso, non importa in quale pagina si finisca, in ognuna c’è un po’ più di un anglicismo. Certo, può capitare che siano concentrati maggiormente in alcune pagine e che in altre non ci siano, ma la media è questa. Prima di incontrare un francesismo, invece, ci sono da sfogliare più di 3 pagine (sono nell’ordine di 1.000), mentre bisogna voltare almeno 30 pagine prima di incontrare un ispanismo o un germanismo (che sono rispettivamente un centinaio). E probabilmente questi altri forestierismi, in tutto il libro che hai immaginato, li puoi contare con le dita, o non ci sono affatto.

E i 300 anglicismi che ti sono ti sono capitati quali erano? Un conto è dire che sono 300 tutti diversi, e un conto è dire che ce ne sono magari solo 80, e che alcuni ricorrono più volte e altri una sola. Chissà qual era il criterio dello studio che li quantifica nel 3%.
Probabilmente molti anglicismi del tuo libro sono da ricercarsi nell’elenco dei 129 che sono stati inseriti da De Mauro in una altro lavoro statistico, il Nuovo Vocabolario di Base (NVDB), cioè la lista delle circa 7.000/7.500 parole che si usano di più e costituiscono oltre il 90% di quelle con cui ci esprimiamo di solito. Nel 1980 gli anglicismi erano nell’ordine della decina (all lettera B c’era solo bar). Nell’ultima edizione del dicembre 2016 erano ben di più. Allora mi son messo a sfogliare tutte le voci e a contarli manualmente, e ho visto che erano decuplicati e che sono 129, se non me ne è scappato qualcuno (e senza conteggiare parole macedonia come salvaslip). Ma non credo, perché è lo stesso numero che riporta anche Gualdo, e anche se non cita la fonte, lo avvalora.

Questo aumento dell’inglese non si vede solo nei dizionari come il Devoto Oli o lo Zingarelli, ma anche nel NVDB e nelle frequenze di uso dei giornali, c’è poco da negare e poco da stare tranquilli. Di fronte a questo diluvio, chi dice che non sta succedendo niente e aspetta che la “scure del tempo” faccia cadere nel dimenticatoio gli anglicismi, che sarebbero solo delle parole passeggere, rischia di aspettare tutta la vita, perché intanto non fanno che aumentare.

Non si può giocare con la solitudine dei numeri “proni” davanti alle statistiche buttate lì, e dire per esempio che quello che Arrigo Castellani aveva chiamato Morbus anglicus era il solito becero allarmismo. Era lungimiranza, la sua. E a dire che è poco più di un’influenza… si rischia di comprendere che non è così un po’ troppo tardi.

13 pensieri su “Le percentuali degli anglicismi nella stampa

  1. Ti voglio fare i complimenti per come sei riuscito a farmi capire la statistica…. io sono una capra per queste cose non avevo mai trovato qualcuno che le spiegasse in modo così semplice e chiaro….

    Piace a 2 people

  2. Finalmente si è tolto di mezzo quest’equivoco, questa solita minimizzazione. Grazie.

    Ah, apro un giornale in rete —non dico quale, ché tanto non importa: sotto questo aspetto sono tutti uguali— e leggo «Svezia sì, Svezia no. Tutti a parlare del Paese nordico e del suo controverso soft lockdown». Subito mi viene in mente di quando dicevi che i forestierismi istituiscono reti di relazioni, incistandosi nel corpo vivo del lessico comune. C’è «soft», che ormai si è incuneato da tempo nella lingua, e «lockdown», novità degli ultimi due mesi (e meno male che il gruppo Incipit vigilava!). Scommetto che chi l’ha scritto, senza virgolette né corsivo, pensava di scrivere in italiano…

    Piace a 1 persona

    • Grazie a te Ferdinand. Ho ricostruito la storia di “lockdown” e di altre parle legate al virus a corona, che un mese fa dicevamo in italiano, e ilrisultato è sconfortante. Quando gli inglesi hanno chiamato tutto ciò “italian lockdown” questa è diventata la “nostra” parola, pronunciata persino da Conte che era stato il modello europedo delle misure di blocco, isolamento, quarantena e che aveva “blindato” il Paese. Quanto alle relazioni tra anglicismi, le ricomposizioni si vedono benissimo nello”smart working”, che c’è solo da noi e che un inglese non capirebbe. E poi spuntano i covid manager, i covid pass, i covid hospital…

      "Mi piace"

      • In questo periodo, anche un minimizzatore incallito sarebbe costretto ad ammettere che gli anglicismi, lungi dall’essere una parte inconsistente del lessico, formano grovigli lessicali, ammassi di gramigna difficili da sradicare. «Covid-X», dove «X» sta, a questo punto, per qualsiasi cosa, è emblematico, anche per la sintassi estranea all’italiano.

        In quanto a «smart working», per la mia personale esperienza rimane un sottile spiraglio di speranza, legato alla relativa difficoltà di pronuncia. Sento tante persone usare (anche) «telelavoro». Ma se in tivvú, sui giornali, nelle conferenze stampa ufficiali tutti dicono «smartuorchi», sarà difficile scalzare l’anglicismo…

        I prestiti sterminatori sono una colata lavica che avanza inesorabile…

        Piace a 2 people

        • Sulle pronunce ho notato che “recovery fund” viene spesso pronunicato “fAUnd”, come fosse scritto”found”, nelle parole dei parlamentari (per es. dalla Gelmini nel discorso di Conte in Parlamento) e anche dai giornalisti. Tanto vale dire fondi per la ripresa o per la “rinascita” come l’ha tradotto nello stesso dibattito parlamentare Del Rio, invece che biascicarlo.
          La sensazione positiva è che stia però aumentando il fastidio di fronte a questo linguaggio. Ieri è uscito questo che fa riflettere con una buona divulgazione:

          Piace a 1 persona

  3. Ottimo articolo e ragionamento impeccabile.
    In altre parole la lingua italiana rischia di diventare sempre di più un semplice contenitore che fornisce congiunzioni, articoli, preposizioni e qualche ausiliare a una proporzione sempre più ingombrante di sostantivi, aggettivi e unità lessicali angloidi.
    [Dico angloidi perché mi rifiuto di chiamare “inglese” gemme come smart working, happy popping, droplet, lobby, slip, no vax, no mask, reverse paperless, school shooting e tante altre idiozie linguistiche coniate in Italia].
    Ma la cosa è ancora peggiore perché l’italiano inizia a cedere terreno anche come “contenitore”.
    Immaginiamo “Giornata della Famiglia”. Già non è nemmeno “Giornata della Family” o “Day of the Family”, secondo le norme tra i costituenti della lingua italiana. È “Family Day”. E come questo, ormai tutti gli eventi, Day o Week, che si celebrano nell’Italia di oggi.
    Dunque se in qualche evento corporativo si leggono obbrobri come “L’Empowerment della Leadership” (in Italia), entro dieci anni – se continua così – sarà “Leadership Empowerment”. Lo stiamo vedendo attualmente, sempre di più.
    Questo non sembrano notarlo certi linguisti italiani.

    Piace a 2 people

Lascia un commento