Linee Guida per l’Annotazione dell’Ironia
Autori: Cristina Bosco, Luca Anselma, Pier Felice Balestrucci, Valerio Basile, Eliana Di Palma, Marta Marchiori Manerba, Michael Oliverio, Viviana Patti, Alessandro Mazzei
Affiliazione: Department of Computer Science, University of Turin, Italy, Corso Svizzera 185, 10149 Torino (Italy)
Contatto: cristina.bosco@unito.it
Riconoscere l’ironia è un’operazione complessa e la disponibilità di corpora annotati può essere fondamentale per la sua elaborazione automatica. Il presente documento fornisce linee guida per l’annotazione basate su uno schema dettagliato incentrato sull’ironia, con particolare attenzione a una serie di figure retoriche che possono fungere da stimoli all’ironia.
Introduzione
Il rilevamento dell’ironia è un compito importante nella Sentiment Analysis, poiché la sua presenza può invertire la polarità di un’opinione espressa in un testo. Ad esempio, parole positive possono essere usate per trasmettere un significato negativo, compromettendo le prestazioni dei sistemi di analisi del sentiment. [1] [2] [3] [4] [5] [6]
Infatti, l’ironia si basa su fenomeni pragmatici e linguistici la cui identificazione può essere controversa, [7] [8] [9], dato che diversi espedienti retorici possono essere utilizzati come fattori scatenanti dell’ironia, come analogie, eufemismi, shift contestuali, ossimori o paradossi, iperboli, false asserzioni e domande retoriche. Ciò rende l’identificazione dell’ironia un compito complesso sia per gli annotatori sia per i sistemi automatici.
Inoltre, il processamento automatico di questo fenomeno è complicato dalla compresenza di forme simili di espressione, come il sarcasmo o la satira [10] [11] [12] [13], così come dal dominio del testo.
L’uso di strumenti per il rilevamento dell’ironia si è concentrato maggiormente sulle piattaforme di microblogging, poiché l’ironia è ampiamente utilizzata dagli utenti online. Nei social media, i contrasti che suscitano ironia nei messaggi brevi (come i tweet) spesso coinvolgono almeno due proposizioni (o talvolta singole parole) che si contraddicono a vicenda [14]. Tuttavia, questo contrasto può avvenire a livello verbale o situazionale, e i due elementi contrastanti possono essere entrambi parte del contesto interno (lessicalizzati esplicitamente), oppure può essere presente nel testo solo uno dei due mentre l’altro deve essere dedotto dal contesto esterno al messaggio.
Istruzioni per l’annotazione
L’annotazione descritta in questo documento1 è stata ideata per catturare la nozione di ironia in modo dettagliato all’interno di un corpus multilingue [14] [15] (che include Italiano, Francese, Spagnolo e Inglese).
Un recente progetto di ricerca coordinato dal Dipartimento di Informatica dell’Università di Torino ci ha permesso di applicare questo schema a un altro corpus, ovvero la sezione italiana di MULTIPICO. [16] MULTIPICO è un corpus proveniente da Twitter e Reddit che include un ampio insieme di lingue annotate per l’ironia, coprendo 9 lingue e 25 varietà. Nel corpus i dati sono organizzati in coppie, ciascuna composta da un post e una risposta, annotata con un’etichetta binaria che indica se è ironica rispetto al post corrispondente.
I risultati promettenti del nostro esercizio di annotazione dei messaggi ironici della sezione italiana di MULTIPICO, descritta in [17], hanno portato alla decisione di applicare questo schema ad altri dati ironici estratti da MULTIPICO anche per Inglese, Francese e Spagnolo.
Task di annotazione
Dato un set di messaggi ironici (ovvero, considerati ironici in base all’annotazione fornita da MULTIPICO) composto da un post e una risposta, il compito di annotazione per ogni messaggio consiste in:
- selezionare una (o più) delle figure retoriche (elencate e descritte nella sezione successiva), per indicare il tipo di fattore o i fattori scatenanti dell’ironia presenti nella risposta.
Figure retoriche
La lista seguente include le figure retoriche da annotare. Gli esempi possono aiutare l’annotatore a comprendere meglio il significato di ciascuna figura.
-
ANALOGIA – L’ironia è provocata dal confronto letterale o metaforico tra due elementi, oppure mediante un confronto di un elemento con un contesto esterno.
Esempio:
Post: Bei denti!
Reply: @USER Un po’ da cavallo -
EUFEMISMO – Un elemento è utilizzato per attenuare o semplicemente sostituire l’altro elemento della coppia, oppure alcune conoscenze esterne.
Esempio:
Post: Niente di meglio di una guerra nucleare per risolvere il riscaldamento globale.
Commento: mi sembra un filino eccessivo!Esempio:
Post: Salento, extracomunitario muore mentre raccoglie pomodori.
Commento: Era l’unico modo per prendersi una pausa. -
SHIFT CONTESTUALE – Le parole, lo stile o il registro di uno dei due elementi mostrano un cambiamento netto di argomento o frame rispetto all’altro elemento.
Esempio:
Post: Avete paura di volare? Io sì.
Risposta: @USER Solo quando le mie braccia sono stanche -
OSSIMORO / PARADOSSO – I due elementi sono in chiaro contrasto o contraddizione, come nel caso di due eventi opposti.
Esempio:
Post: L’idea di superpoteri, poteri soprannaturali e poteri conferiti agli esseri umani da una divinità esiste da migliaia di anni. Non possiamo dire con certezza chi abbia avuto queste idee per primo. Ma possiamo dire che non è stato il creatore delle Superchicche, mi dispiace.
Risposta: Le tue informazioni sono realistiche e giuste, ma purtroppo hai comunque torto. -
IPERBOLE – Un elemento o entrambi gli elementi esprimono un’idea o un sentimento in modo esagerato.
Esempio:
Post: Mi confermate che 36,1 è da considerare febbre alta?!?!???
Risposta: @USER ?????? da estrema unzione -
FALSA ASSERZIONE – Una proposizione, un fatto o un’affermazione non ha senso rispetto alla realtà.
Esempio:
Post: Le temperature in Siberia si stanno alzando vertiginosamente.
Risposta: Alla Russia fa comodo un po’ di riscaldamento globale. Sale il valore della terra in Siberia. -
DOMANDA RETORICA – Una domanda viene posta per sottolineare un concetto piuttosto che per ottenere una risposta, coinvolgendo solo uno degli elementi o entrambi.
Esempio:
Post: Fuori fa un freddo cane.
Risposta: Dov’è il riscaldamento globale quando serve? -
ALTRO – Questa categoria può comprendere diversi fenomeni linguistici e pragmatici, quali giochi di parole, umorismo o ironia situazionale.
Esempio:
Post: Anche quest’anno guarderò i vostri alberi di Natale pensando: ma chi ve lo fa fare?
Risposta: @USER La gioia di vi… ah no.
- Le linee guida discusse sono tratte in gran parte da questo documento: https://github.com/IronyAndTweets/Scheme
Riferimenti bibliografici
- Cristina Bosco, Viviana Patti, and Andrea Bolioli. 2013. Developing Corpora for Sentiment Analysis: The Case of Irony and Senti-TUT. IEEE Intelligent Systems, 28(2), 55–63.
- Antonio Reyes, Paolo Rosso, and Tony Veale. 2013. A multidimensional approach for detecting irony in Twitter. Language Resources and Evaluation, 47(1), 239–268.
- Francesco Barbieri, Horacio Saggion, and Francesco Ronzano. 2014. Modelling Sarcasm in Twitter, a Novel Approach. In Proceedings of the 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, 50–58, Baltimore, Maryland. Association for Computational Linguistics.
- Aniruddha Ghosh, Guofu Li, Tony Veale, Paolo Rosso, Ekaterina Shutova, John Barnden, and Antonio Reyes. 2015. SemEval-2015 Task 11: Sentiment Analysis of Figurative Language in Twitter. In Proceedings of the 9th International Workshop on Semantic Evaluation (SemEval 2015), 470–478.
- Delia Irazú Hernández-Farías, José-Miguel Benedí, and Paolo Rosso. 2015. Applying Basic Features from Sentiment Analysis for Automatic Irony Detection. In Pattern Recognition and Image Analysis: 7th Iberian Conference, IbPRIA 2015, Lecture Notes in Computer Science 9117, 337–344. Springer.
- Aditya Joshi, Vinita Sharma, and Pushpak Bhattacharyya. 2015. Harnessing Context Incongruity for Sarcasm Detection. In Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 2: Short Papers), 757–762, Beijing, China. Association for Computational Linguistics.
- H. Paul Grice. 1975. Logic and Conversation. In Peter Cole and Jerry L. Morgan (eds.), Syntax and Semantics, Vol. 3: Speech Acts, 41–58. Academic Press.
- H. Paul Grice. 1978. Further Notes on Logic and Conversation. In Peter Cole (ed.), Syntax and Semantics, Vol. 9: Pragmatics. Academic Press.
- Dan Sperber and Deirdre Wilson. 1981. Irony and the Use-Mention Distinction. In Peter Cole (ed.), Radical Pragmatics, 295–318. Academic Press.
- Delia Irazú Hernández-Farías and Paolo Rosso. 2017. Irony, Sarcasm, and Sentiment Analysis. In Federico Alberto Pozzi, Elisabetta Fersini, Enza Messina, and Bing Liu (eds.), Sentiment Analysis in Social Networks, 113–128. Elsevier.
- Aditya Joshi, Pushpak Bhattacharyya, and Mark James Carman. 2017. Automatic Sarcasm Detection: A Survey. ACM Computing Surveys, 50(5), Article 73.
- Kumar Ravi and Vadlamani Ravi. 2017. A Novel Automatic Satire and Irony Detection Using Ensembled Feature Selection and Data Mining. Knowledge-Based Systems, 120, 15–33.
- Shiwei Zhang, Xiuzhen Zhang, Jeffrey Chan, and Paolo Rosso. 2019. Irony Detection via Sentiment-Based Transfer Learning. Information Processing & Management, 56(5), 1633–1644.
- Jihen Karoui, Farah Benamara, Véronique Moriceau, Viviana Patti, Cristina Bosco, and Nathalie Aussenac-Gilles. 2017. Exploring the Impact of Pragmatic Phenomena on Irony Detection in Tweets: A Multilingual Corpus Study. In Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 1, Long Papers, 262–272, Valencia, Spain. Association for Computational Linguistics.
- Alessandra Teresa Cignarella, Cristina Bosco, Viviana Patti, and Mirko Lai. 2018. Application and Analysis of a Multi-layered Scheme for Irony on the Italian Twitter Corpus TWITTIRÒ. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki, Japan. European Language Resources Association (ELRA).
- Silvia Casola, Simona Frenda, Soda Marem Lo, Erhan Sezerer, Antonio Uva, Valerio Basile, Cristina Bosco, Alessandro Pedrani, Chiara Rubagotti, Viviana Patti, and Davide Bernardi. 2024. MultiPICo: Multilingual Perspectivist Irony Corpus. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 16008–16021.
- Pier Felice Balestrucci, Michael Oliverio, Soda Marem Lo, Luca Anselma, Valerio Basile, Alessandro Mazzei, and Viviana Patti. 2025. When Figures Speak with Irony: Investigating the Role of Rhetorical Figures in Irony Generation with LLMs. In Proceedings of the Eleventh Italian Conference on Computational Linguistics (CLiC-it 2025), 55–63, Cagliari, Italy. CEUR Workshop Proceedings.