Guía para la Anotación de Ironía

Autores: Cristina Bosco, Luca Anselma, Pier Felice Balestrucci, Valerio Basile, Eliana Di Palma, Horacio Jesús Jarquín Vásquez, Marta Marchiori Manerba, Michael Oliverio, Viviana Patti, Alessandro Mazzei

Afiliación: Dipartimento di Informatica, University of Turin, Italy, Corso Svizzera 185, 10149 Turin (Italy)

Contacto: cristina.bosco@unito.it

Reconocer la ironía es una tarea compleja, y la disponibilidad de corpus anotados puede resultar crucial para su procesamiento automático. Este documento proporciona directrices de anotación basadas en un esquema de alta granularidad centrado en la ironía, con especial atención a una variedad de figuras retóricas que pueden funcionar como desencadenantes de ironía.

Introducción

La detección de ironía es una tarea importante en el análisis de sentimientos, ya que su presencia puede invertir la polaridad de una opinión expresada en un texto. Por ejemplo, palabras con connotaciones positivas pueden emplearse para transmitir un significado negativo, lo que afecta negativamente al rendimiento de los sistemas de análisis de sentimientos ^{[1] [2] [3] [4] [5] [6]}.

De hecho, la ironía se basa en fenómenos pragmáticos y lingüísticos cuya identificación puede resultar controvertida ^{[7] [8] [9]}, dado que pueden emplearse diferentes recursos retóricos como desencadenantes de ironía, tales como la analogía, el eufemismo, el cambio de contexto, el oxímoron y la paradoja, la hipérbole, la afirmación falsa y la pregunta retórica. Esto convierte la identificación de la ironía en una tarea especialmente desafiante tanto para los anotadores humanos como para las herramientas automáticas.

Además, el procesamiento automático de este fenómeno es complicado debido a la coexistencia de formas de expresión similares, como el sarcasmo o la sátira ^{[10] [11] [12] [13]}, así como por el dominio textual.

El uso de herramientas para la detección de ironía se ha centrado particularmente en las plataformas de microblogueo, dado que la ironía es ampliamente utilizada por los usuarios en línea. En las redes sociales, los contrastes que desencadenan ironía en mensajes breves, como los tuits, suelen involucrar al menos dos proposiciones, o en algunos casos palabras individuales, que se contradicen entre sí ^[14]. No obstante, esta contradicción puede producirse a nivel verbal o situacional, y los dos elementos contrastivos pueden formar parte del contexto interno, lexicalizados explícitamente, o bien uno de ellos puede estar presente mientras que el otro debe inferirse a partir de un contexto externo al mensaje.

Directrices de anotación

La anotación descrita en este documento¹ ha sido desarrollada para capturar las nociones de ironía de manera altamente granular dentro de un corpus multilingüe ^{[14] [15]} que abarca italiano, francés, español e inglés.

Un proyecto de investigación reciente, coordinado por el Departamento de Ciencias de la Computación de la Universidad de Turín, nos permitió aplicar este esquema a otro corpus, es decir, la sección en italiano de MULTIPICO ^[16]. MULTIPICO es un corpus procedente de Twitter y Reddit que incluye un conjunto más amplio de idiomas anotados para la detección de ironía, cubriendo 9 idiomas y 25 variedades. En este corpus, los datos están organizados en pares, cada uno compuesto por una publicación y una respuesta, la cual se anota con una etiqueta binaria que indica si es irónica con respecto a la publicación correspondiente.

Los resultados prometedores de nuestro ejercicio de anotación de los mensajes irónicos de la sección en italiano de MULTIPICO, descritos en ^[17], determinaron la decisión de aplicar el esquema también a otros datos irónicos extraídos de MULTIPICO para inglés, español y francés.

La tarea de anotación

Dado un conjunto de mensajes irónicos, es decir, irónicos según la anotación proporcionada en MULTIPICO, compuestos por una publicación y una respuesta, la tarea de anotación para cada mensaje consiste en:

seleccionar una o más figuras retóricas para indicar el tipo de desencadenante o desencadenantes de ironía presentes en la respuesta.

Figuras retóricas

La siguiente lista incluye las figuras retóricas que deben anotarse. Los ejemplos pueden ayudar al anotador a comprender mejor el significado de cada figura.

ANALOGÍA – La ironía se desencadena mediante una comparación literal o metafórica de dos elementos, o mediante la comparación de un elemento con un contexto externo.

Ejemplo:
Publicación: Si alguien en el trabajo te llamara “cabra estúpida”, ¿cómo reaccionarías?
Respuesta: @USER ¡embistiéndolos!
EUFEMISMO – Un elemento se utiliza para atenuar o simplemente sustituir al otro elemento del par, o bien para aludir a algún conocimiento externo.

Ejemplo:
Publicación: Jajajaja los amigos de mi ex dándole like a mis historias, porrrrrrrr?
Respuesta: @USER Quieren cama.
CAMBIO DE CONTEXTO – Las palabras, el estilo o el registro de uno de los dos elementos muestran un cambio marcado de tema o marco con respecto al otro elemento.

Ejemplo:
Publicación: ¿Tienes algún fetiche raro inconfesable, algo con lo que te hagas pajas en secreto?
Respuesta: Cigalas a la plancha.
OXÍMORON / PARADOJA – Los dos elementos están en claro contraste o contradicción, como dos eventos opuestos.

Ejemplo:
Publicación: Capaz que cambian el diseño del de 500 y pasa a ser el nuevo billete de 5 en unos años y volamos todos jajajajajjaja
Respuesta: Puedo oler las lágrimas detrás de esa risa.
HIPÉRBOLE – Un elemento o ambos elementos expresan una idea o un sentimiento de manera exagerada.

Ejemplo:
Publicación: Se parece a la mascota de Duolingo.
Respuesta: Eso me recuerda que tengo que hacer mis lecciones de inglés para que Duo me devuelva a mis perros, los extraño.
AFIRMACIÓN FALSA – Una proposición, un hecho o una afirmación que carece de sentido frente a la realidad.

Ejemplo:
Publicación: Las temperaturas en Siberia se están disparando.
Respuesta: Rusia necesita algo de calentamiento global. El valor de la tierra en Siberia aumenta.
PREGUNTA RETÓRICA – Se formula una pregunta con el fin de enfatizar un punto en lugar de obtener una respuesta, y en ella interviene solo uno de los elementos o bien ambos.

Ejemplo:
Publicación: Yo soy uribista, aunque le quedó grande la presidencia. Yo voto por Federico Gutiérrez en 2022.
Respuesta: ¿Es decir, seguir en las mismas?
OTRA – Esta categoría puede abarcar distintos fenómenos lingüísticos y pragmáticos, como los juegos de palabras, el humor o la ironía situacional.

Ejemplo:
Publicación: Sales por la mañana con el calentamiento global y vuelves a casa cuando ya es la Guerra Fría.
Respuesta: Realmente ya no sabes cómo vestirte.

Las directrices analizadas en este artículo están en gran medida inspiradas en el siguiente documento: https://github.com/IronyAndTweets/Scheme

Referencias bibliográficas

Cristina Bosco, Viviana Patti, and Andrea Bolioli. 2013. Developing Corpora for Sentiment Analysis: The Case of Irony and Senti-TUT. IEEE Intelligent Systems, 28(2), 55–63.
Antonio Reyes, Paolo Rosso, and Tony Veale. 2013. A multidimensional approach for detecting irony in Twitter. Language Resources and Evaluation, 47(1), 239–268.
Francesco Barbieri, Horacio Saggion, and Francesco Ronzano. 2014. Modelling Sarcasm in Twitter, a Novel Approach. In Proceedings of the 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, 50–58, Baltimore, Maryland. Association for Computational Linguistics.
Aniruddha Ghosh, Guofu Li, Tony Veale, Paolo Rosso, Ekaterina Shutova, John Barnden, and Antonio Reyes. 2015. SemEval-2015 Task 11: Sentiment Analysis of Figurative Language in Twitter. In Proceedings of the 9th International Workshop on Semantic Evaluation (SemEval 2015), 470–478.
Delia Irazú Hernández-Farías, José-Miguel Benedí, and Paolo Rosso. 2015. Applying Basic Features from Sentiment Analysis for Automatic Irony Detection. In Pattern Recognition and Image Analysis: 7th Iberian Conference, IbPRIA 2015, Lecture Notes in Computer Science 9117, 337–344. Springer.
Aditya Joshi, Vinita Sharma, and Pushpak Bhattacharyya. 2015. Harnessing Context Incongruity for Sarcasm Detection. In Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 2: Short Papers), 757–762, Beijing, China. Association for Computational Linguistics.
H. Paul Grice. 1975. Logic and Conversation. In Peter Cole and Jerry L. Morgan (eds.), Syntax and Semantics, Vol. 3: Speech Acts, 41–58. Academic Press.
H. Paul Grice. 1978. Further Notes on Logic and Conversation. In Peter Cole (ed.), Syntax and Semantics, Vol. 9: Pragmatics. Academic Press.
Dan Sperber and Deirdre Wilson. 1981. Irony and the Use-Mention Distinction. In Peter Cole (ed.), Radical Pragmatics, 295–318. Academic Press.
Delia Irazú Hernández-Farías and Paolo Rosso. 2017. Irony, Sarcasm, and Sentiment Analysis. In Federico Alberto Pozzi, Elisabetta Fersini, Enza Messina, and Bing Liu (eds.), Sentiment Analysis in Social Networks, 113–128. Elsevier.
Aditya Joshi, Pushpak Bhattacharyya, and Mark James Carman. 2017. Automatic Sarcasm Detection: A Survey. ACM Computing Surveys, 50(5), Article 73.
Kumar Ravi and Vadlamani Ravi. 2017. A Novel Automatic Satire and Irony Detection Using Ensembled Feature Selection and Data Mining. Knowledge-Based Systems, 120, 15–33.
Shiwei Zhang, Xiuzhen Zhang, Jeffrey Chan, and Paolo Rosso. 2019. Irony Detection via Sentiment-Based Transfer Learning. Information Processing & Management, 56(5), 1633–1644.
Jihen Karoui, Farah Benamara, Véronique Moriceau, Viviana Patti, Cristina Bosco, and Nathalie Aussenac-Gilles. 2017. Exploring the Impact of Pragmatic Phenomena on Irony Detection in Tweets: A Multilingual Corpus Study. In Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 1, Long Papers, 262–272, Valencia, Spain. Association for Computational Linguistics.
Alessandra Teresa Cignarella, Cristina Bosco, Viviana Patti, and Mirko Lai. 2018. Application and Analysis of a Multi-layered Scheme for Irony on the Italian Twitter Corpus TWITTIRÒ. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki, Japan. European Language Resources Association (ELRA).
Silvia Casola, Simona Frenda, Soda Marem Lo, Erhan Sezerer, Antonio Uva, Valerio Basile, Cristina Bosco, Alessandro Pedrani, Chiara Rubagotti, Viviana Patti, and Davide Bernardi. 2024. MultiPICo: Multilingual Perspectivist Irony Corpus. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 16008–16021.
Pier Felice Balestrucci, Michael Oliverio, Soda Marem Lo, Luca Anselma, Valerio Basile, Alessandro Mazzei, and Viviana Patti. 2025. When Figures Speak with Irony: Investigating the Role of Rhetorical Figures in Irony Generation with LLMs. In Proceedings of the Eleventh Italian Conference on Computational Linguistics (CLiC-it 2025), 55–63, Cagliari, Italy. CEUR Workshop Proceedings.