Drama critiques : comment concilier algorithmes et analyses littéraires ?
Passionnée de théâtre anglais, Mylène Maignant, doctorante à l’ENS - PSL effectue sa thèse au croisement de la littérature et de la « Data Science ». En s’appuyant sur ses recherches, elle a mis au point une plate-forme : drama critiques, qui entend éclairer les internautes sur ce qui se cache derrière les « humanités numériques ».
Depuis une dizaine d’années, les humanités numériques constituent un domaine d’enseignement et de recherche au croisement des arts, sciences humaines et sociales et de l’informatique. En pratique, il s’agit d’utiliser les outils numériques en sciences humaines et sociales, mais aussi de prendre en compte les nouveaux contenus numériques comme sujets d’étude.
Drama critiques
Projet d’exploration de la critique contemporaine du théâtre anglais grâce à la Data Science, Drama critiques s’appuie sur plus de 40 000 critiques théâtrales collectées à partir de deux ensembles : les journalistes d’une part, les blogueurs et blogueuses d’autre part. Avec 1069 auteurs et autrices, répartis sur 51 blogs et journaux, ce corpus comprend des critiques de 9020 pièces de théâtre publiées entre 2010 et 2020.
Les critiques journalistiques sont issues du magazine « Theater records » qui rassemble les articles publiés à propos de pièces de théâtre dans différents journaux anglais.
La blogosphère est composée d’auteurs indépendants, non rémunérés, et divisée en 28 blogs.
Il aura fallu plus d’un an pour constituer cet immense corpus.
L’analyse algorithmique
Une fois son corpus constitué, comment l’analyser ? L’une des techniques consiste à utiliser des algorithmes à base de « machine learning ». En pratique, cela revient à entraîner un algorithme pour qu’il caractérise des textes, en s’appuyant sur un échantillon. On peut ainsi apprendre à un programme à analyser les sentiments présents dans un texte, en fonction du vocabulaire, des verbes employés, ou des pronoms. Pour le projet, Mylène Maignant a mis en œuvre 3 algorithmes principaux :
- Un premier dit d’analyse stylistique computationnelle, qui permet de se pencher sur le style d’écriture des auteurs. Cette analyse permet par exemple de faire ressortir des tendances, sur les mots les plus utilisés et de comparer les résultats entre différents groupes du corpus.
- Un second d’analyse de sentiments : à l’instar des algorithmes utilisés par les grands groupes commerciaux en marketing, celui-ci permet de savoir si un texte est plutôt positif, négatif ou neutre. En d’autres termes, il est ici possible de déterminer les pièces appréciées par tel ou tel critique.
- Un dernier algorithme géographique permet de corréler les critiques et les lieux de déplacements des auteurs.
Des résultats très instructifs
Pourquoi faire toutes ces analyses ? Parce que sur un sujet aussi créatif, les chercheurs n’ont pas d’a priori sur les résultats qui émergeront ! Les différentes analyses algorithmiques font ressortir des résultats intéressants pour la chercheuse. D’abord, il y a une assez grande polarité entre le canon de la critique théâtrale et les « marges ». Les critiques journalistiques ont tendance à plus employer la première personne pour s’exprimer, et se concentrent plutôt sur l’affect. La cartographie des lieux de théâtre montre aussi que les blogueurs se déplacent dans une grande diversité de lieux, qui ne sont pas seulement des théâtres. Ces lieux sont plus petits, et constituent de nouveaux lieux de culture qui échappent aux radars des critiques journalistiques. L’analyse de sentiments montre quant à elle que les pièces préférées sont à peu près similaires pour le top 10, mais que des différences plus fines se font sentir entre les deux communautés par la suite.
Sur la plate-forme Dramacritiques, la chercheuse a tenu à expliquer sa démarche et à mettre le plus d’éléments accessibles possibles : le corpus par exemple, avec l’accord des différentes communautés, les résultats de ses travaux, et sa démarche intellectuelle, mais aussi une rubrique « derrière la machine » pour détailler ce processus qui consiste à utiliser l’accompagnement par ordinateur pour simplifier un processus dont le fonctionnement a été pensé au préalable.
Et puis il y a la question du dialogue avec le programme : comment passer des données brutes à celles exploitables par l’algorithme. Cette étape, cruciale, nécessite une mise en forme des données, un vrai travail de fourmi pour rendre les données lisibles et utilisables par les différents programmes. C’est aussi l’occasion de mettre en avant le travail réalisé par les chercheurs, au niveau de la sélection et de l’adaptation des algorithmes : derrière la machine, reste l’humain avec ses biais éventuels et son système d’analyse.
Enfin l’ensemble des données et des programmes utilisés est accessible, afin, par exemple, de permettre d’utiliser la démarche dans un autre domaine. Un vrai engagement en matière de science ouverte.
Perspectives
Le corpus constitué, il est possible d’apporter de nouveaux degrés de finesse dans son analyse. Par exemple, Mylène Maignant souhaite introduire la notion de genre dans son étude, ce qui lui permettra d’avoir un moteur de recherche des pièces en fonction du genre de leur auteur/autrice, ou encore d’étudier la subjectivité des critiques en fonction de leur genre !
En parallèle, la jeune chercheuse a également contacté les blogueurs et journalistes, afin de leur faire part de son travail. Objectif : engager une discussion et une réflexion sur le thème de la critique théâtrale, dans un monde où la culture prend de nouvelles formes et conquiert de nouveaux territoires.
Mylène Maignant effectue sa thèse au sein du laboratoire LATTICES (LAngues, Textes, Traitements Informatiques et Cognition) à l’ENS - PSL. Après avoir obtenu un Master en Langues, Littératures et Cultures Etrangères (Anglophones) à Sorbonne Université, elle a effectué un second Master à Paris Sciences & Lettres, à l’Ecole nationale des chartes, en humanités numériques. Ses recherches doctorales s’inscrivent à l’intersection de ces deux disciplines. Elle a notamment participé au développement d’Oupoco, la boîte à Poésie dont nous vous parlions ici : https://www.youtube.com/watch?v=G_STsUdYsFk
|