Description

Le Traitement Automatique des Langues (TAL) est une discipline au coeur des enjeux éthiques du XXIe siècle : accès aux données personnelles et protection de la vie privée, traitement (et croisement) des masses de données, délocalisation et crowdsourcing (myriadisation) sont autant de problématiques qui sont en lien direct avec les applications que nous développons.

L’anonymisation des données, qu’elles soient orales ou écrites, est un enjeu tant industriel qu’académique, avec des contraintes de couverture parfois fortes selon les besoins applicatifs ou de recherche, la nature des ressources et des informations à anonymiser ou encore les limitations légales. D’autres outils du TAL s’inscrivent également dans des préoccupations éthiques, comme les outils de détection de plagiat ou de vérification de faits. La diversification des travaux sur corpus a par ailleurs amené la communauté à traiter des sources de plus de plus sensibles, qu’il s’agisse de données personnelles, médicales, voire à caractère criminel.

En outre, l’avènement du Web 2.0. et avec lui le développement de la myriadisation (crowdsourcing), pose de nouvelles questions quant à la manière de considérer les intervenants dans la création de ressources langagières. Enfin, les préoccupations concernant l’utilisation des outils de TAL ne sont pas nouvelles, mais elles de- viennent de plus en plus sensibles à l’heure des Big Data et du recoupement des données auquel participe le TAL. Aux questions juridico-économiques (fouille de brevets, droits associés aux données/logiciels), s’ajoutent les enjeux militaires (surveillance des échanges) et sociaux (le “droit à l’oubli” imposé à Google).

Les recherches autour de l’évaluation de nos technologies (biais et qualité) représentent également un aspect important de l’éthique du TAL.

La Journée d’Etudes ATALA Ethique et TAL organisée le 22 novembre 2014 1 a permis de réunir une soixantaine de participant autour de ces thèmes. Neuf articles y ont été présentés et deux intervenants invités s’y sont exprimés (Jean-Marie Pierre, Université de Lorraine et Danièle Bourcier, CERSA CNRS). Les discussions y ont été animées et ont montré le besoin qu’a la communauté de s’interroger et de développer une réflexion en commun sur le sujet. Comme l’a rappelé Danièle Bourcier lors de sa présentation invitée, l’éthique est une “auto régulation non normative élaborée par une communauté”.

Encore faut-il se doter d’un espace pour élaborer et légitimer cette auto-régulation.

Cet atelier fournit un espace de réflexion ouvert et interactif qui permettra d’approfondir les réflexions entamées lors de la Journée d’Etudes. Il comprendra après les présentations une table ronde permettant à tous les chercheurs présents de s’exprimer sur les thèmes abordés.