Colloquium Polaris du 18/04/2024

le 18 avril 2024 à 14:00

Intervenant : Philippe Gambette

Utiliser et enrichir Wikisource, Wikidata et Wikipédia pour une science ouverte et inclusive.

La bibliothèque numérique collaborative Wikisource peut être utilisée, aux côtés d’autres bibliothèques électroniques comme le projet Gutenberg, comme une source de textes pour des projets de recherche en traitement automatique des langues ou en humanités numériques. Un usage comme source de données textuelles pour créer des “corpus de convenance” mérite de connaitre les biais éventuels des contenus de la plateforme, notamment en ce qui concerne le biais de genre des auteurs. Nous verrons comment, en nous appuyant sur des approches similaires à celles mises en place par le collectif des sans pagEs sur Wikipedia, il est possible d’évaluer ces biais, notamment en utilisant la base de données collaborative Wikidata puis d’y remédier. Nous présenterons plusieurs initiatives menées dans le cadre de projets de recherche à l’université Gustave Eiffel, en partenariat avec l’association Le deuxième texte, pour enrichir les corpus avec des textes écrits par des femmes. Nous illustrerons enfin de quelle manière Wikidata peut aussi être utilisée pour mettre à disposition des données de la recherche, en servant de base de données pivot, dans une approche de science ouverte.

En savoir plus...

Amphi Ircica – 50 avenue Halley – Haute Borne – Villeneuve d’Ascq

Plus d'actualités