Agenda
Événements & colloques
Océriser un corpus en caractères gothiques (séminaire de recherche de l'équipe SETAF, Genève & en ligne)

Océriser un corpus en caractères gothiques (séminaire de recherche de l'équipe SETAF, Genève & en ligne)

Publié le par Marc Escola (Source : Nathalie Szczech)

L'équipe du projet FNS SETAF (IHR) a le plaisir de vous annoncer le premier séminaire organisé dans le cadre du volet numérique de notre projet :

Océriser un corpus en caractères gothiques : défis, outils et premiers résultats 

9 février 2024 

14h - 16h | PHIL 014

S. Solfrini, G. Gross, P.-O. Beaulnes, A. M. Oliveira
Modération : S. Gabay

Le séminaire peut également être suivi en ligne. Pour recevoir le lien zoom, veuillez contacter Sonia Solfrini. 

Dans ce séminaire, l'équipe du projet SETAF présentera le travail d'océrisation réalisé jusqu'à présent sur un corpus d'imprimés romands à l'époque de la Réforme. Plusieurs outils sont requis pour l'OCR (Optical Character Recognition), qui permet d'extraire des textes de leurs fac-similés numériques, dont certains peuvent varier en fonction des caractéristiques des ouvrages. Pour répondre aux traits distinctifs de notre corpus primaire, constitué d'imprimés en gothique et en moyen français (1530-1540), nous avons créé des outils adaptés à ce type de données, notamment un guide de transcription et un modèle d'OCR. Ce travail peut intéresser d'autres projets de recherche visant à construire des bibliothèques numériques ou à effectuer des études computationnelles de textes.

 Pour plus d'informations sur le projet SETAF, veuillez consulter notre site à l'adresse suivante : https://www.unige.ch/setaf/.

 L'équipe SETAF vous remercie beaucoup pour votre attention et pour votre éventuelle participation à nos séminaires. 

 Daniela Solfaroli Camillocci, Sonia Solfrini, Geneviève Gross, Brigitte Roux et Nathalie Szczech