Traitement de données économiques du théâtre du XVIIIe : de la transcription à l’analyse.

Préambule

Cette offre concerne un post-doctorat hébergé au LINA (équipe DUKe), d’une durée de 12 mois extensible jusqu’à 18 mois. Le contrat débutera le 01 octobre 02 novembre 2015 et l’échelle de rémunération, dépendant de l’expérience, commence un peu au dessus de 27.000€ brut/an.

Le profil scientifique recherché s’inscrit dans la thématique “science des données“. Une activité secondaire de développement de plate-forme web fait également partie des missions de ce post-doctorat.

I) Contexte

Le support de poste est fourni par le projet ANR CIRESFI.

Le projet dispose d’un siècle (1717 à 1794) de copies numérisées des registres du théâtre de la Comédie-Italienne, à partir desquelles nous souhaitons étudier et contextualiser l’économie du spectacle au XVIIIe. Des fac-similés de ces archives sont également consultables sur Gallica. La transcription en base de données et l’exploitation de ces informations essentiellement comptables, requierent le développement d’outils et de techniques qui sont au coeur de cette proposition de post-doctorat.

Le CETHEFI propose également un bref descriptif des enjeux du projet en humanités numériques, à l’interface entre l’histoire culturelle et l’informatique.

Un projet similaire, dont l’objet d’étude est le fond documentaire des registres de la Comédie-Française, a précédemment donné lieu à du développement logiciel porté par Hyperstudio, le laboratoire d’humanités numériques du M.I.T. (Cambridge, MA). Ce dernier est partenaire du projet CIRESFI.

II) Objectifs

(a) Développement d’une plate-forme web pour la transcription et le filtrage
des registres de la Comédie-Italienne au XVIIIe siècle (~3 mois).

La plate-forme est un élément central au projet. Sa mise en production et son suivi sont donc des tâches critiques qui incombent au (à la) candidat-e. Outre l’encadrement direct par le LINA, un échange soutenu avec les partenaires du CETHEFI et de l’IRCCyN doit être mené pour le recueil des besoins.

(b) Evaluation, exploration et enrichissement des données de registres (~8 mois).

C’est la tâche principale, en lien étroit avec l’activité de recherche menée au sein de l’équipe DUKe du LINA. Les questions qui seront traitées s’inscrivent dans les champ de l’analyse et l’exploration/visualisation multi-dimensionnelles, l’inférence et la qualification de données incertaines, la résolution d’entité et l’intégration de sources externes.

Dans ce contexte, une attention particulière sera portée à la navigation par facettes dynamiques, comme outil privilégié pour l’exploration interactive.

(c) Intégration à la plate-forme web de briques logicielles issues des prototypes de recherche développés dans le projet CIRESFI (~1 mois).

Cette phase doit permettre de rendre compte par le prisme d’un démonstrateur, des résultats scientifiques obtenus à l’issue du projet par les partenaires IRCCyN et LINA.

III) Pré-requis

1) Compétences scientifiques

Majeure = Fouille de données, cubes et analyses multi-dimensionnels

Mineures =

  • Théorie des bases de données
  • Apprentissage machine
  • Intégration de données, résolution d’entités
  • Visualisation de données
  • Web des données
2) Compétences techniques

Majeure = Python et son éco-système de développement logiciel

Mineures =

  • framework d’analyse de données (anaconda), ou équiv. avec R
  • framework web (django)
  • standards Dublin Core et OAI-PMH
3) Qualités supplémentaires attendues
  • Expérience de—ou goût pour—l’interdisciplinarité
  • Très bonne capacité de communication orale et écrite (français et anglais scientifique)

IV) Modalités de candidature

Contact : guillaume . raschia at univ-nantes.fr

Merci de bien vouloir fournir par email:

  • un CV
  • un argumentaire qui justifie la candidature (lettre de motivation pseudo-formelle)
  • un document scientifique, au choix, rédigé par le (la) candidat-e
  • 2 lettres de recommandation, ou les coordonnées de 2 référents

Pour toute demande d’information complémentaire, veuillez transmettre à l’adresse de contact ci-dessus.

Comments are closed.

Post Navigation