Stéphane Pouyllau
@spouyllau.bsky.social
490 followers 780 following 140 posts
Ingénieur de recherche hors classe au CNRS. SHS, données, IA… Co-créateur https://isidore.science, https://huma-num.fr et https://nakala.fr Responsable du HN Lab | Professeur attaché à l'université d'Evry Paris-Saclay | Photographe des dimanches
Posts Media Videos Starter Packs
spouyllau.bsky.social
J’ai plus lien 🔗 sous la main, mais il est je crois dans le livre de Caroline Muller avec Frédéric Clavert, j’ai donné une vidéo pour leur séminaire il y a deux ans où je raconte un peu ces sujets d’évolution des instruments de la recherche en #SHS. 10/
spouyllau.bsky.social
… instrument doit répondre à un besoin et doit être réglé avec les chercheurs s’ils/elles ne peuvent pas le faire eux même et cela c’est aussi le job des personnes qui, comme moi, développent des instruments. 5/
spouyllau.bsky.social
Les RAG ne sont pas la panacée et ne vont pas remplacer les moteur de recherche. Les RAG sont une interface de moteur de recherche, comme l’est le formulaire de recherche, les verbes de leurs API. Avec des biais induits pas les choix fait et c’est pour cela que ces instruments, comme tout… 4/
spouyllau.bsky.social
👥 Cette application est en cours de création et j’échange avec une chercheuse en France 🇫🇷 et un archiviste au Canada 🇨🇦 pour tester justement des réglages, des bibliothèques de Prompt, ou équivalent. Les RAG, c’est pas du prêt-à-porter, c’est du sur mesure sans être de la haute couture. 2/
spouyllau.bsky.social
🧭 Aux premiers retours/questions de collègues : un dispositif de RAG unique, neutre, dispo sur l’étagère, ça n’existe pas. Une RAG ça se règle, ça s’adapte à un besoin, à un projet, à un corpus. Ce n’est pas un outils, c’est un instrument qui doit être adapté à une action de recherche. 1/
spouyllau.bsky.social
Lancement de la plateforme Galligeo du @ptm-huma-num.bsky.social pour géoréférencer les #cartes anciennes de #Gallica. #shs #dh
ptm-huma-num.bsky.social
🚀 Lancement de Galligeo !
Une nouvelle application web pour géoréférencer les cartes anciennes de @GallicaBnF
🗺️ Contribuez avec ou sans #ORCID
📚 Dépôt simplifié sur #Nakala
📖 Créez & partagez vos atlas
👉 Testez : app.ptm.huma-num.fr/galligeo/

#CartesAnciennes avec @huma-num.bsky.social
spouyllau.bsky.social
Construire un SI ou un SiDoc pour l’histoire incluant une approche #RAG permet d’explorer les savoir-faire, les enjeux, les méthodes (et limites), les techniques (et limites) de tous les « gestes de l’historien·ne » (ou du moins un grand nbre de « gestes »). Des archives à la diffusion des savoirs.
spouyllau.bsky.social
Mais je ne pourrai pas enseigner l’inverse dans la mesure où c’est la découverte du potentiel d’application des techniques du Web en DEUG et licence d’histoire qui m’ont permis d’être recruté au CNRS après avoir initié une activité free-lance.
spouyllau.bsky.social
Comment, les « gestes numériques » de l’historien·ne en formation peuvent être valorisés *aussi* (et surtout) en matière de recherche d’emploi. Même si je prends un peu des gants sur une vision trop capitaliste de la valorisation des savoir-faire mixtes (ça heurte les gens installés).
spouyllau.bsky.social
Ce matin, nous avons posé les bases, la terminologie et les grandes enjeux des SiDocs et SI à objectif de #RAG ou de pipe-line de traitement sur IA. Histoire de parler aussi de l’apport des doubles parcours (histoire + numérique) dans la recherche d’emploi post M2.
spouyllau.bsky.social
« Écrire l’histoire ». Lecture principale de mon cours cette année pour mes M2 @univevry.bsky.social. Ajouterons-nous un « Geste » en apprenant à concevoir des systèmes d’information numériques pour l’histoire à base de #RAG, des #IA, de #Python, de fonds d’archives ? On va essayer en tous les cas !
Le livre de C Muller et F Clavert dans ma salle de cours a l’Univ d’Evry !
spouyllau.bsky.social
Paradoxalement, la gestion des ePub est moins complexe que la gestion de l'ingestion, indexation, traitement des CSV (indexation des contenus + gestion du Dataframe pour les réponses). Ce qui m'inquiète, c'est que déjà mon code ne ressemble plus à rien après une nuit de travail ! 😅
spouyllau.bsky.social
Cela m'offre plein d'exemples pour expliquer à mes M2 en histoire économique et sociale d'Evry l'importance de la préparation des données sur le plan de la qualité des contenus pour les traitements par RAG (surtout qd plusieurs format, PDF, ePub, MD, CSV, etc.) sont en entrée.
spouyllau.bsky.social
Et j'avais totalement oublié l'histoire du mariage de Jeanne Brun avec J. de Genouillac en déc. 1538 ! Je me souviens uniquement du sketch au AD de la Gironde car on avait pas le droit de photographier (en argentique!) les liasses & folios. Pauvres archives, elles sont maintenant traitées par l'IA…
Extrait (maltraité) par un outil de RAG / IA des données des AD de la Gironde, transcrites à la main sur un cahier et numérisé il y a 25 ans.
spouyllau.bsky.social
Calibrage des bibliothèques/éditeurs des “Prompt“ pour la #RAG sur mes travaux de maitrise et DEA d'il y a bientôt 30 ans (PDF des 90's). Le niveau des réponses chronologiques s'améliore lentement ! 😅 Bon, il va falloir que j'écrive le log sur le passage Notebook > Apps et ça m'enchante moyen… 🤓 #IA
Interface de RAG avec IA sur de vieux travaux de recherche en histoire médiévale.
spouyllau.bsky.social
Une partie de l’équipe du @huma-num.bsky.social Lab (Léa Maronet et Adam Faci) à l’ENS Ulm pour la journée IA de Diginum avec la présentation des travaux de reconnaissances de formes par l’IAg sur les plateformes du HN Lab (qui font écho aux travaux de Robert Vergnieux).
Les chercheurs du HN Lab sur l’IA pour les traitements de l’imagée archéologiques