Guillaume Plique
banner
yomguithereal.bsky.social
Guillaume Plique
@yomguithereal.bsky.social
82 followers 130 following 18 posts
Research Engineer at SciencesPo's médialab.
Posts Media Videos Starter Packs
Il y a clairement des recouvrements oui. Les deux outils ne sont pas designés de la même manière ni avec les mêmes affordances ceci dit. Je pense que xan couvre plus de terrain et permet de produire des visualiations. xan est généralement plus rapide que miller, aussi et sait paralléliser autrement.
I don't know TEI very well, but if you know something like `xan from tei` would make sense (it might not be tabular enough for it to mean anythin though), let me know. `xan` has been first and foremost geared towards social sciences and digital humanities after all.
Sorry to eavesdrop here :) but I wonder whether the xan scrape command could take care of a least some subset of this endeavor?
Reposted by Guillaume Plique
📣 Le médialab est à la recherche d'une entreprise prestataire en design et développement de site web dans le cadre de la refonte du design et du front-office d’un annuaire.

Retrouvez le cahier des charges et les informations pour candidater ici 👇
Recherche prestataire en design et développement de site web dans le cadre du projet RésIn | médialab Sciences Po
Le médialab de Sciences Po recherche une entreprise prestataire dans le cadre du projet RésIn pour une mission de refonte du front-office d’un site web.
medialab.sciencespo.fr
Releasing xan v0.52.0, with bunch of new features such as pivoting, better transformations, subcommand execution and ranking aggregations. A bunch of bugfixes and QoL improvements are also included as always. Full changelog: github.com/medialab/xan...

Be sure to pivot correctly!
Reposted by Guillaume Plique
Guillaume Plique (@yomguithereal.bsky.social) will be speaking at #csvconf about "Building CSV-powered tools for social sciences"! Register now: http://csvconfv9.eventbrite.com
Reposted by Guillaume Plique
Découvrez en rediffusion la conférence "Social Science and Generative AI" organisée par le médialab le 5 juin dernier.

Des intervenants internationaux se sont réunis pour explorer les rôles interconnectés de l'IA générative dans le monde universitaire et la société.

Vidéo disponible ci-dessous 👇
Retour sur la conférence « Social Science and Generative AI » | médialab Sciences Po
Retrouvez en image la conférence « Social Science and Generative AI: Inquiries, Instruments, Consequences » organisée par le médialab le 5 juin 2025. Des intervenants internationaux ont discuté des qu...
medialab.sciencespo.fr
Just released: xan v0.51.0.

Looooots of new features, bugfixes and a novel approach to CSV file single-pass segmentation for map-reduce-like parallel computation over your data!

Check out the changelog over here: github.com/medialab/xan...
Release v0.51.0 · medialab/xan
The parallel update. Breaking Dropping undocumented xan index and related interactions (in xan count, xan sample, xan slice & xan split --jobs). Dropping now useless coalesce moonblade function. x...
github.com
Soon: xan sample n -§/--cursed!

What is cursed sampling you may ask? It's when you jump randomly in a CSV file like a dark wizard of course :)
Yup recharts usually does the job™. I think we used it more than once on datascapes.
xan hist is one copy paste away
xan est un fork de xsv maintenu par des fans de l’outil original, qui corrige pas mal de choses et ajoute des fonctionnalités et un langage d’expression ainsi que pas mal de visualisations directement dans le terminal oui :)
Reposted by Guillaume Plique
Xan : un outil en CLI Open Source, conçu pour manipuler les CSV développé chez Sciences Po Medialab 🇫🇷

"The CSV magician"

Version actuelle 0.48.0

👉 Le projet : github.com/medialab/xan
👉 Lire l'article "A love letter to the CSV format" : medialab.sciencespo....
Quoting with some image! Alas the fury!
But What if you quote a quote? Does it become a quotequote?
Quoting a test is, in itself, a quote.
This here is a test.
Quoting a test is, in itself, a quote.
This here is a test.
Reposted by Guillaume Plique
New release of xan (v0.48.0) by the research engineering team of the médialab!

Better scraping, smarter CSV commands — and more.

Check it out ⬇️
Matching url prefixes is not a trivial task. 1. you must be able to reorder urls to become meaningful hierarchical sequences 2. you need a prefix tree able to find a longest prefix so that matching remains efficient.

I just published a guide about how xan does it here: github.com/medialab/xan...
github.com
Just released v0.48.0 of xan, @medialab-scpo.bsky.social CSV wrangling command!

Highlights include better scrape, network, explode & implode commands, a new url-join command and xan search --url-prefix flag to easily match rows on url prefixes!

github.com/medialab/xan...
GitHub - medialab/xan: The CSV magician
The CSV magician. Contribute to medialab/xan development by creating an account on GitHub.
github.com
Still better than SparQL :)
Reposted by Guillaume Plique
I found the ultimate CLI tool for processing CSV files! 🔥

🪄✨ xan: The CSV magician.

💯 Supports expressions, parallelism, advanced filtering, sorting, and visualizations.

🦀 Written in Rust & uses @ratatui.rs

⭐ GitHub: github.com/medialab/xan

#rustlang #ratatui #tui #csv #cli #commandline
Reposted by Guillaume Plique
Et merci à @jwyg.bsky.social qui nous a soumis l'idée d'élargir l'outil à plus de moteurs !

Vivement un workshop avec le @publicdatalab.bsky.social pour bosser tous ensemble avec ! :)
Reposted by Guillaume Plique
Vous pouvez l'installer et le tester directement en quelques clics depuis la page suivante
medialab.github.io/SearchEngine...

Merci à @jpontoire.bsky.social dont ce fut l'une des nombreuses réalisations au cours de son stage dans l'équipe technique du @medialab-scpo.bsky.social ces 5 derniers mois!
Search Engines Bookmarklet
medialab.github.io