mcorbin
banner
mcorbin.bsky.social
mcorbin
@mcorbin.bsky.social
550 followers 150 following 400 posts
Posts Media Videos Starter Packs
Je pensais avoir tout vu dans ma carrière mais l'user/mot de passe en clair qui se balade en query param dans un site semi étatique c'est une première.
La prochaine étape c'est full otel côté client pour avoir client+serveur sur la meme trace mais je ferai un retour quand/si ça se met en place (et iirc le sdk js front est pas totalemeng sec).
Ensuite le reste avec des thresholds élevés ça peut aussi détecter des problèmes globaux notamment sur une augmentation forte après une release.
Si on passe de 20% (baseline) a 90 % d'erreurs chelous (style timeout/reseau) apres une release c'est généralement qu'un truc a sauté 😅
Mais oui il y a tjr une grosse part d'erreurs dans les req ce qui complexifie l'alerting par exemple.
Mais rien que de focus sur les erreurs serveur avec dans l'évent le contexte utilisateur (org/user id etc), ou events du type crash de l'app front/mobile c'est pas mal.
Wide events et ensuite filtrer par attribut(c'est ce que je testais il y a quelques mois).
Si il y a des attributs sur l'event sur la raison du plantage (5XX ou 4XX reçue, pb reseau/timeout...) ca permet déjà de filtrer les "vrais" erreurs du reste où on sait pas trop.
Fun fact mais le mois dernier j'ai bossé pendant 3 semaines sur un nouveau service interne, sans me rendre compte que j'avais désactivé la centralisation des logs dessus.
Vu que j'utilise quasi que les traces dès que je veux check un truc, j'avais complètement zappé que j'avais aucun log 😅
Oui je connais, après on verra le reste de l'intégration.
(Ou pas vu que rien qu'affirmer "aws utilise etcd pour eks" ça m'a valu des accusations de diffamation donc passer un produit à la moulinette ca va encore faire pleurer dans les chaumières 🤣)
On va attendre la sortie de la private beta et aller disséquer tout ça alors 😅
Il existe pas aux dernières nouvelles, non ?
Temporal-like stuff or just basic in-background synchronous flows + idempotency / retries from start in case of failures.
And for payment systems it's actually OK to do all checks sequentially, the acceptable latency (even for cards payments) is quite large and it's really the kind of system that you want to be really simple to reason about 😄
Most of event driven architectures could imo be replaced by a good workflow engine that would as well be more reliable and remove a lot of accidental complexity 😅
Après + de 10 ans à bosser sur des systèmes distribués/archis microservices (et tous les problèmes associés), je sais pas quoi penser du futur des agents AI et de leurs interactions (via des protocoles type a2a/mcp et agent as tool), le tout avec des frameworks half baked sur la partie state/rejeu.
Une fois que je suis dans l'incident c'est bon (et j'ai enormement d'expérience sur le sujet), l'astreinte c'est la petite voix "t'es sûr que ton téléphone est sur toi ? Il est bien en mode sonnerie/bien configuré? Si je sors j'aurai du réseau?" qui fatigue un peu.
Ça dépend vraiment des gens je pense, j'en connais qui vivent quasi "normalement" sans stress pendant leurs semaines alors que moi je me limitais pas mal.
Par contre en incident je suis très détendu et j'ai un énorme sans froid, meme quand c'est des méga problemes, comme quoi 😅
Oui il y a un fallback, et rater un appel ça arrive (ça m'est arrivé 2 fois, une fois car je passais l'aspirateur et pas entendu sonner, une fois car opsgenie a changé sa vcard et j'ai cru que c'était du spam).
Mais malgré ça jai toujours été en léger stress pendant mes astreinte.
Les méga coup de stress quand tu te rends compte soudainement en pleine activité (se doucher, passer la tondeuse, cuisiner...) que t'as pas ton téléphone sur toi et que tu sais plus où tu l'as posé 😅
Plus devoir a chaque fois regarder son calendrier d'astreinte avant d'organiser n'importe quoi.
Après 5 ans et demi d'astreinte 24/7 ~1 semaine par mois, il est temps de faire une pause 😅

Mine de rien, c'est usant à force, meme quand ca se passe bien (peu voir pas d'alertes, bonne compensation/heure de repos...).
On verra, le prix au token va aussi baisser avec des modèles de plus en plus puissants 😀
Le blog est volontairement minimaliste 😅
Nouvel article sur le blog: La GenAI pour les développeurs, un réel gain de productivité?

Je donne mon avis sur l'utilisation de l'AI pour le dev, des exemples d'utilisation et j'explique pourquoi ça ne remplacera PAS les développeurs.

mcorbin.fr/posts/2025-1...
La GenAI pour les développeurs, un réel gain de productivité?
mcorbin Tech Blog
mcorbin.fr
J'avais écrit cet article de blog qui montrait comment écrire un firewall avec xdp en C: mcorbin.fr/posts/2019-0...
Aya a l'air plus approchable (car sinon c'est vraiment incantatoire et la syntaxe est super complexe 😅).
Introduction to eBPF and XDP
mcorbin Tech Blog
mcorbin.fr
Ouais mais j'ai pas envie de rentrer dans le dur direct comme ça alors que la prio reste de ship 😅
Bref, drôle d'ecosysteme.
Mais par exemple, sqlalchemy + async, ton URL vers ́la base est pas bonne, ça bloque l'app quelle que soit la config des timeouts (et 0 error msg), wtf.
Timeout http fastapi ? Pas dispo nativement (pareil sur uvicorn) faut bricoler.
Et c'est comme ça pour tt dès qu'on sort des exemples du readme GH.