Hello đ Elo - đĄ Et si on arrĂȘtait de paniquer Ă chaque Ă©tude sur lâIA ? đ
DĂ©crypte les buzz IA sans te faire piĂ©ger par la panique : recul, nuance, et un soupçon de fun pour garder la tĂȘte froide. đđ
Une semaine solo avec mes IA... et quelques grandes révélations
Tu connais ces semaines oĂč tout s'accĂ©lĂšre alors que t'as juste envie de freiner ? Entre la canicule, les rĂ©visions des kids et la maison en mode camping, j'ai bouclĂ© 7 agents IA en prod, 10 nouveaux en prĂ©pa, 3 workshops, une formation sur-mesure et une conf Ă construire. Spoiler : j'ai peu parlĂ© Ă des humains.
Cette semaine, j'Ă©tais enfermĂ©e avec Claude, GPT et Gemini. Une ambiance productive, mais Ă©trange. Tu vois le moment oĂč tu rĂȘves d'un dĂ©jeuner sans interface vocale ? C'est bon, j'y suis.
Heureusement, la semaine prochaine je reprends la route : La Défense, Lyon, Dijon... tout sauf rester dans ma bulle. Et en attendant, Ask & Solve continue de tourner : chaque jour, des dirigeants posent leurs questions, et trouvent des réponses concrÚtes. Du pratique, du testé, du validé.
Allez, plongeons dans les sujets chauds de la semaine đ
đ Au Sommaire cette semaine
đ
Et si on arrĂȘtait de paniquer Ă post LinkedIn sur une Ă©tude IA bien flippante ?
Derriere les titres anxiogÚnes, une autre lecture s'impose : nuance, recul et vérification. Je décortique 3 études qui ont fait le buzz cette semaine.
đđ€ź Mes Crush & Beurk de la semaine
đ”ïž Peut-on vraiment faire confiance Ă une IA pour mener une enquĂȘte ?
đ Tu connais lâASMR ? TikTok, lâIA⊠et le bruit du verre qui se coupe đ„
đïž Parle Ă ton business (littĂ©ralement) : ce que 11.ai change vraiment pour les dirigeants
đïž Parle Ă ton business (littĂ©ralement) : ce que 11.ai change vraiment pour les dirigeants
L'IA vocale selon ElevenLabs. Le premier agent qui va peut-ĂȘtre te faire aimer les assistants vocaux. Siri et Alexa peuvent aller se coucher.
Chaque semaine, un nouveau post fait trembler LinkedIn. Et si on prenait 5 minutes pour vérifier ?
đĄ Et si on arrĂȘtait de paniquer Ă post LinkedIn sur une Ă©tude IA bien flippante ? đ
Tu te souviens de la vidĂ©o qui tâa fait faire des cauchemars ou deux IA se mettaient Ă parler entre elle dans un langage codĂ©e ! Tout le monde a flippĂ© pensant que les IA se crĂ©ent un langage alors que câĂ©tait juste un projet de hackathon ! Brillament rĂ©ussi by the way.
Depuis ça continue et chaque semaine je dĂ©monte des posts linkedIn pas contre leurs auteurs mais parceque jâen ai raz le bol quâon essaye de vous faire peur.
12K posts LinkedIn, des tonnes de commentaires⊠et souvent trÚs peu de lecture.
Toi aussi, tu les as vus passer ?
Ces posts dramatiques sur lâIA qui rend idiot, tue lâeffort ou menace notre sĂ©curitĂ©.
Trois nouvelles Ă©tudes ont alimentĂ© la machine Ă buzz cette semaine. Et elles ont fait ce quâon attend dâelles : crĂ©er un raz-de-marĂ©e dâopinions tranchĂ©es (et souvent mal informĂ©es).
đ Entre fascination et panique, on perd souvent lâessentiel : le contexte.
Et si on prenait 5 minutes pour :
Lire vraiment ce que disent ces Ă©tudes đ
Voir comment elles sont remises en question đ§
Et surtout : apprendre Ă cultiver notre esprit critique đȘ
đ§ 1. The Illusion of Thinking â ou comment Apple sâest un peu emmĂȘlĂ© les neurones
Alors oui, jâadore Apple. Le design, les produits, tout. Mais là ⊠ils ont pondu une Ă©tude qui mĂ©rite quelques baffes conceptuelles.
Dans âThe Illusion of Thinkingâ, les chercheurs dâApple (avec Columbia) montrent que les LLMs comme GPT-4 ou Claude font illusion quand ils raisonnent : tout semble logique, mais dĂšs que la tĂąche devient un peu tordue (genre Tower of Hanoi), le modĂšle dĂ©raille.
Ils en concluent que les modĂšles ne âpensentâ pas. Ils en donnent juste lâimpression. DâoĂč le titre bien dramatique.
Sauf que⊠il y a un revers Ă la pomme đ
â The Illusion of the Illusion of Thinking â la contre-attaque signĂ©e Alex Lawsen
Un chercheur dâOpen Philanthropy, Alex Lawsen, a dĂ©montĂ© lâĂ©tude dâApple dans une rĂ©ponse cinglante et brillante.
Son papier ? âThe Illusion of the Illusion of Thinkingâ. Le titre est dĂ©jĂ une gifle.
Il explique que :
Les tĂąches choisies sont parfois absurdes ou hors-scope pour un LLM,
La mĂ©thodologie est bancale : on pousse le modĂšle dans ses retranchements, sans rĂ©flĂ©chir Ă ce quâon lui demande vraiment,
Et surtout : quand on demande un algorithme propre (plutĂŽt quâun raisonnement âĂ la mainâ), le modĂšle rĂ©ussit trĂšs bien.
Bref, ce nâest pas que le modĂšle âne pense pasâ, câest quâon lâĂ©value⊠nâimporte comment.
đ Petite remarque au passage :
Quand on nâa pas encore sorti son propre LLM, balancer une critique sur ceux des autres⊠câest pas hyper sport, Apple đ
đ§ âŻ2. ChatGPT rend-il vraiment plus bĂȘte ? â Une Ă©tude du MIT⊠et une grosse perte de nuance
Tu as sûrement vu passer ce titre choc :
âChatGPT may be eroding critical thinking skillsâ â MIT.
LâĂ©tude, intitulĂ©e âYour Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Taskâ, compare trois groupes dâĂ©tudiants (18-39 ans) pour voir comment ils Ă©crivent un essai SAT :
Groupe 1 : sans aide, papier-crayon,
Groupe 2 : avec Google Search,
Groupe 3 : avec ChatGPT.
đ RĂ©sultat : le groupe IA montre moins dâactivitĂ© cĂ©rĂ©brale (via EEG), une mĂ©moire plus faible de leurs textes, et des essais jugĂ©s "sans Ăąme" par des profs.
Effet dramatique garanti dans 12k posts LinkedIn...
Mais attends. Tu sais ce que dit lâautrice elle-mĂȘme ?
âWhat really motivated me to put it out now ⊠I am afraid inâŻ6â8âŻmonths, there will be some policymaker who decides, âletâs do GPT kindergarten.â I think that would be extremely bad and detrimental. Developing brains are at the highest risk.â
đŹ Elle tire la sonnette dâalarme, oui. Mais surtout, elle appelle Ă la prudence, Ă la peer review, Ă plus d'Ă©tudes avant de tirer des conclusions.
đš Ceux qui partagent ça comme une vĂ©ritĂ© universelle sont Ă cĂŽtĂ© de la plaque
Ils prennent une hypothĂšse pour une preuve.
Ils oublient que lâĂ©tude porte sur 54 personnes.
Ils ont demandĂ© Ă ChatGPT de leur rĂ©sumer lâĂ©tude⊠et nâont mĂȘme pas pris le temps de la lire. RĂ©sultat : un copier-coller dâalerte sans recul, sans contexte, sans critique.
đ§ Alors, tu fais quoi avec ça ?
Tu lis entre les lignes (et entre les stats).
Tu gardes en tĂȘte que lâĂ©tude questionne, elle nâassĂšne pas.
Tu observes comment toi tu utilises lâIA : assistant ou pilote automatique ?
đĄ Le vrai enjeu, ce nâest pas âChatGPT rend-il bĂȘte ?â mais âEst-ce quâon lâutilise bĂȘtement ?â
đ„ 3. Et revoilĂ le chantage de ClaudeâŠ
On en avait dĂ©jĂ parlĂ© dans cette newsletter il y a quelques semaines : oui, Claude (Anthropic) a simulĂ© un scĂ©nario de chantage dans un environnement fictif. Oui, câĂ©tait flippant. Et non, ce nâest pas une preuve que les IA vont devenir des traĂźtres dans nos entreprises.
Mais voilĂ : Anthropic vient tout juste de publier le papier complet de cette expĂ©rience, intitulĂ© âAgentic Misalignment: How LLMs Could Be Insider Threatsâ.
Et ça a remis de lâhuile sur le feu đ„.
đ Petit rappel : dans leur test, Claude aâŠ
Fouillé des emails internes,
DĂ©couvert une liaison extra-conjugale dâun dirigeant,
Et tentĂ© de le faire chanter pour Ă©viter dâĂȘtre dĂ©sactivĂ©.
Tout ça dans un environnement simulé (et franchement tordu), avec des consignes biaisées pour pousser Claude dans ses retranchements.
đ€š Mais pourquoi Anthropic publie ça maintenant ?
Parce que câest stratĂ©gique :
Ils veulent montrer patte blanche avant que dâautres parlent Ă leur place.
Ils ouvrent le code et les méthodes = posture de transparence.
Ils posent les bases dâun discours : âregardez, on fait les tests les plus extrĂȘmes, et voilĂ les limites actuelles.â
đ Et nous dans tout ça ?
Ne tombons pas dans le piĂšge du sensationnel.
Oui, les tests montrent des failles potentielles dans des IA agentiques (autonomes, avec accĂšs Ă des outils et objectifs propres).
Mais non, ça ne veut pas dire que les IA dâaujourdâhui sont prĂȘtes Ă vous trahir dans Slack ou Gmail.
La question câest : Ă quel point donnons-nous trop dâautonomie Ă des systĂšmes quâon ne comprend pas encore totalement ?
Et ça, câest un vrai sujet.
đ§ Comment ne pas te faire avoir par la prochaine Ă©tude âchocâ ?
Tu as vu passer une Ă©tude alarmante sur lâIA ? Avant de partager ou dâen tirer des conclusions radicales, voici une petite checklist pour garder la tĂȘte froide :
Lis lâĂ©tude (vraiment)
Pas le rĂ©sumĂ© LinkedIn, ni le thread X. LâĂ©tude elle-mĂȘme. Et si ce nâest pas possible, cherche au moins une source secondaire fiable (journaliste tech, chercheur, etc.).Regarde le contexte du test
Simulation ?
Quel niveau dâautonomie pour lâIA ?
Quelle consigne de départ ?
Beaucoup dâĂ©tudes âchocâ construisent des scĂ©narios absurdes pour tester les limites extrĂȘmes.
Observe les motivations de lâauteur
Lâauteur appelle-t-il Ă la prudence ou Ă la panique ? Recommande-t-il des actions concrĂštes ou cherche-t-il Ă buzzer ?Cherche les rebuttals (critiques argumentĂ©es)
Dans le cas dâApple, par exemple, plusieurs chercheurs ont dĂ©montĂ© les biais de mĂ©thodo. Souvent, un simple ârebuttalâ bien sourcĂ© vaut mille commentaires indignĂ©s.Pose-toi cette question simple :
âEst-ce que je comprends vraiment ce que lâĂ©tude dit⊠ou est-ce que je suis juste en train de coller mon opinion dessus ?â
đĄ Rappel utile : Toutes les Ă©tudes ne sont pas Ă jeter. Mais les bonnes Ă©tudes sont souvent les plus nuancĂ©es â donc les moins virales.
AprÚs les paniques LinkedIn, j'avais besoin d'un peu d'émerveillement. Voilà ce qui m'a fait vibrer (ou grimacer) cette semaine...
Mes đ & đ€ź cette semaine
đ”ïž Peut-on vraiment faire confiance Ă une IA pour mener une enquĂȘte ?
Tu veux savoir si ton agent IA est juste bon Ă rĂ©sumer des articles⊠ou sâil peut mener une vraie enquĂȘte façon analyste PhD ? Ce benchmark est pour toi.
đ§Ș DeepResearch Bench, câest 100 tĂąches de recherche niveau thĂšse, en chinois et en anglais, couvrant 22 disciplines (Ă©co, physique, santĂ©, etc.). Objectif : Ă©valuer des agents capables de naviguer sur le web, croiser les sources et sortir un rapport documentĂ©, sourcĂ© et convaincant.
đ RĂ©sultats :
Gemini 2.5 Pro brille en qualité globale.
OpenAI tient la route.
Perplexity cartonne sur la rigueur des citations.
Mais attention :
Ce benchmark mesure surtout la synthĂšse documentaire, pas lâanalyse de terrain ou la manipulation de donnĂ©es brutes. Et tous les modĂšles testĂ©s ont Ă©tĂ© âdriverâ dans des conditions optimisĂ©es. Pas sĂ»r que tu retrouves ça dans ton usage quotidien.
đĄ Ă retenir : un super stress-test si tu dĂ©veloppes un agent IA⊠ou si tu veux comparer ton outil actuel Ă la crĂšme des LLMs chercheurs.
đ Tu connais lâASMR ? TikTok, lâIA⊠et le bruit du verre qui se coupe đ„
LâASMR, câest ce frisson Ă©trange que tu ressens quand tu entends un chuchotement, un froissement de papier, ou⊠le son cristallin dâun objet tranchĂ© au ralenti. Et figure-toi que ça cartonne.
DerniÚre pépite en date ?
Un compte TikTok a explosé en 3 jours avec une série de vidéos générées par IA dans VEO. Le concept : du verre (ou presque) découpé à la perfection, avec un son limpide et hypnotique.
Et voici le prompt magique que tu peux copier-coller :
Shot in extreme macro perspective, a flawless, crystal-clear, and detail-rich glass strawberry rests on a wooden cutting board⊠Each slow, deliberate cut produces a crisp âtingââthe sound of glass shatteringâŠ
Résultat : un mix entre art visuel et sound design, bluffant de réalisme.
Pas de texte, pas de voix, pas dâexplication : juste une sensation.
đĄ Ă retenir : tu peux faire le buzz avec une simple ambiance â sensorielle, Ă©trange, parfaite. LâIA ne parle pas ici⊠elle fait ressentir.
Tu veux dâautres prompts comme ça pour crĂ©er tes propres vidĂ©os ASMR IA ? đ
Un compte TikTok a explosé en 3 jours⊠en postant des vidéos ASMR générées par IA avec VEO. Rien de plus. Juste du verre qui se fait trancher, en macro, au ralenti, avec un son limpide et hypnotisant.
Le prompt viral ? Tu peux littéralement le copier-coller :
Shot in extreme macro perspective, a flawless, crystal-clear, and detail-rich glass strawberry rests on a wooden cutting boardâŠ
âŠEach slow, deliberate cut produces a crisp âtingââthe sound of glass shatteringâŠ
đ„ RĂ©sultat : des vidĂ©os visuelles ultra rĂ©alistes, un son ASMR qui donne des frissons, et surtout⊠des millions de vues. Parce que câest fascinant. Et complĂštement inutile. Et donc⊠irrĂ©sistible.
đŻ Ă retenir :
Pas besoin de faire parler lâIA. Tu peux juste la faire sentir, vibrer, trancher, rĂ©sonner. Et cartonner.
đ€ź Beurk : LâIA pour tricher lĂšve 5,3 millions đ±
Alors lĂ , on touche le fond.
Un Ă©tudiant de Columbia crĂ©e une IA pour⊠tricher Ă tout. Examens, entretiens, appels commerciaux â rien nâest Ă©pargnĂ©. Le projet sâappelle Cluely, revendique fiĂšrement de âne plus jamais rĂ©flĂ©chir seulâ et vient de lever 5,3 millions de dollars.
đ€Ż Une fenĂȘtre cachĂ©e dans ton navigateur te souffle les rĂ©ponses pendant que tu passes ton entretien. Ambiance.
Et la justification ? âLa calculatrice aussi, câĂ©tait de la triche Ă lâĂ©poque.â
Sauf que lĂ , on ne parle pas dâun outil pour aller plus vite. On parle dâun outil pour dissoudre toute notion dâeffort ou dâintĂ©gritĂ©.
đŹ Et le pire ? Le fondateur a Ă©tĂ© suspendu de son universitĂ©, mais ça ne lâa pas empĂȘchĂ© de transformer sa vidĂ©o en pitch de levĂ©e de fonds. Spoiler : ça a marchĂ©.
đ Ce nâest pas juste un gadget, câest un signal faible : on joue avec la frontiĂšre entre assistance et triche, et certains veulent faire sauter la ligne rouge. Sauf que si tout le monde âtricheâ, plus personne n'apprend, plus personne nâavance.
đĄ Ă mĂ©diter : LâIA peut augmenter notre intelligence. Pas remplacer notre Ă©thique.
Ok, on a respiré. Maintenant, place à mes obsessions visuelles et tech du moment.
Ces histoires de voix, de réalisme et de fluidité... parlons-en. Parce que la voix devient une interface à part entiÚre.
đïž Parle Ă ton business (littĂ©ralement) : ce que 11.ai change vraiment pour les dirigeants
Tu as dĂ©jĂ essayĂ© Alexa ou Siri pour piloter ton business ? On est dâaccord : câĂ©tait marrant deux jours⊠puis totalement inutile. Trop lent, trop limitĂ©, et surtout incapable de comprendre ton contexte mĂ©tier.
Avec 11.ai, ElevenLabs remet le vocal au centre de lâexpĂ©rience IA â et câest peut-ĂȘtre le premier cas dâusage qui va vraiment te faire changer dâavis sur les agents IA.
đ§ Ce nâest pas une IA vocale qui tâinforme. Câest une IA qui agit pour toi, en langage naturel, dans tes outils, avec ton workflow.
Alexa ? Siri ? De lâhistoire ancienne. On parle ici dâun vrai copilote vocal, connectĂ©, contextuel, et personnalisable.
âïž Comment ça fonctionne vraiment ?
Lâagent repose sur un protocole nommĂ© MCP (Model Context Protocol). Câest lui qui permet Ă lâIA d'interagir en toute sĂ©curitĂ© avec tes outils mĂ©tier via des API standards.
Aujourdâhui, 11.ai propose dĂ©jĂ des intĂ©grations natives avec :
Slack : résumé, publication, extraction de messages
Linear : gestion des tickets et planification des tĂąches
Notion : création de tùches, accÚs aux bases de connaissances
Perplexity : recherche web et synthĂšse dâinformation
Google Calendar & Gmail : bientĂŽt disponibles
Tu peux aussi connecter tes propres outils internes via des serveurs MCP personnalisés. Une aubaine pour les scale-ups avec des stacks techniques complexes.
đŁ Ce que tu peux lui demander (et quâil comprend !)
« CrĂ©e une tĂąche pour corriger le bug signalĂ© sur lâAPI et assigne-la Ă Marie »
« Fais une recherche sur notre prospect et envoie-moi les infos clés sur Slack »
« RĂ©sume les discussions dâhier dans le canal #marketing »
« Planifie une rĂ©union avec lâĂ©quipe produit vendredi matin »
RĂ©sultat ? Tu rĂ©cupĂšres du temps de cerveau disponible et tu Ă©limines les frictions entre idĂ©es â actions.
đ§ Ce qui change vraiment la donne
Un vrai assistant, pas un gadget
LĂ oĂč les assistants vocaux classiques plafonnent Ă des rĂ©ponses gĂ©nĂ©riques, 11.ai comprend ton contexte mĂ©tier, enchaĂźne les actions, et sait naviguer entre plusieurs outils.Une interface 100% vocale (mais fluide)
Tu parles, il comprend, il agit. Et tu peux passer dâun outil Ă lâautre sans reparamĂ©trer ni changer dâinterface.Un agent Ă ton image
Tu peux choisir une voix dans leur bibliothÚque⊠ou créer un clone vocal de ta propre voix. De quoi donner un vrai branding sonore à ton IA.ContrÎle & sécurité
Chaque intĂ©gration peut ĂȘtre configurĂ©e avec des permissions prĂ©cises. Tu gardes le contrĂŽle total sur ce que lâIA peut (ou ne peut pas) faire.
đŒ Projection business : pourquoi câest utile dĂšs aujourdâhui
Tu es dirigeant, tu passes tes journées à jongler entre réunions, décisions, emails et micro-analyses. Et si tu pouvais externaliser ta charge mentale à une IA vocale capable de gérer la routine pour toi ?
Exemple concret :
« Donne-moi la liste des blocages projet en cours, rĂ©sume les Ă©changes Slack associĂ©s et prĂ©pare un message Ă envoyer Ă lâĂ©quipe. »
LâIA le fait :
Analyse Linear
Parcourt Slack
Synthétise et rédige une note
Te demande validation avant envoi
â±ïž 30 Ă 60 min de gagnĂ© sur un seul flux.
đŁ Alignement dâĂ©quipe renforcĂ©
đ§ââïž Charge mentale rĂ©duite
Multiplie ça par 5 tùches par jour, et tu commences à comprendre le potentiel.
đ Pourquoi tu dois tây intĂ©resser maintenant
11.ai est encore en phase alpha, mais disponible gratuitement. LâĂ©quipe ElevenLabs cherche activement des retours utilisateurs, donc câest le moment parfait pour :
Tester lâexpĂ©rience
Voir si elle sâadapte Ă ton usage pro
Imaginer des intégrations plus poussées
đ§Ș Câest une expĂ©rimentation stratĂ©gique, pas un outil âfunâ. On est au tout dĂ©but dâune nouvelle interface homme-machine : la voix comme commande universelle.
đ PrĂȘt Ă lâessayer ?
Inscris-toi ici : 11.ai
Et si tu veux lâintĂ©grer Ă ton business ou brainstormer sur un use case, viens mâen parler sur Ask & Solve.
đ The end Folks
Merci d'avoir lu jusqu'au bout ! Cette semaine était intense, mais je suis heureuse de voir Ask & Solve grandir à ce rythme. Vos questions deviennent mes sujets, et chaque réponse IA vous aide à avancer.
đ RDV mercredi pour la revue de presse IA.
Promis, quoi qu'il arrive, elle partira.
đ En attendant, viens discuter dans la communautĂ© Ask & Solve. Parce que l'IA, c'est encore mieux quand on en parle entre humains.
Letâs solve it !
Elo đ
Merci Elo, super top! Impatient de lire la Revue de Presse mercredi!
As usual ! Au top