Login
You're viewing the mstdn.social public feed.
  • Jul 1, 2026, 9:43 AM

    J'en vois certains trouver en les LLMs "opensource" une solution. Mais ça n'en est pas une:
    - les données d'entraînement viennent d'où ? Sûrement quand même volées.
    - l'entraînement a coûté beaucoup d'énergie.
    - la faire fonctionner va coûter beaucoup d'énergie.
    - la qualité des données en sortie sera toujours douteuse (+risques juridiques, sécurité, etc.)

    ça ne résout ni le pillage des créateurs, ni l'empreinte écologique monstrueuse, ni la qualité des données d'entraînement, ni les biais...

    💬 17🔄 120⭐ 100

Replies

  • 💬 2🔄 0⭐ 0
  • Jul 2, 2026, 9:55 AM

    @aeris @sebsauvage Très d'accord :) Je dis souvent aux "libristes" qu'on pourrait gérer une prison avec des logiciels libres ;)

    💬 0🔄 0⭐ 0
  • 💬 0🔄 0⭐ 0
  • Jul 1, 2026, 9:52 AM

    @sebsauvage Mais ça résout une partie des problèmes autour de la privacy, tout de même ! (je suis d'accord avec le reste de tes points, sauf peut-être le dernier. Certains modèles ne demandent pas beaucoup d'énergie pour l'inférence, quand on la fait en local par exemple)

    💬 1🔄 0⭐ 1
  • Jul 1, 2026, 10:22 AM

    @almet @sebsauvage

    Certes ! Mais ca légitime le vol pour le riche !

    On regarde cela de façon égoïste !

    Par peur de se faire voler son job, on l'utilise. Mais pour ma part à contrecœur !

    Je ne légitime pas ce racket en bande organisé ! Et les effets sur la société en général.

    Déjà que l'on n'est pas né pour travailler, mais on nous force à avoir un travail, mais maintenant, plus personne n'aura de travail...

    En tant que Senior Devops, je suis sans emploi depuis 3 mois, peu d'offres…

    💬 1🔄 0⭐ 2
  • Jul 1, 2026, 10:37 AM

    @jesuislibre Mince, je suis désolé. Je suis d'accord avec toi, ça craint, et je ne pense pas qu'il faille ignorer les problèmes.

    Beaucoup de gens donnent accès à des données perso, etc, ce qui alimente les géants du capitalisme de surveillance.

    Ce que je dis c'est que les LLM en local permettent de se prémunir de cette captation de données.
    Et en même temps, il faut essayer de faire comprendre que c'est pas une bonne idée d'utiliser ça à tire-larigot.

    💬 1🔄 0⭐ 1
  • 💬 0🔄 0⭐ 1
  • Hachikoneodiablow@mamot.fr
    Jul 1, 2026, 9:53 AM

    @sebsauvage Et les études préliminaires semble indiquer que ca rend débile (le terme poli c'est cognitive offloading -> cognitive debt)

    À noter que la plus grosse étude sur le sujet n'a toujours pas été peer reviewed 1 ans après donc à prendre avec des pincettes.

    💬 0🔄 0⭐ 3
  • 💬 0🔄 0⭐ 1
  • 💬 2🔄 0⭐ 0
  • 💬 1🔄 1⭐ 8
  • 💬 0🔄 0⭐ 5
  • Jul 1, 2026, 10:12 AM

    @kyrios @sebsauvage C'est pourtant simple !

    Faire respecter la loi !!

    Les riches peuvent voler, les pauvres peuvent aller en prison !

    Comme je le dis souvent, l'IA n'est pas viable actuellement, elle est sortie trop tôt !! Nous n'avons pas la technologie et les moyens financiers pour la maintenir

    💬 0🔄 0⭐ 2
  • Jul 1, 2026, 10:12 AM

    @sebsauvage je dirais que le seul bénéfice, c'est de ronger ceux des grosses boites d'IA mais c'est sur que le fond est le même

    💬 0🔄 0⭐ 3
  • Jul 1, 2026, 10:29 AM

    @sebsauvage
    Oui et non. Oui, tout ce que tu dis est vrai. Le souci, c'est qu'une fois qu'il est là, il est là. Alors la question est de savoir ce qu'on en fait avant que d'autres ne le fassent avec des ambitions fort discutables.
    Et il y a les « petits LLM », avec des possibilités plus restreintes et qui peuvent s'insérer dans des usages raisonnés.
    C'est un peu comme pour l'environnement: choisir entre préservation et conservation: à quel moment préserver et à quel moment « faire avec ».

    💬 3🔄 0⭐ 1
  • Jul 1, 2026, 10:46 AM
    @Framatophe@framapiaf.org @sebsauvage@framapiaf.org
    "Le souci, c'est qu'une fois qu'il est là, il est là."
    non.
    on pourrait dire ca avec beaucoup de choses : le colonialisme, l'esclavage, le fascisme et le réchauffement climatique.

    c'est comme dire "il n'y a pas d'autre alternative", si on a le choix.

    Pour beaucoup d'entre nous le problème que pose l'ia est d'ordre moral. (et avec la crise climatique, c'est aussi bientot un problème de survie).

    mais bon #dontLookUp, on pourra pas dire qu'on a pas été prévenu.

    Chacun fait comme il veut, pendant qu'il le peut encore (et vu le prix de la ram, ca va pas etre long avant que de moins en moins de personne ne puissent se le permettre)...
    💬 1🔄 4⭐ 0
  • 💬 0🔄 0⭐ 1
  • Jul 1, 2026, 11:52 AM

    @leontolog
    Oui. On peut aussi attendre la fin de l'abondance énergétique.
    Sauf qu'entre aujourd'hui et ce moment-là, les discours moraux, aussi éclairés qu'il soient, ne changeront rien à la profondeur de modification des usages numériques et le changement économique qui sont imposés par les LLM. Pour sauver les meubles il va falloir faire autre chose que de simplement dire « c'est pas bien » (même si je suis d'accord)
    @oldsysops @sebsauvage

    💬 4🔄 0⭐ 0
  • 💬 0🔄 0⭐ 2
  • Jul 1, 2026, 12:12 PM

    @Framatophe Entièrement d'accord mais quoi ?
    On a d'un coté un dirigeant fou qui appuie à fond sul'champignon des LLMs (et pas que), et de l'autre une poignée d'imbéciles qui veulent leur modèle, souverain, libre, peu importe.
    Les boycotter ? Perso je n'y crois pas. Mettre le feu à leurs datacenter ? Outre qu'il va falloir être nombreux et partout, on va encore se faire traiter d' "estrême-gochiss qui comprennent rien au progrès" se faire taper dessus et puis les assurances payeront et ça continuera.
    Je sais perso pas. Comme tout le monde je suis aux aguets, prêt à sauter dans le premier train qui prend la bonne direction
    @oldsysops @sebsauvage

    💬 0🔄 0⭐ 1
  • Jul 1, 2026, 2:10 PM
    @Framatophe@framapiaf.org @leontolog@piaille.fr @sebsauvage@framapiaf.org
    "la profondeur de modification des usages numériques et le changement économique qui sont imposés par les LLM."
    je ne crois pas que l'ia "disrupte" le paysage numérique. je ne dis pas que ca marche pas, ca fonctionne, ca accélère mais ca a ses limites...on voit deja les malfaçons, les retours arrieres de ceux qui sont aller trop loin et on viré tout le monde.

    et j'attends "l'enshitification", le retour sur investissements des personnes qui ont beaucoup investi dans l'ia et les datacenters qui vont vouloir leur argent et leur bénéfices car pour le moment c'est un gouffre sans fond, un pari a x milliards de dollars.

    bref, je n'utilise pas, je minimise mon exposition, je "boycott" et j'attends la fin (de l'ia ou du monde... je ne sais pas ce qui va arrivé en premier)
    💬 0🔄 0⭐ 0
  • Jul 1, 2026, 2:14 PM
    @Framatophe@framapiaf.org @leontolog@piaille.fr @sebsauvage@framapiaf.org
    "la profondeur de modification des usages numériques et le changement économique qui sont imposés par les LLM."
    je ne crois pas que l'ia "disrupte" le paysage numérique. je ne dis pas que ca marche pas, ca fonctionne, ca accélère mais ca a ses limites...on voit deja les malfaçons, les retours arrieres de ceux qui sont aller trop loin et on viré tout le monde.

    et j'attends "l'enshitification", le retour sur investissements des personnes qui ont beaucoup investi dans l'ia et les datacenters qui vont vouloir leur argent et leur bénéfices car pour le moment c'est un gouffre sans fond, un pari a x milliards de dollars.

    bref, je n'utilise pas, je minimise mon exposition, je "boycott" et j'attends la fin (de l'ia ou du monde... je ne sais pas ce qui va arrivé en premier)
    💬 0🔄 0⭐ 0
  • Jul 1, 2026, 10:55 AM

    @Framatophe L'aspect ineluctable des LLMs fait partie du discours marketing de ces boîtes. Tout comme avant lui le Metaverse et les NFT.

    💬 2🔄 2⭐ 4
  • Jul 1, 2026, 11:42 AM

    @sebsauvage
    Non, je n'ai pas parlé de l'inéluctabilité qui nous est rabâchée. Je pose un constat : qu'on le veuille ou non des LLM sont là. J'ai montré combien laisser les choses se faire nous mène vers du techno fascisme. Fermer les yeux, jouer les sainte Nitouche ou répéter des discours moralisant ne nous aidera pas. La question est : que faire ?

    💬 2🔄 0⭐ 0
  • Jul 1, 2026, 11:47 AM

    @sebsauvage
    Je donne un exemple : en Alsace l'entreprise Liebherr a carrément modifié une chaîne et fait de gros investissements pour construire des moteurs thermiques pour les data center. La logique est depuis longtemps enclenchée, au point qu'elle modifie concrètement les chaînes de production. Si à titre individuel on n'utilise pas les LLM, cela ne change pas grand-chose en réalité.

    💬 0🔄 1⭐ 0
  • Jul 1, 2026, 12:44 PM

    @Framatophe Le "déjà là" est un des arguments de la croyance dans l'inéluctable : doi.org/10.64628/AAK.gykec93ad

    Il impose l'idée qu'il faudrait "faire avec", au moins dans une certaine mesure.

    Or, pour ce qui est "déjà là" nous devrions pouvoir débattre de bien d'autres options : faire sans, faire contre, faire malgré, faire autrement, ...

    Nous devrions comprendre pourquoi c'est "là" et pouvoir décider d'en maintenir ou non les conditions de possibilité.

    💬 0🔄 1⭐ 0
  • Jul 1, 2026, 11:46 AM

    @sebsauvage @Framatophe Je n'aurais pas choisi cette comparaison. Dans mon entourage pro ou pas pro, je n'ai jamais eu personne à prendre au sérieux NFT ou metaverse.

    L'IA générative pour beaucoup c'est déjà ancré dans leur quotidien. L'adoption de l'IA générative n'a rien à voir. On est sur un problème d'une toute autre ampleur.

    💬 0🔄 0⭐ 0
  • 💬 0🔄 0⭐ 0
  • Jul 1, 2026, 11:15 AM

    @sebsauvage ni le travail des petites mains sous payées pour accomplir des tâches simple afin de créer les données d'entraînement avec les conséquences psychologiques...

    💬 1🔄 0⭐ 0
  • 💬 0🔄 0⭐ 0
  • Jul 1, 2026, 11:21 AM

    @sebsauvage Ça dépend de l'objectif. Je suis d'accord qu'essayer de répliquer les énormes modèles propriétaires "mais en libre" causera les mêmes problèmes.

    Mais je suis curieux de voir ce que l'on obtiendrait si on inversait la logique. Au lieu du modèle généraliste le plus grand possible entraîné sur le plus de données possible, élaborer le plus petit modèle spécialisé capable de faire un truc utile. Un exemple : un petit modèle entraîné sur toute la documentation logicielle libre (GFDL, info & man pages, docs de langages de programmation, etc.) + juste assez de texte générique (libre bien sûr, p. ex. Wikipedia) pour être capable de conversation simple. Est-ce que ça donnerait un truc qui peut faire de l'inférence en local pour m'aider à composer des commandes ou programmer, sans halluciner des infos inexistantes ? ou en hallucinant beaucoup moins souvent que les modèles généralistes, ce qui suffirait déjà à être plus utile qu'eux. S'il était possible de converser avec de la documentation de qualité sans être pollué par tout le reste (de qualité douteuse) trouvé sur le web, ça ajouterait une modalité très utile en plus des moyens existants de consulter de la documentation (accès par index ou table des matières, recherche full-text, etc.).

    Pour ce type de modèle spécialisé, pas besoin de piller (docs libres), et moins besoin d'énergie (petit modèle). Ça pourrait nous ramener à un rapport favorable entre bénéfices et externalités négatives.

    💬 1🔄 0⭐ 1
  • Jul 1, 2026, 11:23 AM

    @Guillawme
    Les LLMs (que les spécialistes appellent "étroites") pourraient rendre des services sans la consommation énergétique monstreuse des LLM généralistes.
    Entraînées sur un ensemble données plus restreint et maîtrisé, ça pourrait donner des résultats plus intéressants.
    Mais entraîner une LLM reste une opération lourde, et tout le monde n'a ni forcément le matériel ni les compétences pour créer un bon jeu de données.

    💬 1🔄 0⭐ 0
  • Jul 1, 2026, 12:06 PM

    @sebsauvage Bien d'accord. Mais dans le cas de la documentation libre, on a déjà de très bons corpus de données. Donc c'est encore une fois la logique opposée comparée aux LLMs généralistes/énormes : plutôt que de tout aspirer et essayer de "nettoyer", partir de zéro et n'inclure que des bonnes données, et pas plus que ce dont on a besoin. Et ce ne serait pas pour remplacer mais pour compléter la documentation déjà existante (en somme, comme une interface différente pour la lire).

    On pourrait pousser la logique à l'extrême : un mini-language model pour complémenter chaque documentation technique, au lieu d'un plus grand modèle qui serait entraîné sur un corpus de plusieurs documentations (mais qui serait déjà bien plus petit que les modèles généralistes).

    Franchement, un "mini-LM Unix" entraîné sur toutes les pages man & info, qui me donnerait la commande qui va bien à partir d'une description en langage naturel (sans halluciner trop), et qui tournerait en local sans trop faire transpirer l'ordi, je serais ravi de m'en servir. C'est très certainement possible à produire, et ça arrivera sûrement quand big tech commencera à demander le vrai prix pour accéder à ses modèles.

    💬 1🔄 0⭐ 0
  • Jul 1, 2026, 8:54 PM

    @Guillawme
    Même là je ne vois pas l'intérêt d'un modèle de langage. Je préfère dénicher la réponse grâce à un bon moteur de recherche (un vrai, pas un moteur de réponses) sur un forum ou un blog technique. Et pouvoir enrichir et partager à mon tour la solution, plutôt que de renvoyer chacun à l'usage individuel de son LM personnel. Mais je suis sans doute un vieux con...
    @sebsauvage

    💬 0🔄 0⭐ 0
  • Jul 1, 2026, 11:25 AM

    @sebsauvage Ça parle aussi d’« open weights ». Comme si on disait que Windows ou Photoshop était « open executable » ou « open instructions ». 🙄

    💬 1🔄 0⭐ 1
  • Jul 1, 2026, 11:30 AM

    @aruban35mm
    oui... comme si les poids d'une LLMs étaient aussi facilement inspectables qu'un code source C++. C'est un véritable foutage de gueule, cette notion d'«open weights».

    💬 2🔄 1⭐ 1
  • 💬 0🔄 1⭐ 1
  • 💬 0🔄 1⭐ 0
  • Jul 1, 2026, 11:26 AM

    @sebsauvage complètement ok
    la réflexion autour des licences libres lancé par RMStallman à été une grande aide aux techno-critiques et à l'anticapitalisme mais s'est diluée dans le mouvement 'open',a perdu sons sens éminemment politique depuis 2000
    toujours la 'Technique' masque ses exactions et ses profiteurs, revenir à une pensée de la seule fonctionnalité est comme accepter les fétiches des pouvoirs aliénants et destructeurs.
    toujours des mauvaises réponses à des mauvaises questions
    :anar:

    💬 1🔄 0⭐ 0
  • 💬 1🔄 0⭐ 1
  • Jul 1, 2026, 12:02 PM

    @ppp @sebsauvage
    ou une approche Dada

    une licence totalement fermée, empêchant quiconque d'utiliser le code pour préserver de son usage, qui ne s'aurait être que finalement néfaste.
    une éthique nihiliste :)

    "la Licence Cieux"

    qui de fait dit que cette création/invention pour le bien de l'humanité ne doit jamais être utilisée ...
    ou la licence des dieux !

    genre la bombe nucléaire, le gaz moutarde, le pidgin ...

    💬 0🔄 1⭐ 2
  • Jul 1, 2026, 12:07 PM

    @sebsauvage sans les données utilisées pour l'entraînement, aka. les sources, c'est pas open source, c'est freeware (at best)

    💬 1🔄 0⭐ 2
  • 💬 0🔄 0⭐ 0
  • Jul 1, 2026, 12:33 PM

    @sebsauvage question additionnelle que je ne vois jamais discutée, c'est la soutenabilité dans le temps de l'entraînement de ces modèles open weight.

    Contrairement à l'open source, l'entraînement ne peut pas être le fait d'un individu, et si déjà dans l'open source dans cette configuration y'a pas assez de sous, oa question c'est comment ça va se passer quand les modèles open weight ne seront plus subventionnés pour leur entraînement.

    Du coup pour moi c'est au mieux un pis aller

    💬 0🔄 0⭐ 0
  • 💬 0🔄 0⭐ 0
  • Jul 1, 2026, 1:29 PM

    @sebsauvage

    Notes vite fait :

    * La liberté, dans le monde du numérique, inclue la possibilité d’étudier et de modifier => Tout modèle qui ne fournit pas le code, les poids et la bdd d’entrainement est privatif.
    * Il serait tout à fait possible de créer des bdd coopératives sur le modèle de wikipédia ou osm.
    * Rien n’oblige à créer de modèles généralistes, qui feront forcément moins bien que des modèles spécialisés à quantité d’énergie équivalente.

    💬 0🔄 0⭐ 0
  • Jul 1, 2026, 4:43 PM

    @sebsauvage C'est pour ça que les mails d'Infomaniak pour pousser leur IA "souveraine" et "respectueuse" me chagrine profondément de leur part...

    💬 1🔄 0⭐ 0
  • 💬 0🔄 0⭐ 0
  • 💬 0🔄 0⭐ 0