Animint

Anime & manga

Mon profil • Aide • Plan du site • Chercher :

Vous êtes ici : Accueil > Le blog > Tribulations avec les IA génératives gratuites pour coder : Gemini est votre ami... ou pas

Le blog

“Animint traite des dessins animés japonais et du manga. Outre ce blog, le site comporte plusieurs milliers de pages de texte illustré.”

Tribulations avec les IA génératives gratuites pour coder : Gemini est votre ami... ou pas

Par Pazu d'Animint le jeudi 08 janvier 2026 20:40 :: Webmastering

2026

L'intelligence artificielle générative est aujourd'hui au coeuur des discussions, souvent accompagnée de polémiques sur le droit d'auteur pour les images ou de dérives éthiques, à l'image de Grok et de ses capacités de détournement. Pourtant, au-delà du buzz, c'est l'aspect pratique qui m'intéresse : l'aide réelle que ces outils peuvent apporter au codage, notamment en Python et PHP. Après quelques premiers essais fin 2024 , je suis revenu sur le sujet un an plus tard pour un test plus approfondi. Entre déceptions techniques et réussites concrètes, voici mon bilan.

Les premières désillusions : d'Ollama à ChatGPT

Mon expérience a débuté avec une tentative d'installation locale. J'utilisais Ollama sur un mini PC équipé d'un processeur N100 et de 16 Go de RAM, mais dépourvu de carte graphique dédiée. À l'époque, le modèle choisi spécialisé dans le language Python était assez léger pour offrir une vitesse de réponse acceptable à l'écran. Cependant, la qualité du code laissait à désirer. Pour un script destiné à redimensionner des images JPG dans un dossier et régler leur compression à 100 %, l'IA m'a généré du code qui semblait répondre à mon besoin mais avec dedans une fonction "tout-en-un" censée gérer les deux tâches simultanément. Le problème est que cette fonction n'existait pas nativement dans Python ou dans une quelconque bibliothèque et l'IA n'a produit aucun code pour la définir : Le nom de la fonction fictive collait juste trop parfaitement à ma demande pour être réel et évidemment le script est sorti en erreur à la première exécution.

Par la suite, j'ai exploré d'autres outils dans mon univers professionnel, notamment un modèle qui s'appuyait sur une ancienne version de ChatGPT. Bien que cela donnait des idées, les capacités restaient limitées et les connaissances restaient floues.

Je me suis alors tourné vers la version gratuite de ChatGPT en ligne, bien plus à jour. J'avais toujours évité ce site car l'inscription exigeait un numéro de téléphone plutôt qu'un simple mail mais la politique a changé depuis. Les discussions avec l'IA se sont révélés pertinentes, notamment pour des recherches sur le web. Cela m'a d'ailleurs permis d'acheter des disques IronWolf neufs à un tarif compétitif auprès d'une entreprise britannique possédant un entrepôt relais au sein de l'Union Européenne. Malgré un transit UPS un peu chaotique dans ma région et des stocks fluctuants qui m'ont fait opter pour des disques de 8 To au lieu des 6 To prévus , la commande a été traitée en quelques jours.

Cependant, ChatGPT a montré ses limites sur d'autres sujets concrets. En lui demandant une configuration pour mon NAS "Do It Yourself", il a totalement ignoré l'aspect de la faible consommation électrique et il m'a proposé une configuration de PC classique, certes pas orientée pour le jeu, mais déjà très gourmande en énergie au repos rien qu'avec le processeur. De plus, la version gratuite perd l'historique de la discussion très rapidement et oublie d'appliquer certaines instructions pourtant fournies au commencement des échanges. Le conseil de l'IA elle-même est d'ailleurs de recommencer une discussion depuis zéro dès qu'elle commence à dérailler. Enfin, l'interface web devient souvent inutilisable à partir de 16h, sans doute à cause d'une trop grosse fréquentation depuis les États-Unis.

J'ai également testé brièvement Deep Seek, l'outil chinois, qui fait preuve d'une grande fluidité, bien que ses capacités soient restreintes par son absence de navigation web sans compter une certaine méfiance légitime sur le stockage des données en Chine.

L'entrée en scène de Gemini

C'est suite à la sortie du modèle 3.0 de Google Gemini et aux articles élogieux à son sujet que j'ai basculé mes tests sur cet auxiliaire. J'ai commencé avec le modèle gratuit, en veillant à activer explicitement la version 3.0. Mon objectif était de réaliser deux exercices pour Animint liés aux anniversaires.

Le premier essai a concerné les collages d'images pour produire les fresques de personnages joués par les seiyû.

Auparavant, ce processus était laborieux : je récupérais les images et je les redimensionnais avec un script, mais je devais calculer à la main les dimensions de la fresque avant de découper et disposer les miniatures manuellement sous Gimp. J'ai d'abord pensé fournir les images directement à Gemini pour qu'il fasse le collage, mais c'était trop long de les communiquer par paquets de dix, surtout quand les collages dépassaient les 100 images. De plus, la génération était interminable en mode gratuit.

La solution retenue fut de générer un script Python pour automatiser le tout : découper les images pour ne retenir que les bustes et les têtes des personnages, déterminer les dimensions du collage pour éviter les trous, placer ensuite les plus grandes images sur les bords et enfin ajouter un filigrane. Gemini a d'abord pollué la conception avec un script générique qui redimensionnait et posait les images de manière aléatoire avec du blanc entre elles. Pour coller avec ma volonté d'avoir les images formatées et disposées dans des grilles rectangulaires ou carrées, j'ai dû fournir l'algorithme détaillé et surveiller chaque version du script, car l'IA avait tendance à revenir à son code de référence en détruisant ce que j'avais validé, au moindre changement mineur.

Pour le recadrage des miniatures en centrant sur les têtes des personnages, elle a tenté d'utiliser des bibliothèques de reconnaissance faciale impossibles à installer car boguées, et inefficaces sur de si petites images. Finalement, je l'ai dirigée vers une méthode plus simple : Etant donné que les photos d'origine ressemblent à des photos d'identité, un recadrage automatique basé sur une coupe franche et un décalage vers le haut suffit à obtenir un résultat acceptable dans la quasi-totalité des cas. Aujourd'hui, mon script tourne et je ne traite manuellement que les rares images problématiques.

Montée en puissance

Mon second projet concernait la gestion des anniversaires pour les réseaux sociaux. Avant, je gérais cela manuellement avec des fichiers texte et des dossiers d'images, puis je programmais les publications via une interface maison avec quelques fonctions facilitatrices mais finalement limitées. Mes exigences pour les publications étaient précises : limiter le nombre de posts quotidiens sur l'API de l'ex-Twitter pour éviter le bannissement, espacer les envois d'au moins 10 minutes et les concentrer le matin tout en en gardant quelques-uns pour l'après-midi.

Je souhaitais mettre en place une base de données administrable via une interface web utilisant la structure CRUD (acronyme pour Create, Read, Update, Delete). Le projet piétinait car je voulais éviter tout devoir migrer vers un des frameworks complexes, même s'ils permettent de générer un modèle CRUD presque automatiquement. D'un autre côté, l'idée de devoir faire manuellement tout le modèle MVC (Modèle-Vue-Contrôleur) depuis zéro me décourageait.

J'ai utilisé l'IA pour me lancer. Sous Eclipse, j'ai ajouté un module générique permettant de brancher différentes IA, dont l'API des modèles Gemini. Pour le langage PHP, l'interface se limite à une discussion, alors qu'elle est sans doute plus élaborée pour du Java avec des fonctions d'autocomplétion. On peut toutefois surligner des portions de code pour les partager, ce qui évite les copier-coller. Il faut rester discipliné pour ne pas partager tout son code avec la firme de Mountain View au risque d'alimenter leurs modèles avec vos données.Après c'est pratique pour recommuniquer à l'IA le code qu'elle a généré, d'une session à l'autre.

En soignant mes instructions de départ avec un texte de 50 lignes, Gemini m'a généré un socle CRUD solide. Il a ensuite enrichi le code pour gérer les images et les paramètres de publication, en donnant vie à des objets tampons pertinents pour programmer les posts selon mes exigences.

Limites et aboutissement

Tout n'a pas été simple. L'usage de l'API est restreint en version gratuite et chaque partage de code consomme rapidement votre crédit quotidien donc j'ai fini par me rabattre sur l'interface web grand public en perdant les fonctionnalités d'intégration rapide avec Eclipse. D'autre part, Gemini possède un côté "esbroufe" comme les autres IA : il donne l'impression de pouvoir générer une application complète à partir d'un simple texte, mais il s'emmêle vite les pinceaux. Il m'est arrivé de le voir modifier mon code alors que je demandais seulement de rajouter des commentaires, ou d'écrire des classes totalement en contradiction avec les principes de base de la programmation objet.

Un exemple marquant a été la migration de mes données : J'ai demandé à Gemini d'analyser un fichier texte de 600 entrées et de faire la correspondance avec une liste de noms de fichiers images contenant les prénoms des personnages ou des noms de seiyû. L'IA a d'abord inventé des anniversaires absents du fichier à cause de ses croisseents de données avec sa base de connaissance, puis a prétendu ne pouvoir traiter les données que 10 par 10 pour ne pas saturer sa mémoire. J'ai dû suggérer d'écrire un script Python pour effectuer ce rapprochement répétitif, sachant que la structure des textes permettaient d'isoler facilement les noms. Le script a finalement réalisé 97 % du travail en un instant, et j'ai affiné les 3 % restants moi-même à la main.

En conclusion, Gemini m'a poussé à concrétiser cette rubrique d'administration des anniversaires qui est désormais opérationnelle mais attention, c'est un outil qui peut s'avérer trompeur. Un utilisateur ayant un profil uniquement fonctionnel, qui sait exprimer un besoin sans maîtriser la technique, risque de tourner en rond indéfiniement face aux erreurs de l'IA. Gemini est un excellent levier pour accélérer le développement d'un projet, à condition de garder les commandes techniques. Pour aboutir, il faut se comporter comme un développeur senior encadrant un junior : il faut savoir repérer les affabulations, distinguer ce que l'IA invente de toutes pièces par rapport à ce qui existe réellement dans les langages de programmation, et ne jamais copier-coller aveuglément.