Intelligence Artificielle et Création

Que ce soit en image, en vidéo ou en musique, l'intelligence artificielle générative permet ( bien que cela ne soit pas sa seule application) des représentations  visuelles ou auditives et cela devient relativement commun. Elles inondent nos espaces et ces "créations" ne sont pas toujours perçues comme des oeuvres à proprement parler... Seule l'idée de la conception, de l'esprit se réalisant à "travers" les mains serait le passage obligé vers une concrétisation de l'objet ou d'une oeuvre naissant par ce biais.

Sans vouloir remonter à la genèse et l'accès à l'humanité , la main est le symbole universel de la création.
Alors qu'en est il  des réalisations faites " sans les mains", où l'IA serait un ersatz imitateur, spoliant les créateurs de leur travail , de l'esprit prenant corps sous leurs doigts.

Bien que je ne cherche pas à justifier mon utilisation de L'IA, après plusieurs discussions ici en commentaires ou avec d'autres utilisateurs sur des sites dédiés, j'avais dis que je fournirai des explications sur ma méthode de travail. 

Pour beaucoup, les illustrations faites par IA sont la résultante d'un prompt.
 Le prompt par définition est une requête écrite , un ensemble de mots destiné à une IA pour traduire une demande , une volonté ayant un but défini. Comme toute demande , celle ci doit être compréhensible et plus elle sera précise , plus le résultat est censé répondre à la demande. 
Mais arrivons nous vraiment à exprimer une vision personnelle en quelques mots?
Non. La main traduit directement nos pensées, nos émotions sur une toile. 
Mais l'exprimer... C'est une autre histoire. 
Alors il faut ajouter , encore et encore, des détails, des couleurs, une ambiance. Cela pourrait être sans fin.
Certains parlent de l'Art du prompt, pour plier l'IA à nos désirs. Mais une IA ne peut vraiment comprendre ce que l'on ressent. Il faut la reprendre , la corriger , réécrire le prompt jusqu'à satisfaction. 
Pour ma part je suis rarement satisfait du résultat final mais "le mieux étant l'ennemi du bien", je me retrouve souvent avec des travaux inachevés.
L'Art du prompt. Je ne nie pas qu'il faut de l'experience, maitriser ce langage mais le mot art du prompt est exagéré.
Comme la désignation du mot artiste pour les utilisateurs des IA génératives d'images ( en général les plateformes IA vous désignent comme artiste). 
Dans ces discussions  et échanges que j'ai sur plusieurs sites , je suis en désaccord avec cette appellation car je nous vois plus comme des illustrateurs que des artistes. Certes je ne nie pas qu'il existe un Art  Numérique et je croise certains qui ont vraiment une démarche artistique et d'autres encore qui sont vraiment des artistes mais souvent ils le sont bien avant d'avoir utiliser l' IA ( dessinateur, peintre , photographe...) et le font comme d'un outil annexe, en complément de leurs travaux.

Du prompt vers l'image ( text to image)
( je met la correspondance en anglais car les modèles d'IA étant souvent en anglais vous rencontrerez souvent cette option dans cette langue. N.B: De ce fait , j'utilise souvent un traducteur pour transformer mes prompts en anglais car pour l'instant, bien que le français soit accepté, le résultat est souvent meilleur, mais je pense qu'à l'avenir, on pourra sans problème rester dans la langue de Molière- et cela dépend du modèle utilisé)

Il semble assez simple de décrire une image qui se formerait dans notre esprit. Un sujet, un complément d'objet (direct - indirect) et un complément de lieu sont une bonne base. Le résultat peut être satisfaisant si l'exigence s'arrête là. Mais généralement, la difficulté apparait quand nous voulons que l'environnement , l'arrière plan ( le background) ou la multiplication des détails périphériques est important pour l'illustration. Et s' il y a un souhait d'animer cet environnement et qu'il y ait une cohésion, la déception est au rendez vous. Il faut alors compléter la description , faire des essais, sans être sûr d'arriver à nos fins avec cette impression désagréable que l'IA ne comprend rien.


Prenons par exemple une image simple d'un petit garçon grimpant à un arbre pour cueillir des pommes.
Prompt :  Représentation détaillée et complexe d'un petit garçon européen grimpant à un arbre pour cueillir des pommes.

L'image est classique et répond néanmoins à la demande

 Pour renforcer la qualité de l'image , ajoutons des détails sur la résolution, d'autres sur le style de maîtres de la peinture, etc...
Prompt : Œuvre  primée, peinture numérique 16K. Représentation détaillée et complexe d'un petit garçon européen grimpant à un arbre pour cueillir des pommes.
Œuvre de Rembrandt, El Greco, Vermeer, Grünewald, Bellini, primée, peinture numérique 16K.
Capture magistrale du chaos et du drame saisissants de la scène. Composition magnifique et cinématographique faisant de cette œuvre un véritable chef-d'œuvre, très en vogue sur ArtStation. Peinture numérique d'une qualité exceptionnelle, extrêmement détaillée et précise. Pose complexe, clarté et haute résolution.

Avant de présenter les résultats , il faut ajouter qu'il y a de nombreuses IA et que celles ci possèdent des modèles différents. Cela permet une variabilité. On voit que L'IA ne respecte pas systèmatiquement le sujet et bien que demandant un petit garçon, nous pouvons avoir comme sujet un homme ou une femme.
Vous remarquerez que L'IA a parfois généré un arrière plan. S'il ne vous convient pas , il faut  inclure dans le prompt ce paramètre. 
Affiner et retravailler le prompt mais aussi choisir le bon modèle d'IA.
Trop de détails peuvent nuire au résultat. Cependant les modèles d'IA s'améliorant régulièrement, la simplicité est un bon choix pour débuter sur une illustration, qui après coup peut être retravaillée avec la technique de l'image vers l'image. 

 Image vers image ( image to image)
Cette technique permet de générer une image à partir d'une autre image. L'interêt est de garder un thème , des couleurs, un sujet qui vont servir de base. Cette base peut-être soit proche du but recherché ou totalement différent. Dans l'exemple qui suit, j'ai choisi une image abstraite mais inspiratrice que j'avais générée auparavant et qui trainait dans mes archives. 


J'y voyais un navire qui voguait sur les nuages.
Plutôt que de générer une image avec uniquement un prompt demandant un bateau-nuage, j'ai demandé de la faire à partir de cette image. Certes il reste un prompt mais léger du type "transforme cette image en bateau voguant sur les nuages". 
Le processus est évolutif. J'importe l'image dans un logiciel DAO (dessin assisté par ordinateur) et je vais la retravailler en redessinant dessus, effacer des parties ou rajouter d'autres détails sans passer par l'IA. Cette partie devient plus du dessin numérique et rentre dans un cadre créatif hors IA. J'utilise des filtres graphiques pour jouer sur les couleurs et faire évoluer l'image. Le résultat, s'il n'est pas satisfaisant, je vais de nouveau retraiter l'évolution par l'IA puis de nouveau retravailler dessus.


Après avoir agrandi l'image, rajouter un chateau céleste, des constellations ici et là, je peaufine les derniers détails en utilisant gomme , pinceau, recadrage et autres outils pour la finition. Je passe beaucoup plus de temps hors IA. Cela peut se faire en dizaines d'heures comme cela peut durer des jours voire des mois.


Des mois?
Mais alors quel interêt d'utiliser une IA alors qu'elle peut générer une image en quelques secondes!
Parce que même si c'est une aide à la création, elle n'en reste pas moins un outil et si vous voulez créer une image qui est vraiment le fruit de votre imagination, il faudra toujours  reprendre "la main" même si vous créez un prompt d'une page. 

Je ne doute pas qu'un jour on puisse faire de l'imagerie conversationnelle mais comme tout dialogue, ce qui est au fond de vous même, il est très difficile de le visualiser dans la tête d'autrui. On arrive à se faire comprendre mais il y a cette partie indescriptible que votre interlocuteur ne saisira pas, humain ou non. Ce qui fait notre unicité, notre signature.
L'émotion prévaut sur l'esthétisme.
Même si vous êtes le meilleur des orateurs ( un grand maître en prompt ) le "verbe" ne suffit pas à traduire vos sentiments, votre sensibilité. Le prompt seul ne peut être le reflet de vos pensées. Vous serez amené à poursuivre encore et encore à "retoucher" vos résultats si vous voulez vraiment  exprimer une vision. 
Certes, l'IA peut "visualiser" des images époustouflantes et les derniers modèles sont incroyables. Et ils le seront encore plus à l'avenir. Mais la partie intîme que vous n'aurez pas exprimé sera remplacé par un esthétisme usuel voire générique.
On peut vouloir simplement "faire" de belles images, j'en conviens. Mais la question demeure sur le sujet de la partie créative.
Pour finir, bien que cet article n'est qu'une introduction, je finirai par une création ( on sait désormais où je me place ) qui m'a pris près de trois mois.
Le temps passé avec l'IA est relativement insignifiant vis à vis du temps en DAO , mais n'aurait pas été possible sans celle-ci. Cela reste un formidable outil.

Je ne veux pas non plus retirer aux utilisateurs de l'IA la capacité et la faculté de création s'il ne font pas de DAO. Certains sont de véritables créateurs et leur images sont le fruit d'un long travail, de recherche, d'explorer les dialogues promptés, en jouant sur les textures, les effets, etc... Ce n'est pas pour rien que les logiciels de DAO intègrent une IA désormais et les IA vont aussi  "muter" avec des outils de dessins. Je ne sais si on parlera de DAIA ( Dessin Assisté par Intelligence Artificielle ou tout autre acronyme) mais les artistes numériques seront à l'avenir de plus en plus mis en avant.

Donc des mois disais-je.
Si cela n'avait pas été une "demande", je ne suis pas sûr que j'aurai été jusqu'au bout. De nuit blanches en nuit blanches... et très epuisant mais très enrichissant ( aucune transaction financière cependant). J'ai eu une telle motivation que je me suis livré à cette quasi "mono-tâche".
Le thème était de réaliser une illustration commémorant Jules Verne. Le 120e anniversaire de la mort de l'écrivain.
Comme il y aurait l'édition d'une carte postale et d'un poster, quand on s'engage on se doit d'aller à terme du projet.
J'avais déjà réalisé de tels projets mais Jules Verne est si inspirant que je me suis plongé 20000 lieux sous les mers.
Je ne pourrais détaillé tout le processus. C'est une histoire de créations d'images , de retouches , de mixages et montages , de filtres et de calques , d'écriture et réécriture, de collages et d'éffacements... 
Un creuset tentant  d'associer l'idée du voyage si cher aux personnages de Jules Verne.
Réunir une partie des classiques avec de multiples allusions à ses oeuvres tout en incluant des références Amienoises. ( Verne fut Amienois plus de trente ans )
Plus de 4000  dessins arrangés , modifiés , ajustés... Un travail assez fou.
Une tentative de représentation en image du travail .

Pour cette finalisation. Je vois encore les défauts , ce que je pourrais arranger ou modifier, mais...


Je vous laisse y chercher les références si vous êtes un lecteur Vernien




0 comments:

Enregistrer un commentaire