Google heeft meer uitgelegd over de Imagen Editor. Dat is de tool waarmee je op basis van teksten kunstmatige intelligentie aan het werk zet om afbeeldingen te bewerken. Het gaat daarbij dus niet om een volledig nieuw plaatje, zoals in bijvoorbeeld Dall-E, maar het gaat om het bewerken van een bestaande afbeelding.
Imagen Editor
Zo kun je bijvoorbeeld een foto van je hond nemen en hem truitje aandoen, of een hoofdtelefoon opzetten. Google schrijft: Tekstgestuurde beeldbewerking kan een transformerende invloed hebben op de ondersteuning van creatieve toepassingen. Een belangrijke uitdaging is om bewerkingen te genereren die trouw zijn aan ingevoerde tekstaanwijzingen en tegelijkertijd consistent zijn met de ingevoerde afbeeldingen. We presenteren Imagen Editor, een cascadeverspreidingsmodel gebouwd door Imagen te verfijnen op tekstgestuurde beeldbewerking.”
Je kunt een foto uploaden, een regio aanwijzen die je aangepast wil hebben en vervolgens zet je er een tekst bij om de AI aanwijzingen te geven. Bij de hond hieronder wordt bijvoorbeeld gevraagd om een ‘rood ruimtepak met een witte ster’ en een ‘raket gemaakt van karton’, plus nog een ‘blauwe gamehoofdtelefoon’. Het ziet er indrukwekkend uit, maar Google zegt tegelijkertijd dat het Imagen Editor niet in het openbaar wil uitbrengen.
Foto’s bewerken
Dat zegt het uit zorgen die bestaan over hoe verantwoord het gebruik van AI is. Het ziet wel hoe zo’n bewerktool kan zorgen voor het maken van afbeeldingen die jij wil zonder dat het veel tijd kost. Het lijkt ook wat op de Magic Editor die Google tijdens I/O 2023 introduceerde voor Google Foto’s. Dat is de tool waarmee je bijvoorbeeld een foto die precies afsnijdt op ballonnen zodanig kunt aanpassen dat Google er alsnog hele ballonnen van maakt.
Hoewel Google op dit moment nog niet van plan is om Imagen voor het grote publiek uit te brengen, is het dat uiteindelijk wel van plan met Imagen naar Google Presentaties te brengen. Dit wordt zelfs als getest in de Labs van Google. Op die manier kun je eigen, nieuwe achtergronden maken.
Wat vind jij, moet Google Imagen Editor nog niet uitbrengen voor het grote publiek? Laat het nu achter in de reacties.
Reacties
Inloggen of registreren
om een reactie achter te laten
Ik kan nog een interessantere toepassing bedenken die misschien nog veel uitdagender is: ik heb foto’s genomen voor smart camera van Crowdsource en wilde dat vandaag opnieuw doen. Stel dat ik een foto nam waarin op de achtergrond gordijnen te zien zijn die storend zijn voor wat ik wel in beeld wilde brengen (een kamerplant) dan zou ik het fantastisch vinden om (nadat mama me vertelde dat de achtergrond storend is) die achtergrond weg te halen via imagen editor. Ik wilde vandaag ook een lindenboom fotografferen, maar smart camera en lookout zagen vanalles, behalve die boom. Wat zou het fantastisch zijn als ik gewoon door tekst of m’n stem kon aangeven wat ik in focus wil hebben. Op die manier kan ik ook als blinde helpen om beeldherkenningsmodellen etc. te trainen, aangezien ik er niet in slaag om ziende mensen te overtuigen dit te doen.