Het grote AI art show- &amp; kletstopic

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

The-Source schreef op woensdag 14 mei 2025 @ 09:16:
[...]

En wat je dus eigenljik met de modelsheet zou moeten doen is deze per pose/expressie de plaatjes naar dezelfde resolutie moeten maken/upscalen.
En vanuit dat resultaat een lora trainen. En langer(tijd) trainen is niet altijd beter. Ik volg zelf op youtube Pixorama voor comfyui ideeen en workflows maar ook The- Art-Offical Trainer voor bijvoorbeeld meer technische aspecten. Voor Lora trainig zou je daarvan bijvoorbeeld HiDream Lora Training video kunnen bekijken hoe dat zit tussen tijdsduur van trainen dat langer niet altijd beter is.

Ik heb nu de "Simpele" workflow. Die is gratis. De "Advanced" kost geld. Dan moet je sponsor worden. Daar zit ook de nodige upscaling in...

Ik had dus nu alle poses in een plaatje staan. Dat blijkt zomaar veeeeeeeeeeeeeeeeeeeel sneller te gaan. Ik sta versteld.

Prompt executed in 1934.61 seconds

De hele workflow dus nu in 32 minuten $_/-\o_$

Omdat de seed op random staat zien de achtergronden er natuurlijjk totaal anders uit.

Wat me ook is opgevallen dat de upscaler/face fixer weer een andere sampler/scheduler gebruikt: dan kun je lijkt me toch geen identiek gezicht reproduceren.

Nou ja. Nog genoeg om te lezen en kijken.

Je ziet overigens dat de meeste tijd dus in stap 2 gaat zitten: Hier zit opgeteld al 1.224 seconden werk in. Dat is al 20 minuten van de in totaal 32 minuten.

Moet je nagaan als de rest van de plaatjes ook geupscaled en gefixed moeten worden. Dan snap ik wel dat je een 4090 nodig hebt om er nog wat van te maken.

Afbeeldingslocatie: https://tweakers.net/i/k0hclu1gX6rYeZYwLp3oma0tTY0=/800x/filters:strip_exif()/f/image/9XCdP5TlWmU8heQbp7KYtY8u.png?f=fotoalbum_large

De Poses kosten niet veel tijd. En met die laatste (meest rechtse) pose, gaan ook de emoties goed.

Afbeeldingslocatie: https://tweakers.net/i/iJP4dRadLdL5vgrU-wmbcHdf_Wk=/800x/filters:strip_exif()/f/image/ii1XFiYwnufgJoiLrm8m0NTY.png?f=fotoalbum_large

De emoties:

Afbeeldingslocatie: https://tweakers.net/i/cMbFHWv4mLX2MXNL3h8nRTU2tt8=/800x/filters:strip_exif()/f/image/46efEnGFH8FsS5mis2Ixnqj2.png?f=fotoalbum_large

Voornamelijjk dingen die tienden van seconden kosten, maar wederom wel met enorm veel instellingen.
Kan me voorstellen dat als je dat helemaal prompt gestuurd kan maken (en dus al die instellingen niet hoeft te weten), dat je dan een soort ChatGPT krijgt qua gemak en sturing.

woensdag 14 mei 2025 10:11

Acties:

woensdag 14 mei 2025 10:17

Bij je 3 save poses let wel op dat als je de pos gezien van achteren de handen verkeerd staan. Of dit in jouw geval invloed heeft kan je zelf het beste beoordelen

PS mijn langste video prompt van 20s duurde 'maar' 20852s maar dat kwam grotendeels omdat ik vergeten was de image input eerst te scalen naar betere resolutie

Taal fouten inbegrepen ;)

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

The-Source schreef op woensdag 14 mei 2025 @ 10:11:
Bij je 3 save poses let wel op dat als je de pos gezien van achteren de handen verkeerd staan. Of dit in jouw geval invloed heeft kan je zelf het beste beoordelen

Bij de gegenereerde plaatjes met achtergronden is voorlopig niks raars te zien. Ik zou ook niet weten hoe ik dat goed kan maken. Ik druk gewoon op de "run" knop en ga verder met werken...

PS mijn langste video prompt van 20s duurde 'maar' 20852s maar dat kwam grotendeels omdat ik vergeten was de image input eerst te scalen naar betere resolutie

Video is natuurlijk nog veel zwaarder dan dit. Maar dankzij die tijd die bij veel nodes staat kan ik nu wel zien waar de meeste tijd in gaat zitten op mijn 4060 Ti. Heel veel dingen gaan dus retesnel. Wie weet als ik een andere upscaler kies, dat de tijd korter kan. Het gaat me nu meer op te leren wat ik hiermee kan, dan dat het meteen een prijs moet opleveren.

Een foto van een nichtje omtoveren tot een stripfiguur, en dan deze in allerhande contexten kunnen plaatsen lijkt me best grappig.

woensdag 14 mei 2025 10:46

Acties:

woensdag 14 mei 2025 16:21

Admin Beeld & Geluid, Harde Waren

Yaksa schreef op dinsdag 13 mei 2025 @ 23:03:
[...]

Ik zie wederom veel ruis, knakworstenvingertjes en mensen die jaloers zijn op iets wat ze niet zien omdat het kistje verkeerd om 'vastgehouden' wordt.
Nee, ChatGPT? Ik begin er niet eens mee.

Prima, dat hoeft ook niet, maar dat weten we nu wel.

Het is verre van perfect en ieder zijn voorkeuren qua werkwijze, maar het is ook gewoon indrukwekkend hoe makkelijk ChatGPT afbeeldingen kan bewerken en/of genereren op basis van wat instructies. Daar hoeven we niet steeds zuur over te doen.

Look for the signal in your life, not the noise.

Canon R6 | RF 24-70 f/2.8 L | 50 f/1.8 STM | 430EX II
Sigma 85 f/1.4 Art | 100-400 Contemporary
Zeiss Distagon 21 f/2.8

Acties:

Verwijderd

Zo... Die workflows die in de recente posts langskomen maken voor mij wel duidelijk de beeldgeneratie zonder hulp van de grote spelers nog lang niet klaar is voor een willekeurige eindgebruiker.
Dan is het echt wel knap dat die grote spelers dat heel redelijk in een chatinterface verstoppen.

woensdag 14 mei 2025 16:40

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

Verwijderd schreef op woensdag 14 mei 2025 @ 16:21:
Zo... Die workflows die in de recente posts langskomen maken voor mij wel duidelijk de beeldgeneratie zonder hulp van de grote spelers nog lang niet klaar is voor een willekeurige eindgebruiker.
Dan is het echt wel knap dat die grote spelers dat heel redelijk in een chatinterface verstoppen.

ComfyUI is natuurlijk wel net diegene die ALLES via nodes doet. Er zijn anderen zoals EasyDiffusion die een hoop afschermt: tig keer eenvoudiger dan ComfyUI...

Er zijn duizenden nodes voor ComfyUI, dus voor experimenten een speeltuin.

Een gewone eindgebruiker zit hier niet op te wachten nee, die wil met een prompt resultaat krijgen.

De grote spelers bieden ook weinig tot geen keuze qua model, scheduler, sampler, kwaliteit en meer. Dus dat scheelt al een hele berg nodes in ComfyUI: eigenlijk hou je enkel de prompt en de save-image node over

HiDream E1 is nu wel een stap aan het zetten om prompt-gebaseerd het plaatje te kunnen wijzigen. Maar het model is er net, dus dat staat nog in de kinderschoenen.

Wie weet waar we over 1 jaar staan!

woensdag 14 mei 2025 17:11

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

Ik vermoed dat er heeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeel veel mensen nu met ChatGPT aan het spelen zijn om plaatjes ofzo te maken.

Zelfs voor een gewone conversatie type ik al te snel: de karakters lopen soms 5 sec achter op wat ik typ.

Ook het antwoord laat soms minuten op zich wachten. Ik geloof dat mensen iets te enthousiast worden van de mogelijkheden. Of zou de nieuw plaatjes generator al on-line zijn, of uitgerold worden waardoor alles zo ontzettend traag is?

Mijn lokale LLM's zijn nu factoren sneller met een respons dan ChatGPT. Dat is normaal andersom

woensdag 14 mei 2025 18:10

Acties:

woensdag 14 mei 2025 21:28

Generatieve AI

@Mars Warrior
ChatGPT heeft het op dit moment inderdaad wat zwaar met genereren. Ik heb alleen geen last over langzame karakters.

Tip: in de Library staan de afbeeldingen een stuk eerder al gereed. De chat loopt nu wat achter met het bijwerken. Scheelt nu minuten. Dit zal vast door de nieuwe beeldgenerator komen en hierdoor een run op ChatGPT.

Na het genereren van een afbeelding krijg je nu direct de optie voor Edit in beeld. ChatGPT bedenkt zelf toepasselijke bestandsnamen erbij. Handig bij het zoeken, al zijn ze altijd in het Engels.

Elves in Forrest with Mysterious Box
Edit van de laatste post.
Kun je deze foto nog wat verbeteren, kijk nog eens naar alles.
Zo is de blik van de ogen veranderd, de ruis is weg. Zonder prompts, de AI doet het zelf. Hopelijk binnenkort ook gelijk in 1 keer allemaal.
Afbeeldingslocatie: https://i.postimg.cc/PxZrd5Sg/edle3.jpg

Afbeeldingslocatie: https://i.postimg.cc/PxZrd5Sg/edle3.jpg

Een bestaande chat openen en ChatGPT gaat weer verder waar het was gebleven.

Een nieuwe dag. Er een andere elf bij geslopen die wel wat lijkt op Harry Styles. Hij kijkt heel blij naar de vrouwelijke elf. Er is iets veranderd, maar wat? De andere twee hebben er nog steeds zwaar de smoor in. Kun je de foto ook wat lichter en vriendelijker maken?

Elves Drama on Mossy Branch
Afbeeldingslocatie: https://i.postimg.cc/x8YFWRxb/Elves-and-Frog-on-Mossy-Branch.jpg

Afbeeldingslocatie: https://i.postimg.cc/x8YFWRxb/Elves-and-Frog-on-Mossy-Branch.jpg

[ Voor 15% gewijzigd door CR2032 op 14-05-2025 18:21 ]

Acties:

woensdag 14 mei 2025 21:55

Afbeeldingslocatie: https://tweakers.net/i/JJc34nWys1Dqy_0TIRhBtYr52N4=/fit-in/4000x4000/filters:no_upscale():strip_exif()/f/image/AA139KojwyGvC1W9xkW1HIGh.png?f=user_large

Vrij simpele prompt en daarna door upscaler. Prompt: "a gathering of beautiful woman elves, wearing highly detailed long dresses"
Soms krijg je wat meer close up en soms ook niet elven met relatief normale oren.
Maar ook met verschillende kleuren jurken en meer divers "publiek". Genoeg handen om mee de mist in te gaan en in het voorbeeld zijn ze wat aan de grote kant maar hey wie zegt dat nou dat elven dat niet hebben

Elves

Nog een paar generaties en vind het wel grappig dat de oren wel bij elke elf hetzelfde wordt gehouden maar duidelijk wel verschillende interpretaties

[ Voor 56% gewijzigd door The-Source op 14-05-2025 21:57 ]

Taal fouten inbegrepen ;)

Acties:

Felicia

Mars Warrior schreef op woensdag 14 mei 2025 @ 17:11:
Ik vermoed dat er heeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeel veel mensen nu met ChatGPT aan het spelen zijn om plaatjes ofzo te maken.

Zelfs voor een gewone conversatie type ik al te snel: de karakters lopen soms 5 sec achter op wat ik typ.

Ook het antwoord laat soms minuten op zich wachten. Ik geloof dat mensen iets te enthousiast worden van de mogelijkheden. Of zou de nieuw plaatjes generator al on-line zijn, of uitgerold worden waardoor alles zo ontzettend traag is?

Mijn lokale LLM's zijn nu factoren sneller met een respons dan ChatGPT. Dat is normaal andersom

Mjah, ik heb hier Gemma 3 12B nu draaien en die reageert ook best wel snel ja

38.50 tok/sec - 965 tokens - 0.32s to first token

Gemma 3 1B gaat echter een stuk sneller

150.24 tok/sec - 269 tokens - 0.03s to first token

Ik draag een rok, wat is jouw excuus?

woensdag 14 mei 2025 22:15

Acties:

woensdag 14 mei 2025 22:49

Move on up!

Afbeeldingslocatie: https://tweakers.net/i/E5IXt-iO1iK17jFAwMK63kNMmmg=/x800/filters:strip_exif()/f/image/IKW41T2Y9tDtNnJW2zZB0Lkd.png?f=fotoalbum_large

https://civitai.com/models/1572479/forgotten-dreams - Leuk checkpoint, eens een heel ander esthetiek.

quote: POS
masterpiece, best quality, high resolution, extremely detailed, intricate details,

35mm film grain, natural film lighting, low light shot, muted tones

(full body, centered frame), location, dimlit alleyway at dusk, abandoned, neglected alley

(blonde hair color, blue eyes), (european 30 years woman, realistic wet hair)(blue and silver based tuxedo)(one outstretched hand, palm faced downward in a pleading gesture, and fingers slightly spread, the hand is extended forward not to grasp but to stop someone from leaving, subtle tension in the wrist and fingers)

(Softly curved lips,parted with a reveal of her (upper teeth)+ (cupid's bow shape), create a naturally full and approachable mouth shape)(mouth closed:1.05)

(tears of joy, tears flowing)(wet hair because heavy rain)(crying in the rain, tears lost in rain)(wettened face)(expression of love, heartfelt)(straight stare at viewer:1.2)(eyes open:1.2)(hair rained very wet)(bokeh raindrops)(wet face from rain:1.3)(matrix code raindrops:1.4)

(very upset, really crying hard, sad expression in mouth)

quote: NEG
lowres, bad quality, worst quality, bad anatomy, sketch, jpeg artifacts, ugly, poorly drawn, blurry, watermark, bad hands, bad face, text, logo, game, mutation, disfigured, deformed, extra limbs, missing limbs, incorrect anatomy, unrealistic proportions, bad art, poorly rendered, amateurish, beginner, oversaturated, underexposed, distorted, simple background, out of frame, overcooked, nsfw, suggestive, monitors, cupping hands, praying hands, wings, cupid elements, (open mouth:1.2), hearts, heart figures, plastic, uncanny valley, CGI, 3D,

overly smooth, perfect detail, digital sharpness, AI clarity, plastic texture, clean surface, digital noise reduction, overprocessed

Er zit een poging bij om filmruis/isonoise te krijgen, bijzonder lastig.

prompting WIP - zit nog veel overbodig bij, maar het plaatje is gewoon een mooie hit & miss

Acties:

woensdag 14 mei 2025 22:52

SkyStreaker schreef op woensdag 14 mei 2025 @ 22:15:
[Afbeelding]

https://civitai.com/models/1572479/forgotten-dreams - Leuk checkpoint, eens een heel ander esthetiek.

[...]

[...]

Er zit een poging bij om filmruis/isonoise te krijgen, bijzonder lastig.

prompting WIP - zit nog veel overbodig bij, maar het plaatje is gewoon een mooie hit & miss

Ik ken de checkpoint niet maar negative plastic en kijkend naar resultaat. Is dit model richting graffiti of aquarel schilderij want de armen helemaal maar ook de rest ziet er zo onnatuurlijk uit.
Ik weet ik niet hoeveel tokens je checkpoint aan kan maar gezien de lijsten aan termen kan dat wellicht wel van invloed zijn

Taal fouten inbegrepen ;)

Acties:

Corrigan

@Mars Warrior Leuk om je uitgebreide ervaringen te delen met die giga workflow. YouTube is een perfecte bron om meer te leren over AI, ik volg zijn vlogs ook regelmatig. Het zou heel interessant zijn als je dit met een realistische foto zou proberen in plaats van een anime stijl.

Op deze manier ben ik nog meer onder de indruk geraakt van de uitvoering en kwaliteit van ChatGPT en Gemini. Je ziet dat alleen nog dat met heel veel moeite met zulke grote workflows nog maar een acceptabele afbeelding kan worden gemaakt. Alleen te langzaam en lang niet weggelegd voor iedereen door de hardware specs en technische kennis en zin.

Een ChatGPT en in iets minder mate Gemini doen dit en nog veel complexere dingen fluitend zelfs vanaf je smartphone. Die recente afbeeldingen van @CR2032 met die elfen in het bos hier zijn machtig indrukwekkend en de manier waarop helemaal.

ChatGPT en Gemini maken nu wel grote stappen. Ik ben zo benieuwd hoe de wereld er over een 1 jaar uitzient. Of een Stable Diffusion, Midjourney, Flux dan nog wel bestaan. Dat zou jammer zijn, alleen moeten dan nu veel harder aan de bak dan ooit. Ze worden nu links en rechts zo hard ingehaald door die grote spelers.

[ Voor 13% gewijzigd door Corrigan op 14-05-2025 23:02 ]

donderdag 15 mei 2025 05:02

Acties:

donderdag 15 mei 2025 12:05

Move on up!

The-Source schreef op woensdag 14 mei 2025 @ 22:49:
[...]

Ik ken de checkpoint niet maar negative plastic en kijkend naar resultaat. Is dit model richting graffiti of aquarel schilderij want de armen helemaal maar ook de rest ziet er zo onnatuurlijk uit.
Ik weet ik niet hoeveel tokens je checkpoint aan kan maar gezien de lijsten aan termen kan dat wellicht wel van invloed zijn

30 met cfg op 4 en Euler A, maar tegenwoordig voor consistentie en om niet vallen onder keuzestress gebruik dpm++ 2m met align your steps, wanneer mogelijk. Liever gooi ik nog eens de steps zover omhoog dat je op het kantelpunt zit en niks meer wordt toegevoegd aan de basis afbeelding.

Voor mij persoonlijk lijk ik met Flux het beste weg te komen met hybride prompting en bij negatief het komma onderbroken. Daar poets ik meestal eerst de dingen weg. Het probleem met Flux lijkt ook te zijn dat niemand bij de hele goede plaatjes de workflow deelt en/of de prompts.

Acties:

Generatieve AI
Kunstmatige intelligentie

The-Source schreef op woensdag 14 mei 2025 @ 21:28:
[Afbeelding]
Vrij simpele prompt en daarna door upscaler. Prompt: "a gathering of beautiful woman elves, wearing highly detailed long dresses"
Soms krijg je wat meer close up en soms ook niet elven met relatief normale oren.
Maar ook met verschillende kleuren jurken en meer divers "publiek". Genoeg handen om mee de mist in te gaan en in het voorbeeld zijn ze wat aan de grote kant maar hey wie zegt dat nou dat elven dat niet hebben

Elves
[Afbeelding] [Afbeelding] [Afbeelding]

Nog een paar generaties en vind het wel grappig dat de oren wel bij elke elf hetzelfde wordt gehouden maar duidelijk wel verschillende interpretaties

meervoud van woman is women (in je prompt)

donderdag 15 mei 2025 12:07

Acties:

donderdag 15 mei 2025 12:56

EverLast2002 schreef op donderdag 15 mei 2025 @ 12:05:
[...]

meervoud van woman is women (in je prompt)

In het goede Engels ja, in Amerikaans Engels is het weer anders

Taal fouten inbegrepen ;)

Acties:

Verwijderd

Ik weet niet of een algoritme er winst uit haalt, maar het is "elvish women" of " female elves".

donderdag 15 mei 2025 13:13

Acties:

Bad Brains

<(0.o)>

The-Source schreef op donderdag 15 mei 2025 @ 12:07:
[...]

In het goede Engels ja, in Amerikaans Engels is het weer anders

Omdat Californische Gen Z dames de correcte uitspraak niet uit hun kraag krijgen maakt het nog geen nieuwe taal.

Ook in de US is het woman en women.

First they take the words, then they take the meaning.

donderdag 15 mei 2025 15:02

Acties:

donderdag 15 mei 2025 16:17

Kunstmatige intelligentie
Generatieve AI

Extreem close-up portretje gemaakt met een oude prompt, je kunt letterlijk elk haartje tellen.

Afbeeldingslocatie: https://tweakers.net/i/oRflR5avD-uLA1VcDrmWR5ghNAs=/x800/filters:strip_icc():strip_exif()/f/image/RMtUEmquYjJmj1KAKj2KMxBW.jpg?f=fotoalbum_large

Prompt en generation data:
shock in the brown, by Sergey Bondarchuk, by Christian Dior, hdr, portrait, award winning, intricate details, realistic skin, extremely detailed, masterpiece, fill lighting, very attractive, glamorous, astonishing, perfect face, exceptional, eye-catching, very cute, irresitible, radiant, perfect, mesmeric, luscious, overwhelming, exquisit, charming
Steps: 20, Sampler: Euler, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 973323358, Size: 896x1152, Model hash: 2f5d1875de, Model: flux1-dev-Q6_K, Version: f2.0.1v1.10.1-previous-417-g8ff0dc6f, Module 1: t5xxl_fp16, Module 2: ae, Module 3: clip_l

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

Acties:

Corrigan

Yaksa schreef op donderdag 15 mei 2025 @ 15:02:
Extreem close-up portretje gemaakt met een oude prompt, je kunt letterlijk elk haartje tellen.

[Afbeelding]

Prompt en generation data:
shock in the brown, by Sergey Bondarchuk, by Christian Dior, hdr, portrait, award winning, intricate details, realistic skin, extremely detailed, masterpiece, fill lighting, very attractive, glamorous, astonishing, perfect face, exceptional, eye-catching, very cute, irresitible, radiant, perfect, mesmeric, luscious, overwhelming, exquisit, charming
Steps: 20, Sampler: Euler, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 973323358, Size: 896x1152, Model hash: 2f5d1875de, Model: flux1-dev-Q6_K, Version: f2.0.1v1.10.1-previous-417-g8ff0dc6f, Module 1: t5xxl_fp16, Module 2: ae, Module 3: clip_l

Wat wil je met deze post eigenlijk zeggen?

Een oude prompt gebruiken en ondanks de uitgebreidheid is het resutaat weer precies hetzelfde plastic fantastic typisch aan Flux. Dit is toch al 1001 keer hier voorbij gekomen en ook zo vaak door jou.
Of gaat het je alleen maar om het zoveel mogelijk afbeeldingen posten?

Serieuze vraag.

donderdag 15 mei 2025 16:20

Acties:

Generatieve AI
Kunstmatige intelligentie

Yaksa schreef op donderdag 15 mei 2025 @ 15:02:
Extreem close-up portretje gemaakt met een oude prompt, je kunt letterlijk elk haartje tellen.

[Afbeelding]

Prompt en generation data:
shock in the brown, by Sergey Bondarchuk, by Christian Dior, hdr, portrait, award winning, intricate details, realistic skin, extremely detailed, masterpiece, fill lighting, very attractive, glamorous, astonishing, perfect face, exceptional, eye-catching, very cute, irresitible, radiant, perfect, mesmeric, luscious, overwhelming, exquisit, charming
Steps: 20, Sampler: Euler, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 973323358, Size: 896x1152, Model hash: 2f5d1875de, Model: flux1-dev-Q6_K, Version: f2.0.1v1.10.1-previous-417-g8ff0dc6f, Module 1: t5xxl_fp16, Module 2: ae, Module 3: clip_l

gebruik jij een GGUF model en een "gewone" cliploader in 1 workflow?
ik gebruik hetzelfde Q6.gguf model als jij, maar met een gguf cliploader namenlijk t5-v1_1-xxl-encoder-Q6_K.gguf

donderdag 15 mei 2025 16:32

Acties:

donderdag 15 mei 2025 20:10

Kunstmatige intelligentie
Generatieve AI

EverLast2002 schreef op donderdag 15 mei 2025 @ 16:20:[...]
gebruik jij een GGUF model en een "gewone" cliploader in 1 workflow?
ik gebruik hetzelfde Q6.gguf model als jij, maar met een gguf cliploader namenlijk t5-v1_1-xxl-encoder-Q6_K.gguf

Ik heb geen workflow zoals in ComfyUI.
Ik gebruik Torch als front-end voor Stable Diffusion. Daar wordt Flux ingeladen plus een VAE en een text-encoder. Vervolgens schrijf je je prompt en kun je los.
Torch heeft een groot aantal instellingen die je nog kunt wijzigen, inclusief de bekende zoals CFG-scale, Sampling Method, resolutie, Hi-Res, Refiner, ControlNet en nog zo'n 40 andere. Je kunt ook LoRa's toevoegen als je dat wilt en nog veel meer (o.a. scripts maken). In principe kun je bijna net zoveel als in Comfy UI, het ligt er maar aan hoe diep je er in wil duiken (ik hou het meestal vrij simpel, dan heb ik ook meer controle).

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

Corrigan schreef op woensdag 14 mei 2025 @ 22:52:
@Mars Warrior Leuk om je uitgebreide ervaringen te delen met die giga workflow. YouTube is een perfecte bron om meer te leren over AI, ik volg zijn vlogs ook regelmatig. Het zou heel interessant zijn als je dit met een realistische foto zou proberen in plaats van een anime stijl.

Dat ga ik zeker nog een keer proberen. Met wat aanpassingen zit ik nu op 30 minuten run-tijd, en dat kan nog een stuk korter als ik wat dingen die ik niet gebruik nu (upscalen en face-fixen) naar lagere waardes zet: dan ben ik zo weer 15 minuten kwijt en staat mijn PC nog maar 15 minuten ofzo te stampen...

Op deze manier ben ik nog meer onder de indruk geraakt van de uitvoering en kwaliteit van ChatGPT en Gemini. Je ziet dat alleen nog dat met heel veel moeite met zulke grote workflows nog maar een acceptabele afbeelding kan worden gemaakt. Alleen te langzaam en lang niet weggelegd voor iedereen door de hardware specs en technische kennis en zin.

Een ChatGPT en in iets minder mate Gemini doen dit en nog veel complexere dingen fluitend zelfs vanaf je smartphone. Die recente afbeeldingen van @CR2032 met die elfen in het bos hier zijn machtig indrukwekkend en de manier waarop helemaal.

ChatGPT en Gemini maken nu wel grote stappen. Ik ben zo benieuwd hoe de wereld er over een 1 jaar uitzient. Of een Stable Diffusion, Midjourney, Flux dan nog wel bestaan. Dat zou jammer zijn, alleen moeten dan nu veel harder aan de bak dan ooit. Ze worden nu links en rechts zo hard ingehaald door die grote spelers.

Ik vermoed dat er heel wat de richting opgaat die HiDream E1 nu gaat: meer prompt gestuurd dingen kunnen aanpassen. Als - in ComfyUI - de achterliggende nodes er gewoon zijn, dan gaat het om het goed kunnen interpreteren van de prompt, en dan weten hoe je de bestaande afbeelding moet wijzigen.

De grote spelers die je noemt zullen ook wel per account/chat bijhouden wat ze gemaakt hebben. Stel dat je - net als ComfyUI - alles in een JSON bestand hebt opgeslagen. Dan kun je gewoon verder met wat je had met exact dezelfde uitkomst als je niks wijzigt.

En die grote spelers hebben natuurlijk hun eigen model, samplers, schedulers en nodes. Daar hoeft de gebruiker helemaal niks van te weten.

Kijk ik naar die enorme flow, dan is me nu opgevallen hoe simpel het is om wat emoties (hier voornamelijk mond en tilt/hoek van het hoofd) te wijzigen en weer opnieuw te laten (deel)renderen. Dat is en heel simpel, en rete-snel, zoniet bijna instant. Datzelfde kun je met de ogen doen en de wenkbrauwen: die laatste kun je heel simpel omhoog/omlaag laten bewegen.

Stel je voor dat je die getalletjes (want meer is het niet) via een prompt kan aanpassen, dan kom je al in de buurt van wat de grote spelers - die grootgeworden zijn door de promps en de interpretatie daarvan - doen.

Afbeeldingslocatie: https://tweakers.net/i/gy8mAh-kMJDBm79QIjuuDjkYESs=/800x/filters:strip_exif()/f/image/fm56rEujEladaW4dGUxzxOSS.png?f=fotoalbum_large

Het speciale Flux model (dat weer tig ander modellen combineert) wat in deze enorme flow zit kan dus ook poses herkennen, en diepte:

Afbeeldingslocatie: https://tweakers.net/i/RNEafFke7883APZeBaP88T5V0To=/800x/filters:strip_exif()/f/image/tP1FLTurZKeRGv4aNA0Ho2tu.png?f=fotoalbum_large

Allemaal dingen die je nodig hebt om via een prompt dingen te kunnen aanpassen in de trand van "Leg linkerarm over rechter been".

Of dit allemaal gaat leiden tot vooruitgang in de open-source modellen die je lokaal kan draaien? Ik denk het wel als ik zie wat er voor HiDream al uit is, en voor Flux al beschikbaar is.

Maar de mensen die hieraan werken zitten meestal niet bij een bedrijf dat miljarden omzet, dus het zal allemaal wat langzamer gaan.

Nu zit Huawei’s Noah’s Ark Lab achter HiDream I(nstruct) en HiDream E(mbedded), dus dat is al heel wat en de combinatie van de "I" en de "E" kan er voor zorgen dat de prompt en/of wijziging in het plaatje door HiDream I wordt afgehandeld, en door HiDream E wordt geverifieerd en bijgestuurd zodat het resultaat ook dicht tegen de prompt aan komt te zitten. Vandaar dat HiDream iha "Better Prompt Following" laat zien.

Dus wie weet hoever HiDream is eind 2025!

Overigens is DALL-E 3 nu ook meer een diffusion model, al is het wel hybride volgens ChatGPT zelf. Daarmee zou de performance ook beter moeten zijn dan de voorgangers. En wat HiDream dus met I/E wil doen, dat doet ChatGPT al!

donderdag 15 mei 2025 20:29

Acties:

Vishari Beduk

loves f/1.8 primes

Vraagje tussen door; heeft iemand hier al Stable Diffusion aan de praat gekregen op de RTX5090?
Ik zit vast op de foutmelding 'NVIDIA GeForce RTX 5090 with CUDA capability sm_120 is not compatible with the current PyTorch installation.'
Als je dan gaat zoeken dan zijn er heel veel hits maar geen oplossing.
Ik zal dit topic niet vervuilen met de vraag voor een oplossing. Wil alleen even weten of het uberhaupt mogelijk is of dat ik moet wachten tot er een PyTorch update komt.

Python 3.10.11 (tags/v3.10.11:7d4cc5a, Apr 5 2023, 00:38:17) [MSC v.1929 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> torch.cuda.is_available()
True
>>>

AI: claude / copilot / RTX 5060ti / RTX 5090

donderdag 15 mei 2025 20:35

Acties:

Wormaap

Vishari Beduk schreef op donderdag 15 mei 2025 @ 20:29:
Vraagje tussen door; heeft iemand hier al Stable Diffusion aan de praat gekregen op de RTX5090?
Ik zit vast op de foutmelding 'NVIDIA GeForce RTX 5090 with CUDA capability sm_120 is not compatible with the current PyTorch installation.'
Als je dan gaat zoeken dan zijn er heel veel hits maar geen oplossing.
Ik zal dit topic niet vervuilen met de vraag voor een oplossing. Wil alleen even weten of het uberhaupt mogelijk is of dat ik moet wachten tot er een PyTorch update komt.

Python 3.10.11 (tags/v3.10.11:7d4cc5a, Apr 5 2023, 00:38:17) [MSC v.1929 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> torch.cuda.is_available()
True
>>>

Dit had ik ook met mijn 5070Ti, en de oplossing was een nieuwere versie van PyTorch installeren. ComfyUI levert niet de nieuwste versie mee. Het is een paar weken geleden, maar volgens mij hielp deze thread

Ticking away, the moments that make up a dull day

donderdag 15 mei 2025 21:07

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

Uitgaande van deze dame

Afbeeldingslocatie: https://tweakers.net/i/usJlDYryEg1-VdN6hXM3BmTye_Y=/x800/filters:strip_exif()/f/image/m7T13X6EXyR7dMc7ANGOiuEs.png?f=fotoalbum_large

...en dezelfde instellingen als met het Pixar meisje (elk plaatje met achtergrond kost ruim 3 minuten, dus dingen proberen kost beetje veel tijd), de typische Flux eigenschappen en wat botox komen hier de volgende 4 plaatjes uit met de nieuwe reizende brunette

Ik besef met deze plaatjes pas waarom je pose en diepte moet kunnen destilleren: anders kan je op in ieder geval de 1ste, 3de en 4de plaat natuurlijk nooit de belichting/weerkaatsing/schaduw goed krijgen

Verder zit haar haar bijna net zo als op het voorbeeld. Best wel frappant detail. Voor de wenkbrauwen idem dito. Aan de andere kant vind ik de nose-job dan weer wat minder geslaagd: lijkt wel of die langer is geworden

Afbeeldingslocatie: https://tweakers.net/i/cuO_JhZbEaJiDAfgZXisvQ2RSPw=/800x/filters:strip_exif()/f/image/bdOkymPQKL4zFtY9urmLnCdD.png?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/4-Al0bSov3CZUpOyU7t3M5860UM=/800x/filters:strip_exif()/f/image/IsN1OGs5bl9KC3JImpkTNPts.png?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/5GMEUi8eI0i6-aSSsEGRveRak4Y=/800x/filters:strip_exif()/f/image/PGbxph8uQTdpIighJmXNfmLA.png?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/czLQkUrx91YZaplOxzrRLZrUt00=/800x/filters:strip_exif()/f/image/KCvWJOFZ5uVO7wr3h6RiyctU.png?f=fotoalbum_large

Dit alles in:

Prompt executed in 1968.59 seconds

donderdag 15 mei 2025 22:56

Acties:

donderdag 15 mei 2025 23:12

Vishari Beduk schreef op donderdag 15 mei 2025 @ 20:29:
Vraagje tussen door; heeft iemand hier al Stable Diffusion aan de praat gekregen op de RTX5090?
Ik zit vast op de foutmelding 'NVIDIA GeForce RTX 5090 with CUDA capability sm_120 is not compatible with the current PyTorch installation.'
Als je dan gaat zoeken dan zijn er heel veel hits maar geen oplossing.
Ik zal dit topic niet vervuilen met de vraag voor een oplossing. Wil alleen even weten of het uberhaupt mogelijk is of dat ik moet wachten tot er een PyTorch update komt.

Python 3.10.11 (tags/v3.10.11:7d4cc5a, Apr 5 2023, 00:38:17) [MSC v.1929 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> torch.cuda.is_available()
True
>>>

Ik weet dat je voor cuda 12.8 op Linux echt 1 van de laatste versies nodig hebt. Maar zie in je melding win32 staan dus geen Linux

Heb je pytorch >= 2.7? Dat zie ik ook veel voorbij komen met 50 serie nvidia.
Info gebaseerd op https://github.com/mmarti...in#blackwell-rtx50xx-note

Taal fouten inbegrepen ;)

Acties:

donderdag 15 mei 2025 23:15

Generatieve AI

Mars Warrior schreef op donderdag 15 mei 2025 @ 21:07:
Uitgaande van deze dame

...en dezelfde instellingen als met het Pixar meisje (elk plaatje met achtergrond kost ruim 3 minuten, dus dingen proberen kost beetje veel tijd), de typische Flux eigenschappen en wat botox komen hier de volgende 4 plaatjes uit met de nieuwe reizende brunette

Ik besef met deze plaatjes pas waarom je pose en diepte moet kunnen destilleren: anders kan je op in ieder geval de 1ste, 3de en 4de plaat natuurlijk nooit de belichting/weerkaatsing/schaduw goed krijgen

Verder zit haar haar bijna net zo als op het voorbeeld. Best wel frappant detail. Voor de wenkbrauwen idem dito. Aan de andere kant vind ik de nose-job dan weer wat minder geslaagd: lijkt wel of die langer is geworden

[...]

Waar ik benieuwd naar ben of je ook heel houdingen, gezichtshoeken en interacties met andere personen ook lokaal kunt krijgen en in realisme.

Ik heb dezelfde plastic dame eens aan ChatGPT gevoerd als voorbeeld.
Het resultaat ziet er dan gelijk zo vlot en natuurlijk uit. In meerdere houdingen en interactie met andere personen. Zou dit ook lokaal mogelijk zijn?

Helaas kan ik dat nu niet zelf testen want mijn videokaart trekt dit niet. Flux dev is al het maximum met --lowvram.

Afbeeldingslocatie: https://i.postimg.cc/PJTpPRsh/2-31-PM.jpg

En met een lekker vette Southern American style.
Afbeeldingslocatie: https://i.postimg.cc/QtrVyyM5/dadf28-PM.jpg

Acties:

Vishari Beduk

loves f/1.8 primes

@Wormaap en @The-Source het is inmiddels gelukt om 11.8 te vervangen met 12.8, bedankt
dus nu draait het eindelijk pffffff
Ik had trouwens in eerste instantie Ubuntu geprobeert maar die kreeg ik ook in niet werkende. Misschien over een paar maanden nog eens proberen als er wat meer updates zijn geweest

AI: claude / copilot / RTX 5060ti / RTX 5090

vrijdag 16 mei 2025 08:42

Acties:

vrijdag 16 mei 2025 08:44

Admin Beeld & Geluid, Harde Waren

CR2032 schreef op donderdag 15 mei 2025 @ 23:12:

En met een lekker vette Southern American style.
[Afbeelding]

Die vette Southern American style laat haar wel een beetje kijken alsof ze zojuist binnen de familie uitgehuwelijkt is. Zal dat ook in het algoritme zitten?

Look for the signal in your life, not the noise.

Canon R6 | RF 24-70 f/2.8 L | 50 f/1.8 STM | 430EX II
Sigma 85 f/1.4 Art | 100-400 Contemporary
Zeiss Distagon 21 f/2.8

Acties:

vrijdag 16 mei 2025 11:19

Admin Beeld & Geluid, Harde Waren

Yaksa schreef op donderdag 15 mei 2025 @ 15:02:
Extreem close-up portretje gemaakt met een oude prompt, je kunt letterlijk elk haartje tellen.

[Afbeelding]

Prompt en generation data:
shock in the brown, by Sergey Bondarchuk, by Christian Dior, hdr, portrait, award winning, intricate details, realistic skin, extremely detailed, masterpiece, fill lighting, very attractive, glamorous, astonishing, perfect face, exceptional, eye-catching, very cute, irresitible, radiant, perfect, mesmeric, luscious, overwhelming, exquisit, charming
Steps: 20, Sampler: Euler, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 973323358, Size: 896x1152, Model hash: 2f5d1875de, Model: flux1-dev-Q6_K, Version: f2.0.1v1.10.1-previous-417-g8ff0dc6f, Module 1: t5xxl_fp16, Module 2: ae, Module 3: clip_l

Als het een oude prompt is heb je dan ook de oude resultaten nog? Het lijkt me dan namelijk wel interessant om te zien wat er voor verschillen uit rollen met een prompt waar je blijkbaar wel tevreden over was.

Look for the signal in your life, not the noise.

Canon R6 | RF 24-70 f/2.8 L | 50 f/1.8 STM | 430EX II
Sigma 85 f/1.4 Art | 100-400 Contemporary
Zeiss Distagon 21 f/2.8

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

CR2032 schreef op donderdag 15 mei 2025 @ 23:12:
[...]
Waar ik benieuwd naar ben of je ook heel houdingen, gezichtshoeken en interacties met andere personen ook lokaal kunt krijgen en in realisme.

Ik tracht nog steeds de hele flow te begrijpen. Ik weet al wel dat als ik ergens de juiste pose in verwerk, dat de foto's met achtergronden deze overnemen. Maar ik ben er nog niet uit...

Ik heb dezelfde plastic dame eens aan ChatGPT gevoerd als voorbeeld.
Het resultaat ziet er dan gelijk zo vlot en natuurlijk uit. In meerdere houdingen en interactie met andere personen. Zou dit ook lokaal mogelijk zijn?

Helaas kan ik dat nu niet zelf testen want mijn videokaart trekt dit niet. Flux dev is al het maximum met --lowvram.

[Afbeelding]

En met een lekker vette Southern American style.
[Afbeelding]

Het zijn leuke foto's, maar er mankeert wel het nodige aan als je goed kijkt. Het zijn de problemen die ik zelf ook ervaar, en van een fotograaf hoor die ChatGPT gebruikt om poses te ontwikkelen voor bruiloften. Regelmatig zijn de poses of onmogelijk, of erg ongemakkelijk

Op de eerste foto heeft de man een stompje vast van de vrouw: haar rechter hand is volledig verdwenen. Nu weet ik ook waar die hand heen is: die zit in haar zij en heeft hij vast met zijn rechterhand: anders kan hij namelijk de bocht met zijn onderarm niet maken, laat staan dat hij zo'n lange onderarm heeft

Op de tweede foto zie je dat ze wel een rechterhand heeft, en een flinke hand ook. Geen poezelig vrouwenhandje in ieder geval. Ze knijpt zijn vingers behoorlijk scheef namelijk.
Maar waar is haar linkerarm heen? Zijn arm zit om haar heen, dus die arm kan geen kant op. Die moet ze dan half achter haar rug houden. Mogelijk daarom die blik van haar.
De hand van de man klopt nu wel qua afstand/verhouding: hij staat tegen haar aan namelijk.

ChatGPT heeft op een aantal vlakken flinke vooruitgang geboekt, maar maakt nog steeds fundamentele fouten bij het genereren van plaatjes. En dan bedoel ik het genereren van volstrekte onzin.

Een voorbeeld van 1 minuut geleden. Het aantal fouten is niet eens op één hand te tellen. Dit zijn fouten die voorheen SD 1.5 en SDXL al maakten...

Afbeeldingslocatie: https://tweakers.net/i/hOZvF1a9l3OBEcEesX4Fourk5t0=/800x/filters:strip_exif()/f/image/ApnxcHEG3TjA5gELhojQ7fz5.png?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/hWym6CpB0YXYCORL3oMoflBShsY=/800x/filters:strip_exif()/f/image/R9usYikiFOSSabBmolKhDXTo.png?f=fotoalbum_large

Ook op andere vlakken - die ik regelmatiger gebruik - laat ChatGPT het volledig afweten, en dan met prompts die ChatGPT zelf maakt.

Onderstaande plaat is volgens ChatGPT een voorbeeld hoe je twee bladen aan elkaar verbind, waarbij een spanband met ratel wordt gebruikt om ze goed samen te drukken bij het lijmen.

Afijn. Dit was de 4de poging, en dan nog lukte het niet om er uberhaupt iets kloppends van te maken, al is het maar dat de spanband ook daadwerkelijk de twee helften verbind, laat staan dat er een ratel gebruikt wordt ipv één of andere rare hendel. Een deel van de blokjes (2 van de 3) kloppen wel om schade aan het blad te voorkomen. Maar de 3de ligt gewoon op de spanband.

Afbeeldingslocatie: https://tweakers.net/i/LT_geYyqDYAPux9xW1HM2c22Vu8=/800x/filters:strip_icc():strip_exif()/f/image/NzoS6hKmvZUgIeyWAKmyWzic.jpg?f=fotoalbum_large

Kritisch blijven loont nog steeds met deze AI's. Echte Intelligentie wint het nog steeds op talloze vlakken van deze "vernieuwing" die volgens sommigen talloze banen gaat overnemen.

Het ergste vind ik nog dat (sommige) kinderen dit soort plaatjes aannemen voor zoete koek. Normaliter wordt het gemiddelde IQ met de jaren hoger door opleidingen (IQ is immers een relatieve schaal), maar dat dreigt zomaar de andere kant op te gaan.

Desalniettemin vind ik het nog steeds fascinerend wat je met een AI kunt doen, maar laten we niet gaan beweren dat alles klopt, immers we zitten niet in Utopia

QED.

vrijdag 16 mei 2025 12:33

Acties:

Generatieve AI
Kunstmatige intelligentie

@CR2032
"Helaas kan ik dat nu niet zelf testen want mijn videokaart trekt dit niet. Flux dev is al het maximum met --lowvram."

je kan toch minder grote modellen lokaal gebruiken, de Q varianten bijvoorbeeld?
zo past een model wel helemaal in je VRAM geheugen, eventueel met LoRa's erbij.
het flux-dev model is 23GB groot, dan moet je al een 24GB VRAM kaart hebben.

vrijdag 16 mei 2025 16:17

Acties:

vrijdag 16 mei 2025 16:24

Kunstmatige intelligentie
Generatieve AI

Gonadan schreef op vrijdag 16 mei 2025 @ 08:44:
[...]Als het een oude prompt is heb je dan ook de oude resultaten nog? Het lijkt me dan namelijk wel interessant om te zien wat er voor verschillen uit rollen met een prompt waar je blijkbaar wel tevreden over was.

Ik kan de oude afbeelding niet meer terugvinden maar ik weet nog wel dat het toen (zo'n jaar terug) behoorlijk realistisch was. Maar goed, "vroeger" waren we al snel tevreden, het was al heel wat dat er geen vierkante pupillen en verschillende iris kleuren tevoorschijn kwamen.
Dat is met de modellen van nu wel even anders, plus dat je qua prompting veel meer kunt doen dan toen, de mogelijkheden om zelf iets unieks te creëren zijn behoorlijk toegenomen sinds toen.
Maar daarmee ook de leercurve, niet iedereen kan overweg met lokale beeldgeneratie, het vergt gewoon wat studie alvorens je e.e.a. onder de knie hebt.
Gelukkig zijn er genoeg gebruikersgroepen op Internet (zoals hier ook) waar men elkaar probeert te helpen of aan te moedigen wanneer je er niet helemaal uit komt.

Toch nog opgespoord, gemaakt in juni '24, volgens mij met SD/XL en een heel ander model dan wat ik nu gebruik (Flux):

Afbeeldingslocatie: https://tweakers.net/i/y_tVlOoabS4cow8r8AKjBDeills=/x800/filters:strip_icc():strip_exif()/f/image/rYIbrRC6OruFCnrDc0GQMGz2.jpg?f=fotoalbum_large

[ Voor 17% gewijzigd door Yaksa op 16-05-2025 17:51 ]

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

Acties:

vrijdag 16 mei 2025 20:37

Niet om je op de persoon aan te vallen maar over de afgelopen paar pagina's vond ik persoonlijk de toon "wanneer je andere probeert te helpen" niet echt vriendelijk overkomen. Op die reacties heb ik toen maar bewust niet gereageerd. ( En zag later dat er een mod het ook wel vond dat het wat vriendelijker mocht)
Ook moet ik erbij zeggen dat het juist laatst wel weer prettig vind overkomen.
Zolang wel elkaar verder kunnen brengen met tips en ideeën is iedereen er bij gebaat.

Voor de comfyui gebruikers:
YouTube: ComfyUI Song – The AI Workflow Anthem You Didn’t Know You Needed!

[ Voor 15% gewijzigd door The-Source op 16-05-2025 19:29 ]

Taal fouten inbegrepen ;)

Acties:

vrijdag 16 mei 2025 21:31

Move on up!

CR2032 schreef op donderdag 15 mei 2025 @ 23:12:
[...]

Helaas kan ik dat nu niet zelf testen want mijn videokaart trekt dit niet. Flux dev is al het maximum met --lowvram.

Triton/Sage installeren en deepcache fix - dan heb je mogelijk al best wat snelheidswinst $_/-\o_$

Afbeeldingslocatie: https://tweakers.net/i/h4XequBBsqwFKJOV2Djm8urkFCM=/800x/filters:strip_exif()/f/image/99yrqTMOO4q0vgicd6JcT3UH.png?f=fotoalbum_large

Op het moment een beetje aan het knoeien met lighttrails, best pittig...

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

SkyStreaker schreef op vrijdag 16 mei 2025 @ 20:37:
[...]

Triton/Sage installeren en deepcache fix - dan heb je mogelijk al best wat snelheidswinst $_/-\o_$

[Afbeelding]

Op het moment een beetje aan het knoeien met lighttrails, best pittig...

Werkt deepcache dan goed met Flux? Dacht dat deze enkel goed werkt met sd/sdxl.

Teacache zou ook nog een optie zijn. Scheelt een factor 2 in tijd. Schijnt niet bij iedereen goed te werken in de zin van dat de kwaliteit achteruit gaat.

vrijdag 16 mei 2025 21:36

Acties:

vrijdag 16 mei 2025 21:57

Move on up!

Mars Warrior schreef op vrijdag 16 mei 2025 @ 21:31:
[...]

Werkt deepcache dan goed met Flux? Dacht dat deze enkel goed werkt met sd/sdxl.

Teacache zou ook nog een optie zijn. Scheelt een factor 2 in tijd. Schijnt niet bij iedereen goed te werken in de zin van dat de kwaliteit achteruit gaat.

https://github.com/SoftMeng/ComfyUI-DeepCache-Fix

Het heeft een paar mensen geholpen, zeker ook iemand met een AMD GPU, ik merkte zelf ook een winst alleen gebruik het al zo lang dat ik je niet meer kan vertellen wat - voor iemand ging zijn rauwe snelheid op de iGPU van 17sec naar 13sec, best wel wat

Acties:

Generatieve AI
Kunstmatige intelligentie

deze toevoeging aan je .bat file zou geheugenproblemen voorkomen (werkt bij mij prima) :

.\python_embeded\python.exe -s ComfyUI\main.py --windows-standalone-build --disable-smart-memory

vrijdag 16 mei 2025 22:08

Acties:

vrijdag 16 mei 2025 22:11

Move on up!

Misschien een leuke tip voor wat mooie Flux LoRa's

https://civitai.com/models/707312/luminous-shadowscape
https://civitai.com/models/736706/epic-gorgeous-details
https://civitai.com/model...ets-flux-illustrious-sdxl

Acties:

Generatieve AI
Kunstmatige intelligentie

deze creator heeft hele leuke LoRa's :

https://civitai.com/models/646411?modelVersionId=1249246

https://civitai.com/models/730373?modelVersionId=980278

zaterdag 17 mei 2025 07:27

Acties:

zaterdag 17 mei 2025 08:38

Move on up!

Afbeeldingslocatie: https://tweakers.net/i/u3kVCD2rzPC6M2fcqjawK0cbPrc=/fit-in/4000x4000/filters:no_upscale():strip_exif()/f/image/7uGSpIUlWnynJY9nuV0goTVX.png?f=user_large

Kleine vraag, hoop ik, ik ben eens gaan kijken voor het gebruik van een eigen LLM en Kobold wordt mij aangeraden, en gebruik koboldcpp (heb ook koboldcpp_cu12, maar weet het verschil niet echt) en vraag mij af of ik de juiste files gebruik. Ipv Grok/ChatGPT te gebruiken die elke keer maar zoveel willen doen voor gratis, wil dit gebruiken voor het helpen van omschrijven van een plaatje en assisteren bij het finetunen van een flux prompt of illustrious/noobai prompts.

Na een beetje onderzoek lijken mij dit de juiste te zijn, maar er zijn ongetwijfeld andere meningen, zit ik zo goed denken jullie?

Afbeeldingslocatie: https://tweakers.net/i/rU9ymD-h1ujmQqCOsUGG7O0JzTk=/800x/filters:strip_exif()/f/image/VbdHDrUXYYK2gS2VH914HZjA.png?f=fotoalbum_large

Wat ik denk niet goed doe is de config, sommige reacties komen meteen, maar zodra ik vraag om een plaatje te omschrijven doet het "half werk". De prompt is er in de terminal maar de webui (zie rechtsondering plaatje" is nog steeds aan het typen.

Laat maar, duurt ff ^^

[ Voor 27% gewijzigd door SkyStreaker op 17-05-2025 08:00 ]

Acties:

StGermain

EverLast2002 schreef op vrijdag 16 mei 2025 @ 12:33:
@CR2032
"Helaas kan ik dat nu niet zelf testen want mijn videokaart trekt dit niet. Flux dev is al het maximum met --lowvram."

je kan toch minder grote modellen lokaal gebruiken, de Q varianten bijvoorbeeld?
zo past een model wel helemaal in je VRAM geheugen, eventueel met LoRa's erbij.
het flux-dev model is 23GB groot, dan moet je al een 24GB VRAM kaart hebben.

Ik gebruik flux1-dev-Q8_0.gguf op een 3060ti met 8GB VRAM, gaat prima… Misschien omdat ik Forge gebruik wat efficient kan swappen naar mijn gewone RAM?

zaterdag 17 mei 2025 10:23

Acties:

zaterdag 17 mei 2025 10:38

Move on up!

StGermain schreef op zaterdag 17 mei 2025 @ 08:38:
[...]

Ik gebruik flux1-dev-Q8_0.gguf op een 3060ti met 8GB VRAM, gaat prima… Misschien omdat ik Forge gebruik wat efficient kan swappen naar mijn gewone RAM?

Gaat met Comfy ook wel goed, gewoon genoeg RAM hebben, lage CAS en wat krappere subtimings helpen erg veel. Zal alleen even duren met inladen.

Acties:

StGermain

SkyStreaker schreef op zaterdag 17 mei 2025 @ 10:23:
[...]

Gaat met Comfy ook wel goed, gewoon genoeg RAM hebben, lage CAS en wat krappere subtimings helpen erg veel. Zal alleen even duren met inladen.

Klopt, de eerste keer inladen duurt een minuutje maar dat is enkel bij de eerste generatie, daarna gaat het vlot genoeg.

zaterdag 17 mei 2025 11:11

Acties:

Generatieve AI
Kunstmatige intelligentie

StGermain schreef op zaterdag 17 mei 2025 @ 08:38:
[...]

Ik gebruik flux1-dev-Q8_0.gguf op een 3060ti met 8GB VRAM, gaat prima… Misschien omdat ik Forge gebruik wat efficient kan swappen naar mijn gewone RAM?

Dat werkt op zich, maar wel met heel veel heen en weer ge-swap tussen VRAM en pc RAM.

Ik zag altijd met het flux1-dev model in het ComfyUI "DOS-box" scherm de regel staan :
Requested to load Flux
loaded partially

Wat duidt dat het model niet volledig in VRAM wordt ingeladen.
Sinds een week gebruik ik het flux1-dev-Q6_K.gguf model,
en dit past mooi helemaal in de 12GB VRAM van mijn RTX3060
(Requested to Flux, loaded completely)
Videokaart heeft 12GB VRAM, maar effectief 10.69GB vrij, volgens ComfyUI.

[ Voor 4% gewijzigd door EverLast2002 op 17-05-2025 11:16 ]

zaterdag 17 mei 2025 12:17

Acties:

zaterdag 17 mei 2025 14:30

Generatieve AI

Mars Warrior schreef op vrijdag 16 mei 2025 @ 11:19:
[...]

Het zijn leuke foto's, maar er mankeert wel het nodige aan als je goed kijkt. Het zijn de problemen die ik zelf ook ervaar, en van een fotograaf hoor die ChatGPT gebruikt om poses te ontwikkelen voor bruiloften. Regelmatig zijn de poses of onmogelijk, of erg ongemakkelijk

Zeker, ChatGPT maakt genoeg regelmatig fouten. De tweede foto was ook nadat ik vroeg om een aantal verbeteringen door te voeren. Die dikke vingers vond ik wel meevallen, zij is tenslotte een stoere Cowgirl.

Daarnaast kun je in de chat ook een feature requests aanvragen. De AI geeft dan aan dat hij het request doorstuurt naar een bepaald OpenAI team. Moet je maar hopen dat ze er ook iets mee gaan doen natuurlijk.

Gonadan schreef op vrijdag 16 mei 2025 @ 08:42:
[...]

Die vette Southern American style laat haar wel een beetje kijken alsof ze zojuist binnen de familie uitgehuwelijkt is. Zal dat ook in het algoritme zitten?

Of het is gewoon haar broertje.

Iedereen bedankt voor de tips om Flux met minder VRAM beter te kunnen gebruiken. Ik ga het eens uitproberen. Ik gebruikte liever niet het Flux q model, omdat was aangegeven dat dezeminder realistisch zou zijn. De standaard Flux dev werkt hier als je geen al te wilde dingen doet prima met workflows met een 3060 kaart met 12GB VRAM en 32GB RAM onder Linux.

Deze derde is ook wel aardig, vooral de huid en de wat grainy movie look.

Country Rodeo Dance 3 (ChatGPT)
Afbeeldingslocatie: https://i.postimg.cc/sX8vwZzv/Country-Rodeo-Dance-3.jpg

Afbeeldingslocatie: https://i.postimg.cc/sX8vwZzv/Country-Rodeo-Dance-3.jpg

Acties:

Generatieve AI
Kunstmatige intelligentie

@CR2032
"Ik gebruikte liever niet het Flux q model, omdat was aangegeven dat dezeminder realistisch zou zijn."

wellicht bedoel je het Schnell model ? Dit model is inderdaad minder realistisch.
de Q versies zijn zeker realistisch, alleen gebruiken ze een iets andere aanpak met genereren dan het flux1-dev model.

zaterdag 17 mei 2025 17:34

Acties:

zaterdag 17 mei 2025 21:25

rodeo-dance sweet home Alabama style

N.a.v van wat posts hierboven kon in niet achter blijven. Heb geen moeite gedaan om het te repliceren maar meer beetje zelfde onderwerp proberen te benaderen.
prompt:

a southern american style outdoor photo of 2 young people doing a rodeo dance on the road, guy is topless and woman is wearing a dress and country hat

flux-dev-fp8 en geen upscaling gedaan.

En ja in de 2e foto zit een behoorlijke arm fout

Taal fouten inbegrepen ;)

Acties:

zaterdag 17 mei 2025 21:53

Move on up!

Afbeeldingslocatie: https://tweakers.net/i/dCl8aYBEEfrS_ivSsdSjWc35Us0=/x800/filters:strip_exif()/f/image/jmvQ00LsP0dpsqBpmwK5PTiE.png?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/JY-sbt9CQtPSB4utPmQfUYq9jAA=/232x232/filters:strip_exif()/f/image/rnzCudo6BARBTlycrlrTmP21.png?f=fotoalbum_tile

Afbeeldingslocatie: https://tweakers.net/i/1vg4Uts4rtWdzWzr4xGn_VwyaVs=/232x232/filters:strip_exif()/f/image/EoI4XYIbx4CtxZjvDciQC4rN.png?f=fotoalbum_tile

Net HiDream gebruikt, ik weet het niet hoor. 4 Encoders + het model zelf en het lijkt precies te presteren als Flux. Vreet geheugen en ik zie de winst niet echt op het moment.

Ja, minder plastic fantastic maar nu met 500 lagen make-up (kan aan de prompt liggen, maar zeg wel expliciet realistic skin e.d.)

Er wordt mij Chroma aangeraden - wat jullie?

Acties:

nFo

SkyStreaker schreef op zaterdag 17 mei 2025 @ 21:25:
[Afbeelding]

[Afbeelding] [Afbeelding]

Net HiDream gebruikt, ik weet het niet hoor. 4 Encoders + het model zelf en het lijkt precies te presteren als Flux. Vreet geheugen en ik zie de winst niet echt op het moment.

Ja, minder plastic fantastic maar nu met 500 lagen make-up (kan aan de prompt liggen, maar zeg wel expliciet realistic skin e.d.)

Er wordt mij Chroma aangeraden - wat jullie?

Misschien wat meer steps gebruiken, 20 lijkt mij aan de lage kant. En kijken of je de aanbevolen sampler gebruikt. Geen idee wat Hidream aanraad.

zaterdag 17 mei 2025 22:09

Acties:

zaterdag 17 mei 2025 22:33

Move on up!

nFo schreef op zaterdag 17 mei 2025 @ 21:53:
[...]

Misschien wat meer steps gebruiken, 20 lijkt mij aan de lage kant. En kijken of je de aanbevolen sampler gebruikt. Geen idee wat Hidream aanraad.

https://civitai.com/model...plers-with-all-schedulers

https://www.reddit.com/r/...bility_test_with_hidream/

Ik moet er ook nog wat meer induiken hoor

Acties:

zaterdag 17 mei 2025 22:35

Kunstmatige intelligentie
Generatieve AI

150 AD. Hé Flavius, wat zullen we morgen eens gaan doen? Naar die kruisiging van slaven bij de Porta Esquilina gaan kijken? Nee joh, Amazon en Achillia treden op de Arena, de entree is gratis en ze bakken lekker brood daar.

Afbeeldingslocatie: https://tweakers.net/i/3mIiWjR6vcSK-qbzLe9anVAjfIc=/x800/filters:strip_icc():strip_exif()/f/image/n9MzZvzNu9MlqSzCVDbeSrhg.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/DKjOQGI4dNe6KH1D_p_4NLgdb8o=/800x/filters:strip_icc():strip_exif()/f/image/Nzk3z712v444PGMYpenwZjFw.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/PDjDl9JhwV-UrZeOXTgsca7RdNw=/x800/filters:strip_icc():strip_exif()/f/image/Lmkm7PbsWJsWKkZe5liBlf5w.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/SPgVCRe_tOXn2Mjxc9IxJJcGUJs=/800x/filters:strip_icc():strip_exif()/f/image/Vjyqvixw916ehu3TQrhRVKcv.jpg?f=fotoalbum_large

Wil jij ook in de Arena spelen? Hier is de (basis) prompt:
150AD, HDR full body shot of an athletic female Roman gladiator fighting in the arena inside the Colloseum, expressive, dominating, sweat dripping from her wounded body, by Jean-Baptiste Monge, by William Wyler, photographic masterpiece, colourful, dust, godrays, high contrast, dynamic cinematic light, 28mm lens, highly detailed, 8k

[ Voor 10% gewijzigd door Yaksa op 17-05-2025 22:41 ]

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

SkyStreaker schreef op zaterdag 17 mei 2025 @ 21:25:
[Afbeelding]

[Afbeelding] [Afbeelding]

Net HiDream gebruikt, ik weet het niet hoor. 4 Encoders + het model zelf en het lijkt precies te presteren als Flux. Vreet geheugen en ik zie de winst niet echt op het moment.

Ja, minder plastic fantastic maar nu met 500 lagen make-up (kan aan de prompt liggen, maar zeg wel expliciet realistic skin e.d.)

Er wordt mij Chroma aangeraden - wat jullie?

De aangeraden spullen zijn lcm / simple en 28 steps voor dev als het goed is en uni_pc voor full met 50 steps.

zaterdag 17 mei 2025 22:44

Acties:

Bad Brains

<(0.o)>

*knip* voegt niets toe

[ Voor 95% gewijzigd door Gonadan op 21-05-2025 16:14 ]

First they take the words, then they take the meaning.

zondag 18 mei 2025 10:54

Acties:

Move on up!

Ik wou graag deze T5 aanraden:

https://huggingface.co/easygoing0114/flan-t5-xxl-fused

Het lijkt mij heel erg goed te helpen met o.a. light-trailing en prolonged exposure effecten die ik anders heel erg moeilijk voor elkaar krijg.

zondag 18 mei 2025 12:17

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

SkyStreaker schreef op zondag 18 mei 2025 @ 10:54:
Ik wou graag deze T5 aanraden:

https://huggingface.co/easygoing0114/flan-t5-xxl-fused

Het lijkt mij heel erg goed te helpen met o.a. light-trailing en prolonged exposure effecten die ik anders heel erg moeilijk voor elkaar krijg.

Mooi!

Text encoders zijn beetje het ondergeschoven kindje als het gaat om beeldkwaliteit en het volgen van de prompt. Veel text encoders kunnen maar een zeer beperkte prompt aan van bijv. 77 karakters. De grotere een paar honderd.

De grotere encoders kunnen dus langere prompts aan, en zijn ook beter in staat om de tekst te vertalen naar het uiteindelijke plaatje.

Aangezien bij de moderene modellen de encoders los zijn, hangt de kwaliteteit van het model nogal eens af van de gebruikte text encoders.

zondag 18 mei 2025 13:54

Acties:

Generatieve AI
Kunstmatige intelligentie

@The-Source
"En ja in de 2e foto zit een behoorlijke arm fout"

hint:
in afbeelding 1 zitten twee anatomische fouten....
maar dat had je zelf waarschijnlijk ook al gezien.

zondag 18 mei 2025 14:02

Acties:

Generatieve AI
Kunstmatige intelligentie

nFo schreef op zaterdag 17 mei 2025 @ 21:53:
[...]

Misschien wat meer steps gebruiken, 20 lijkt mij aan de lage kant. En kijken of je de aanbevolen sampler gebruikt. Geen idee wat Hidream aanraad.

met ComfyUI - flux is 20 steps een goed uitgangspunt.
mijn ervaring is dat bijv CFG 2 ~ 2.5 meer realistische afbeeldingen oplevert.

ik ken die generator niet wat hij in die screenshots gebruikt,
wellicht gewoon kwestie van experimenteren met die waardes.

zondag 18 mei 2025 14:29

Acties:

Generatieve AI
Kunstmatige intelligentie

SkyStreaker schreef op zondag 18 mei 2025 @ 10:54:
Ik wou graag deze T5 aanraden:

https://huggingface.co/easygoing0114/flan-t5-xxl-fused

Het lijkt mij heel erg goed te helpen met o.a. light-trailing en prolonged exposure effecten die ik anders heel erg moeilijk voor elkaar krijg.

Interessant allemaal, ga ik zeker even proberen.
Ontwikkelingen zijn prima, alleen maakt wildgroei het minder overzichtelijk.
d.w.z. wanneer er allerlei eigen gemaakte modellen en encoders opduiken.

Met SDXL had ik op een gegeven moment 20+ modellen die elk het beste en mooiste resultaat beloofde.

zondag 18 mei 2025 14:29

Acties:

Move on up!

EverLast2002 schreef op zondag 18 mei 2025 @ 14:02:
[...]

met ComfyUI - flux is 20 steps een goed uitgangspunt.
mijn ervaring is dat bijv CFG 2 ~ 2.5 meer realistische afbeeldingen oplevert.

ik ken die generator niet wat hij in die screenshots gebruikt,
wellicht gewoon kwestie van experimenteren met die waardes.

StabilityMatrix van Lykos.AI gebruikt daar "Inference" voor, een schil bovenop ComfyUI om alles toegankelijk te maken. Zij bieden een interface aan waarin veel ondersteunde pakketten geïnstalleerd kunnen worden en al deze pakketten halen hun models en etc. uit 1 gedeelde directory.

Paar plaatjes

[ Voor 52% gewijzigd door SkyStreaker op 18-05-2025 14:39 ]

zondag 18 mei 2025 14:48

Acties:

Generatieve AI

Vandaag ChatGPT eens gevraagd nog harder aan werk te gaan.
Een kort sprookje te bedenken voor volwassenen in de moderne tijd, vlot geschreven met humor in het Nederlands met een dubbele boodschap.

Vervolgens de AI uit het sprookje zelf een afbeelding te kiezen en te maken. Zonder verder nog maar iets extra mee te geven, zonder prompts. Het sprookje daarna ook door - wie anders - ChatGPT te laten voorlezen. Die blijkt hier een licht Amerikaans accentje te hebben.

Alles door AI. Met ChatGPT krijg je opeens zoveel nieuwe mogelijkheden.

Mare Incognita
Voorlees Sprookje (2m48s): https://voca.ro/1etbDWHsCFz5

In het sprookje is het nacht en ondanks het mooie sfeerbeeld zie je zo weinig details. Daarom ook gevraagd om een lichtere foto voor alle details. Al klopt de lichtval dan niet meer, je ziet zo wel het zeewier rond de aanmeerpaal en natuurlijk haar prachtige staart.

Afbeeldingslocatie: https://tweakers.net/i/2Sui0VT_150LaIrFnrZ8P8AVbhc=/x800/filters:strip_icc():strip_exif()/f/image/TqEI34xKqdbY0DKpRbiCcCvx.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/Aabrq_EKV1il-THZ7VETGLIwCYw=/x800/filters:strip_icc():strip_exif()/f/image/t0U22oUx4wwDy9qanOZLnA6t.jpg?f=fotoalbum_large

[ Voor 4% gewijzigd door CR2032 op 18-05-2025 16:07 ]

zondag 18 mei 2025 16:29

Acties:

Generatieve AI
Kunstmatige intelligentie

SkyStreaker schreef op zondag 18 mei 2025 @ 10:54:
Ik wou graag deze T5 aanraden:

https://huggingface.co/easygoing0114/flan-t5-xxl-fused

Het lijkt mij heel erg goed te helpen met o.a. light-trailing en prolonged exposure effecten die ik anders heel erg moeilijk voor elkaar krijg.

weet jij wat het verschil is tussen de FULL en de TE-ONLY versies?
er zijn dus die T5xxl encoders maar ook nieuwe clip-L encoders,
ook in een FULL en TE-ONLY variant.......pffffff.

https://huggingface.co/zer0int/CLIP-SAE-ViT-L-14/tree/main

zondag 18 mei 2025 17:09

Acties:

Move on up!

Volgens mij is VIT een herkenning van wat je gaat maken om het e.e.a. te blokkeren, zoals naaktheid e.d. en TE is "text encoder" en eigenlijk wil je alleen die.

Ik heb gebrek in inzicht.

zondag 18 mei 2025 17:13

Acties:

Generatieve AI
Kunstmatige intelligentie

SkyStreaker schreef op zondag 18 mei 2025 @ 17:09:
Volgens mij is VIT een herkenning van wat je gaat maken om het e.e.a. te blokkeren, zoals naaktheid e.d. en TE is "text encoder" en eigenlijk wil je alleen die.

Ik heb gebrek in inzicht.

ik zie door de bomen het bos niet meer....
ben met verschillende encoders aan het testen.
TE is text only maar daar staat bij de info dat dit voor text-to-text bedoeld is,
terwijl ik text-to-image doe.
ik snap er niet veel meer van en de uitleg en info is ook niet hoera die erbij staat.

zondag 18 mei 2025 17:28

Acties:

Move on up!

Dat is ook een klacht die ik heb, er wordt veel gezaaid en je moet het maar begrijpen.

De TE is prima te gebruiken voor t2i, daarom heb ik die FLAN T5 TE ook aangeraden

zondag 18 mei 2025 19:01

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

Jullie hebben toch wel ff doorgeklikt hè voor een beetje uitleg en voorbeelden?

https://www.ai-image-jour...ference-t5xxl-clip-l.html

zondag 18 mei 2025 19:14

Acties:

Kunstmatige intelligentie
Generatieve AI

CR2032 schreef op zondag 18 mei 2025 @ 14:48:
Daarom ook gevraagd om een lichtere foto voor alle details. Al klopt de lichtval dan niet meer, je ziet zo wel het zeewier rond de aanmeerpaal en natuurlijk haar prachtige staart.

Iets tussen donker en licht kan natuurlijk ook.
Het kostte mij minder dan een minuut om een prompt voor deze afbeelding te schrijven en minder dan twee minuten om deze op hoge resolutie (lokaal) met FLUX te laten genereren.
Ik vraag me eigenlijk af of ChatGPT ook alle details die in deze afbeelding zijn verwerkt weer kan geven, ik krijg nog steeds de indruk dat ChatGPT zo min mogelijk details doorrekent en in de afbeeldingen verwerkt. Scheelt natuurlijk wel aardig wat rekenwerk om een minder gedetailleerd en niet al te scherp plaatje af te leveren. En hoe meer mensen van ChatGPT gebruik maken hoe meer dat die datacenters staan te stampen om de aanvragen er doorheen te krijgen. Ik kan mij voorstellen dat dan hier en daar de scherpe kantjes er van afgeknipt worden.......

Afbeeldingslocatie: https://tweakers.net/i/RDsaQ5JK9lh7uiewZvgweirc8-s=/800x/filters:strip_icc():strip_exif()/f/image/06eMdB9wQWswDARmjmgaGfrb.jpg?f=fotoalbum_large

Prompt: A high resolution photograph at dawn, full moon, of a green tailed mermaid covered in kelp, sitting on a lobster trap at a quay of a fishing village, a man kneeling in front of her, asking her to marry him, cinematic lighting, highly detailed

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

zondag 18 mei 2025 21:56

Acties:

Generatieve AI
Kunstmatige intelligentie

Mars Warrior schreef op zondag 18 mei 2025 @ 19:01:
Jullie hebben toch wel ff doorgeklikt hè voor een beetje uitleg en voorbeelden?

https://www.ai-image-jour...ference-t5xxl-clip-l.html

uiteraard, maar dat maakt voor mij het overzicht er nog niet duidelijker op.
als er gesproken wordt op die website over Text-Only encoders en dat je
die gebruikt voor text2text, dan snap ik dat wel, maar text2image is mijn workflow.

zondag 18 mei 2025 23:32

Acties:

maandag 19 mei 2025 11:17

Generatieve AI

Yaksa schreef op zondag 18 mei 2025 @ 19:14:
[...]

Iets tussen donker en licht kan natuurlijk ook.
Het kostte mij minder dan een minuut om een prompt voor deze afbeelding te schrijven en minder dan twee minuten om deze op hoge resolutie (lokaal) met FLUX te laten genereren.
Ik vraag me eigenlijk af of ChatGPT ook alle details die in deze afbeelding zijn verwerkt weer kan geven, ik krijg nog steeds de indruk dat ChatGPT zo min mogelijk details doorrekent en in de afbeeldingen verwerkt. Scheelt natuurlijk wel aardig wat rekenwerk om een minder gedetailleerd en niet al te scherp plaatje af te leveren. En hoe meer mensen van ChatGPT gebruik maken hoe meer dat die datacenters staan te stampen om de aanvragen er doorheen te krijgen. Ik kan mij voorstellen dat dan hier en daar de scherpe kantjes er van afgeknipt worden.......
[Afbeelding]
Prompt: A high resolution photograph at dawn, full moon, of a green tailed mermaid covered in kelp, sitting on a lobster trap at a quay of a fishing village, a man kneeling in front of her, asking her to marry him, cinematic lighting, highly detailed

Het voorbeeld gaat om dat AI eens het originele concept van sprookje bedenken tot afbeelding zelf doet. Je steeds herhaalde verdachtmakingen dat ChatGPT de kwaliteit bewust terugschroeft kennen we nu wel hier. Ik vind het vooral lachwekkend, wat een achterdocht en nergens op gebaseerd.

Jouw afbeeldingen overtuigen mij niet dat het beter is. Het valt mij vooral op dat je afbeeldingen zo eenvoudig zijn. Je loopt hier al lang genoeg mee, waarom ga je niet eens aan de slag met Lora's en uitgebreide workflows in ComfyUI ? Dat zijn leuke puzzels en er is een wereld aan te ontdekken. Deze zijn er allemaal niet voor niets ontwikkeld om Flux en Stable Diffusion te verbeteren.

Verder zie ik in je afbeeldingen steeds dezelfde basis fouten die je voor een deel kan voorkomen door beter prompts te te leren schrijven. Die uitgebreide prompts maken meer kapot dan goed, wat er niet in zit kan ook geen problemen geven. Zoals: het lijkt hier dat een broekpak aan heeft in plaats van dat het zeemeermin is. De staart klopt niet, handen van de man fout, schoenen houding klopt niet, huizen niet, enz. Net zoals de Arena foto's met zo weinig consistentie bij de dame, beesten met drie poten, te wazig.

Foutloos zijn ChatGPT en Gemini zeker niet, next level wel

-------

Een ChatGPT boat ride met je lief en je piraten schoonfamilie

Afbeeldingslocatie: https://i.postimg.cc/qMRRRtqt/926.jpg

Afbeeldingslocatie: https://i.postimg.cc/J4Z1tbmz/817.jpg

Afbeeldingslocatie: https://i.postimg.cc/QdKcFYCW/444.jpg

Onderschat nooit het piratenbloed

Afbeeldingslocatie: https://i.postimg.cc/Y2XFbBmW/EOKYe.jpg

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

@CR2032 , ChatGPT maakt plaatjes in PNG formaat. Heb jij de originelen nog?

De jpegs die je op postimg zitten vol met ruis, jpeg artifacten, gekleurde lijnen en verscherpingen. Nu zie ik die in een aantal van mijn eigen PNG's ook, maar vraag me ff af of de bron dit ook bevat of dat de omzetting en hosting op postimg hiervoor verantwoordelijk is.

De ruis/artefacten in het gezicht, arm en de lucht vallen op, maar ook de lichtbruine lijn langs het gezicht, en de gekleurde lijnen (groen, blauw, wit, rood/bruin) langs de arm.

De huid ziet er daardoor smoezelig uit vind ik.

Afbeeldingslocatie: https://tweakers.net/i/9xp57iPrLwEPBY53Thp8fCUP0bE=/800x/filters:strip_exif()/f/image/B5OdjyPEvD9W0SGSPBem1UvV.png?f=fotoalbum_large

Soms gaat bij mij compositie boven kwaliteit, maar dit is toch wel heel erg

maandag 19 mei 2025 18:17

Acties:

maandag 19 mei 2025 22:41

Kunstmatige intelligentie
Generatieve AI

Vandaag even naar Landgraaf geweest om de zwarte panter op de foto te zetten:

Afbeeldingslocatie: https://tweakers.net/i/KE5vo0QKLnrvFuwzgITH5CXPh8g=/800x/filters:strip_icc():strip_exif()/f/image/UhXVgIzio6ou5uBrYUwBYhxB.jpg?f=fotoalbum_large

En op de terugweg nog een grote blauwe reiger gespot:

Afbeeldingslocatie: https://tweakers.net/i/yOtBTpi77KD0WxePiKPXODGyY4A=/800x/filters:strip_icc():strip_exif()/f/image/q0Z15pqCrfBtdub1pjcWX5fJ.jpg?f=fotoalbum_large

[ Voor 32% gewijzigd door Yaksa op 19-05-2025 20:18 ]

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

Acties:

dinsdag 20 mei 2025 09:12

Generatieve AI

Mars Warrior schreef op maandag 19 mei 2025 @ 11:17:
@CR2032 , ChatGPT maakt plaatjes in PNG formaat. Heb jij de originelen nog?

De jpegs die je op postimg zitten vol met ruis, jpeg artifacten, gekleurde lijnen en verscherpingen. Nu zie ik die in een aantal van mijn eigen PNG's ook, maar vraag me ff af of de bron dit ook bevat of dat de omzetting en hosting op postimg hiervoor verantwoordelijk is.

De ruis/artefacten in het gezicht, arm en de lucht vallen op, maar ook de lichtbruine lijn langs het gezicht, en de gekleurde lijnen (groen, blauw, wit, rood/bruin) langs de arm.

De huid ziet er daardoor smoezelig uit vind ik.

[Afbeelding]

Soms gaat bij mij compositie boven kwaliteit, maar dit is toch wel heel erg

Komt vast door de export naar jpg en hosting. Of de hoster heeft kuren, standaard is die beter dan tweakers. In de post zelf valt het normaal niet op.

Het ging hier ook om een voorbeeld hoe consistent ChatGPT is bij opvolgende beelden in de reeks. Tot en met de kleding aan toe op die boat ride. Dit als voorbeeld en reactie op die reeks beelden van @Yaksa waar de consistentie ver te zoeken is.

ChatGPT doet het leuk met aging. Met een spiegel die je in de toekomst laat kijken. Jammer is alleen nog het verschil in grootte van het spiegelbeeld. Of dit komt doordat dit een magische spiegel is.

Umbra Aeternitatis
postimages hosting
Afbeeldingslocatie: https://i.postimg.cc/zX99v3Xq/STGadr9.jpg

tweakers hosting

Afbeeldingslocatie: https://tweakers.net/i/FQF3qbxV6RcIIYI175uURPHcuMc=/800x/filters:strip_icc():strip_exif()/f/image/iTB8oHj9F7S213fCEKG32Ujo.jpg?f=fotoalbum_large

[ Voor 9% gewijzigd door CR2032 op 20-05-2025 08:24 ]

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

CR2032 schreef op maandag 19 mei 2025 @ 22:41:
[...]
Komt vast door de export naar jpg en hosting. Of de hoster heeft kuren, standaard is die beter dan tweakers. In de post zelf valt het normaal niet op.

Postimg gebruikt jpg, Tweakers avif. Die laatste zou juist een stuk beter moeten zijn dan jpeg, al hangt dat wel af van de compressie instellingen die ik verder niet ken.

Het ging hier ook om een voorbeeld hoe consistent ChatGPT is bij opvolgende beelden in de reeks. Tot en met de kleding aan toe op die boat ride. Dit als voorbeeld en reactie op die reeks beelden van @Yaksa waar de consistentie ver te zoeken is.

ChatGPT doet het leuk met aging. Met een spiegel die je in de toekomst laat kijken. Jammer is alleen nog het verschil in grootte van het spiegelbeeld. Of dit komt doordat dit een magische spiegel is.

Umbra Aeternitatis
postimages hosting
[Afbeelding]

tweakers hosting
[Afbeelding]

Als je ouder wordt, dan schijn je ook te krimpen, dus ik denk dat ChatGPT daar al rekening mee heeft gehouden

Ik zit nu in wat Reddit draadjes te struinen, waar mensen flink klagen over de kwaliteit van ChatGPT, zeker de laatste versie van de plaatjes generator. Ook daar veel problemen met een "impressionistische" stijl of ongevraagde olieverf schilderijen en ruis. Sommige dingen zijn met de prompt op te lossen, maar dat moet je dan maar weten en kost je dus wederom een generatie.

De meningen zijn op gebied van kwaliteit nogal verdeeld. Ook mijn eigen plaatjes schommelen van mooi tot complete bagger. Ik heb nog niet door waar dit door komt. Een slechte prompt? Een soort bias van ChatGPT voor bepaalde stijlen? Geen idee. Het blijft een soort speurtocht

dinsdag 20 mei 2025 17:17

Acties:

dinsdag 20 mei 2025 22:14

Generatieve AI

Mars Warrior schreef op dinsdag 20 mei 2025 @ 09:12:
[...]

Postimg gebruikt jpg, Tweakers avif. Die laatste zou juist een stuk beter moeten zijn dan jpeg, al hangt dat wel af van de compressie instellingen die ik verder niet ken.

[...]

Als je ouder wordt, dan schijn je ook te krimpen, dus ik denk dat ChatGPT daar al rekening mee heeft gehouden

Ik zit nu in wat Reddit draadjes te struinen, waar mensen flink klagen over de kwaliteit van ChatGPT, zeker de laatste versie van de plaatjes generator. Ook daar veel problemen met een "impressionistische" stijl of ongevraagde olieverf schilderijen en ruis. Sommige dingen zijn met de prompt op te lossen, maar dat moet je dan maar weten en kost je dus wederom een generatie.

De meningen zijn op gebied van kwaliteit nogal verdeeld. Ook mijn eigen plaatjes schommelen van mooi tot complete bagger. Ik heb nog niet door waar dit door komt. Een slechte prompt? Een soort bias van ChatGPT voor bepaalde stijlen? Geen idee. Het blijft een soort speurtocht

Lol, krimpen, en dikker. Ik ken de compressie settings van tweakers ook niet, maar op deze foto's is de oudere man met postimages gedetalleerder in de rimpels en zijn jasje is minder wazig. De kleuren zijn ook wat fletser op tweakers. Het zal vast zijn voordelen hebben voor tweakers, maar jammer is wel dat je dit niet zelf kunt instellen.

Op Reddit gaat het natuurlijk altijd alle kanten op met de meningen. Nadeel van alle AI's is dat je niet altijd in 1 keer een goed resultaat hebt. Wat wreekt met die beperkte credits op ChatGPT.
Ik vind de nieuwe beeldgenerator van ChatGPT wel een kwaliteits verbetering. Handen, vingers, consistentie gaat beter. Alleen de snelheid is een stuk minder, of het komt gewoon dat het veel drukker is geworden.

De magic mirror voor een vergelijkng nu ook met Gemini en Flux uitgevoerd. In Gemini met eenzelfde chat en ChatGPT heeft een voor Flux een vergelijkbare prompt gemaakt. Flux met realistische Lora's en uitgebreide workflow, anders is bij voorbaat het resultaat niet meer om aan te gluren.

En de winnaar is...
Een vergelijk van ChatGPT, Gemini en Flux+uitbreidingen is lastig te maken door de vele variabelen. Ieder heeft zo zijn voor en nadelen. ChatGPT valt op door de wat melanchologische sfeer en scherpte, Gemini door het wat kleine mannetje in de spiegel en wel om weer details mee te nemen zoals de wear and tear op de spiegel. Flux heeft met de ChatGPT-prompt een meer close-up camerapunt ingenomen, valt mij helemaal niet tegen.

ChatGPT
Afbeeldingslocatie: https://i.postimg.cc/zX99v3Xq/STGadr9.jpg

Gemini

Afbeeldingslocatie: https://i.postimg.cc/nLrGkH0C/G-magicmirror.jpg

Flux1-dev + Real Lora + sharper workflow
Afbeeldingslocatie: https://i.postimg.cc/rwfZNZCF/Cdd2.jpg

Prompt for Flux
"A highly realistic cinematic photo of a 25-year-old man with dark blond curly hair standing in front of a tall, ornately decorated silver mirror in the style of Dorian Gray. The man stares intensely at his own reflection, which shows himself 50 years older, aged 75. Both figures have identical posture and body language, perfectly mirrored. The young man wears modern, stylish casual clothing, while the elderly reflection is dressed in timeless, elegant attire from 50 years later. The mirror is grand and baroque, with visible wear and patina. The lighting is natural and bright, coming from a side window, with soft shadows. Both figures are clearly visible. The tone is introspective and subtly melancholic, rich in detail and emotion."

[ Voor 12% gewijzigd door CR2032 op 20-05-2025 18:09 ]

Acties:

woensdag 21 mei 2025 09:14

Afbeeldingslocatie: https://tweakers.net/i/UxTeW7fD8MV-7PekWkxfP6W16ro=/100x75/filters:strip_exif()/f/image/UFO7zZ3Quje20HCXXuxtASeq.png?f=fotoalbum_small

Afbeeldingslocatie: https://tweakers.net/i/A2B-5mnjGA5482-FiAQvySzCa48=/100x75/filters:strip_exif()/f/image/jp2MzX2QaWUTpl5gPzcr41RW.png?f=fotoalbum_small

Afbeeldingslocatie: https://tweakers.net/i/tm0Y3syFMcgLv37fAwsKi6E-dDY=/100x75/filters:strip_exif()/f/image/2xmhEfoCqpf7DfkJUEc1gzOM.png?f=fotoalbum_small

Van deze fotos heb ik ook een klein img2video filmpje gemaakt met eigen generated AI music.
YouTube: They have taken over
Vind zelf de music wel passend bij de getoonde sfeer en ja het lopen is zeker niet perfect wanneer het kind in de video erbij is maar vind het acceptabel

Taal fouten inbegrepen ;)

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

Ik had met verschillende leuke prompts die hier gepost werden nogal wat problemen, namelijk dat de prompt slecht werd gevolgd.

In de console van ComfyUI zag ik ook een foutmelding voorbijkomen over de token lengte. Die was langer dan 77. En dat betekent dat een groot deel van de prompt gewoon genegeerd wordt.

Afijn: zoeken op internet dus...

Ik kwam daarbij dit issue van HiDream I1 tegen.
En met als prachtig voorbeeld deze 2 plaatjes. 1 met een afgekapte prompt, en één waarbij de volledige prompt werd geinterpreteerd door de token lengte aan te passen.

De prompt:
"Hangs a wooden wall shelf holding additional jars, a teapot, cutting boards, and a few framed pictures, enhancing the rustic charm. The right side of the image showcases a large window with light, wooden blinds, allowing for ample natural light to flood the space. The floor features a classic chevron pattern made from light wood, which complements the overall aesthetic of the room. Illuminating the dining area is a green, dome-shaped pendant lamp hanging from the ceiling. The walls are painted in a soft, neutral tone, creating a harmonious backdrop to the warm wood elements. The entire setup exudes a sense of simplicity, a dog is sitting on the table."

De "hond" staat aan het einde van de prompt, en is op de 1ste afbeelding dus niet zichtbaar vanwege het afkappen van de prompt.

Afbeeldingslocatie: https://tweakers.net/i/tsn3h76HSrOulRSYd6T93Fqjh_g=/800x/filters:strip_icc():strip_exif()/f/image/ca3EZ42UBolCxJ3EYzanyGOt.jpg?f=fotoalbum_large

Met het vergroten van de tokenlengte, en dus volledige interpretatie van de prompt komt de "hond" plotseling wel tevoorschijn $_/-\o_$

Afbeeldingslocatie: https://tweakers.net/i/7OzkifC_k9ZfVGHSVXSXHWAQQ5A=/800x/filters:strip_icc():strip_exif()/f/image/3XLliyBVB8WxwEKCQdcQRIUS.jpg?f=fotoalbum_large

Afijn. Door toeval kwam ik er verder achter dat door het installeren van de ReActor (faceswapper) node in ComfyUI dat de tokenlengte op magische wijze groter gezet wordt. Geen idee waarop, maar goed.

Als ik de prompt met Flux gebruik, dan krijg ik ook zowaar de "hond", en zie ik geen enkele foutmelding dat de prompt te lang is en wordt afgekapt/genegeerd...

Het enige punt van commentaar is de raambekleding die rechts wel voor de muur lijkt te eindigen, ipv in het kozijn. Maar ja, het blijft AI

Afbeeldingslocatie: https://tweakers.net/i/_XYJJawpzbP7Qjs___GqtyKwZ5Y=/800x/filters:strip_exif()/f/image/QlJ77MnlzGxJQkK8J0PJCbul.png?f=fotoalbum_large

Met een raar filter wordt het helemaal een surrealistische plaat:

Afbeeldingslocatie: https://tweakers.net/i/ss7fZOyPfeuEeYaFD0XWgL0SbJc=/800x/filters:strip_exif()/f/image/Iniod9Uvmq6hSB6uXhPNowPC.png?f=fotoalbum_large

woensdag 21 mei 2025 09:25

Acties:

woensdag 21 mei 2025 10:14

Volgens mij is HiDream beter geschikt om met zinnen te werken (en dus langere prompts) Maar andere modellen moet je loze woorden gewoon weg laten.
Met je prompt:
"Hangs a wooden wall shelf holding additional jars, a teapot, cutting boards, and a few framed pictures, enhancing the rustic charm. The right side of the image showcases a large window with light, wooden blinds, ... etc etc. ."
Want sinds wanneer zou een wooden wall shelf niet hangen, standaard is dat de positie, wanneer je die shelf liggend op de tafel wil hebben dan moet je het wel benoemen.

a few frame pictures is in beide gevallen niet goed opgevolgd, zie er maar 1.
Ik zou het als ik jouw was eens proberen zonder de opvullende woorden en kijken of dat een verschil maakt in positieve / negatieve zin. (bedoel hier letterlijk zin, niet prompt

)

Taal fouten inbegrepen ;)

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

The-Source schreef op woensdag 21 mei 2025 @ 09:25:
Volgens mij is HiDream beter geschikt om met zinnen te werken (en dus langere prompts) Maar andere modellen moet je loze woorden gewoon weg laten.
Met je prompt:
"Hangs a wooden wall shelf holding additional jars, a teapot, cutting boards, and a few framed pictures, enhancing the rustic charm. The right side of the image showcases a large window with light, wooden blinds, ... etc etc. ."
Want sinds wanneer zou een wooden wall shelf niet hangen, standaard is dat de positie, wanneer je die shelf liggend op de tafel wil hebben dan moet je het wel benoemen.

a few frame pictures is in beide gevallen niet goed opgevolgd, zie er maar 1.
Ik zou het als ik jouw was eens proberen zonder de opvullende woorden en kijken of dat een verschil maakt in positieve / negatieve zin. (bedoel hier letterlijk zin, niet prompt )

HiDream zou beter moeten zijn in prompt following dan Flux, maar ik zie soms het tegendeel vreemd genoeg. Zeker nu ik in ComfyUI langere prompts kan maken...

Het voorbeeld ging natuurlijk (zie issue) erom om de "hond" net buiten de tokenlimiet te zetten, en het effect van het verhogen van de tokenlimiet.

Dat er ook hier regelmatig prompts voorbijkomen waarvan je je kunt afvragen of de helft niet weg kan, dat staat daar los van. Veel door AI gegenereerde prompts bevatten mega veel tekst.

woensdag 21 mei 2025 12:55

Acties:

woensdag 21 mei 2025 14:30

Die mega teksten zijn bij flux minder nodig is mijn ervaring.
Maar ik probeerde juist aan te geven dat je door minder vul woorden ook minder tokens verbruikt in je prompt

Taal fouten inbegrepen ;)

Acties:

woensdag 21 mei 2025 14:39

Kunstmatige intelligentie
Generatieve AI

The-Source schreef op woensdag 21 mei 2025 @ 12:55:
Die mega teksten zijn bij flux minder nodig is mijn ervaring.
Maar ik probeerde juist aan te geven dat je door minder vul woorden ook minder tokens verbruikt in je prompt

De ontwikkelaars van FLUX hebben altijd al aangegeven dat voor hun model je het beste gewoon een verhaaltje kunt maken. Waarbij de opbouw van het verhaal wel belangrijk is.
Getting.AI heeft er een aardige tutorial over gemaakt.
Op de site van FLUX zelf zijn ook nog wel een aantal tips e.d. te vinden.
Dat sommigen hier beweren om een prompt voor FLUX zo kort mogelijk te houden voor het beste resultaat heeft waarschijnlijk meer te maken met hun onvermogen om een leuk verhaaltje te schrijven dan met de gedachte dat minder, meer is. Maar goed, we heten niet allemaal Jan Terlouw of J.K. Rowling.........

FLUX. 1 prompt guide: best practices

Be precise, detailed and direct.

Describe not only the content of the image but also such details as tone, style, color palette, and point of view,

For photorealistic images, include the name of the device used (e.g., “shot on iPhone 16”), aperture, lens, and shot type.

[ Voor 14% gewijzigd door Yaksa op 21-05-2025 14:47 ]

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

Acties:

Generatieve AI
Kunstmatige intelligentie

@Mars Warrior

deze encoders gaan voorbij de 77 token grens :

https://huggingface.co/ze...IP-SAE-ViT-L-14/tree/main

woensdag 21 mei 2025 15:42

Acties:

Generatieve AI
Kunstmatige intelligentie

CR2032 schreef op dinsdag 20 mei 2025 @ 17:17:
[...]

Lol, krimpen, en dikker. Ik ken de compressie settings van tweakers ook niet, maar op deze foto's is de oudere man met postimages gedetalleerder in de rimpels en zijn jasje is minder wazig. De kleuren zijn ook wat fletser op tweakers. Het zal vast zijn voordelen hebben voor tweakers, maar jammer is wel dat je dit niet zelf kunt instellen.

Op Reddit gaat het natuurlijk altijd alle kanten op met de meningen. Nadeel van alle AI's is dat je niet altijd in 1 keer een goed resultaat hebt. Wat wreekt met die beperkte credits op ChatGPT.
Ik vind de nieuwe beeldgenerator van ChatGPT wel een kwaliteits verbetering. Handen, vingers, consistentie gaat beter. Alleen de snelheid is een stuk minder, of het komt gewoon dat het veel drukker is geworden.

De magic mirror voor een vergelijkng nu ook met Gemini en Flux uitgevoerd. In Gemini met eenzelfde chat en ChatGPT heeft een voor Flux een vergelijkbare prompt gemaakt. Flux met realistische Lora's en uitgebreide workflow, anders is bij voorbaat het resultaat niet meer om aan te gluren.

En de winnaar is...
Een vergelijk van ChatGPT, Gemini en Flux+uitbreidingen is lastig te maken door de vele variabelen. Ieder heeft zo zijn voor en nadelen. ChatGPT valt op door de wat melanchologische sfeer en scherpte, Gemini door het wat kleine mannetje in de spiegel en wel om weer details mee te nemen zoals de wear and tear op de spiegel. Flux heeft met de ChatGPT-prompt een meer close-up camerapunt ingenomen, valt mij helemaal niet tegen.

ChatGPT
[Afbeelding]

Gemini
[Afbeelding]

Flux1-dev + Real Lora + sharper workflow
[Afbeelding]

Prompt for Flux
"A highly realistic cinematic photo of a 25-year-old man with dark blond curly hair standing in front of a tall, ornately decorated silver mirror in the style of Dorian Gray. The man stares intensely at his own reflection, which shows himself 50 years older, aged 75. Both figures have identical posture and body language, perfectly mirrored. The young man wears modern, stylish casual clothing, while the elderly reflection is dressed in timeless, elegant attire from 50 years later. The mirror is grand and baroque, with visible wear and patina. The lighting is natural and bright, coming from a side window, with soft shadows. Both figures are clearly visible. The tone is introspective and subtly melancholic, rich in detail and emotion."

Heb je eventueel een URL/link naar die Real LoRa?

woensdag 21 mei 2025 17:25

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

EverLast2002 schreef op woensdag 21 mei 2025 @ 14:39:
@Mars Warrior

deze encoders gaan voorbij de 77 token grens :

https://huggingface.co/ze...IP-SAE-ViT-L-14/tree/main

Dat klopt. Die ken ik ook, maar desalniettemin binnen ComfyUI de melding over die 77 tokens

En deze CLIPs lijken niet compatibel met HiDream. Die heeft zijn eigen CLIP modellen lijkt het.

woensdag 21 mei 2025 22:56

Acties:

donderdag 22 mei 2025 16:57

Generatieve AI

@Mars Warrior
De 77 tokens limiet is een bekend probleem met de text encoder. Er zijn wel oplossingen voor, zoals de prompt gaan splitsen in meerdere prompt conditioning nodes, meerdere prompt nodes gebruiken of andere nodes gebruiken.

Stel de vraag eens aan ChatGPT, die geeft voor dit probleem ook een uitgebreide uitleg met oplossingen. En kan voor je de .JSON code schrijven voor een gesplitste prompt in Flux, die je daarna kunt laden in ComfyUI.

EverLast2002 schreef op woensdag 21 mei 2025 @ 15:42:
[...]

Heb je eventueel een URL/link naar die Real LoRa?

Ik gebruik er verschillende, deze was met Realistic photograph LoRa.
https://civitai.com/models/1161456/realistic-photograph-flux

Hier nog een uit dezelfde reeks met Flux, je ziet hier wat beter beide gezichten.

Flux+Realistic LoRa
Afbeeldingslocatie: https://i.postimg.cc/Dw4LPF9y/Comfy-Udfd3.jpg

Afbeeldingslocatie: https://i.postimg.cc/Dw4LPF9y/Comfy-Udfd3.jpg

Omgekeerd is ook een aardige.
Wie zou niet zo'n spiegel in huis willen hebben.

ChatGPT plakte er ook gelijk een pakkende bestandsnaam op.

ChatGPT: Retrospicium Maximus
Afbeeldingslocatie: https://i.postimg.cc/28sVmWtr/85234.jpg

Afbeeldingslocatie: https://i.postimg.cc/28sVmWtr/85234.jpg

[ Voor 3% gewijzigd door CR2032 op 21-05-2025 23:02 ]

Acties:

donderdag 22 mei 2025 19:26

Kunstmatige intelligentie
Generatieve AI

Gisteren de hele dag heerlijk in de grote tuin gewerkt. Aardig wat werk kunnen verzetten mede dankzij de inzet van collega tuinvrouwen, ere wie ere toekomt.

Afbeeldingslocatie: https://tweakers.net/i/99TLC9M7XTZKiDwnQ9lIOzLHws0=/800x/filters:strip_icc():strip_exif()/f/image/7F4qBEYIMPErkecIUHdzB0xk.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/uQZyF7cUilqF378bknQtZXJOsG8=/800x/filters:strip_icc():strip_exif()/f/image/TvCgpiwaPDr2OHMTFSUfq5GQ.jpg?f=fotoalbum_large

Afbeeldingslocatie: https://tweakers.net/i/BnekPyrdDPCbB29HyoRoATuG_ws=/800x/filters:strip_icc():strip_exif()/f/image/BgCbMo6dNakCMgtId2dWy9BN.jpg?f=fotoalbum_large

Prompt (FLUX): Picture a Woman working in her garden, with a focus on planting flowers and vegetables. She is living on an alien Gaia planet which has a serene nature and ecological human cities. The woman is looking straight ahead in an intricated pose, she has large symetrical identical eyes, a natural skin and a few tattoos. Picture the serene alien Gaia atmosphere of the woman and her garden. Shot through a Hasselblad X2D with a Hasselblad XCD 100mm portrait lens

[ Voor 16% gewijzigd door Yaksa op 23-05-2025 22:30 ]

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

Acties:

Corrigan

Yaksa schreef op donderdag 22 mei 2025 @ 16:57:
Gisteren de hele dag heerlijk in de grote tuin gewerkt. Aardig wat werk kunnen verzetten mede dankzij de inzet van collega tuinvrouwen, ere wie ere toekomt.

...

Je post hier zo ontzettend veel en vaak steeds dezelfde plaatjes zonder aanleiding, uitleg of interactie.

Weer een fantasie verhaaltje, dezelfde kwaliteit plaatjes van Flux, dezelfde tooling, dezelfde onderwerpen, je watermerk erop en weer klaar. Bijna dagelijks en dat maand in maand uit. Ik heb je hier al eens eerder een serieus belangstellende vraag voor gesteld waarom je dit steeds doet. Zonder reactie. Deze vele herhalingen om alleen te showen zonder aanleidng is met alle grote AI ontwikkelingen niet meer zo leuk.

Ik weet niet hoe andere gebruikers dit zien en of ik de enige hier ben die mij hier nu meer aan begint te storen.

Veel liever zie ik van iedereen en ook van jou de nieuwste ervaringen en probeersels dan alleen het same same heavy posten van dezelfde plaatjes. Dit is geen persoonlijke aanval. Daarom een net gemaakt bijpassend luchtig AI-plaatje erbij.

Afbeeldingslocatie: https://tweakers.net/i/cgslcVjJzVj0-wS8lFhM-NXXP4E=/fit-in/4920x3264/filters:max_bytes(3145728):no_upscale():strip_icc():strip_exif()/f/image/zhpqgdOusIdZqSbN68w933HV.jpg?f=user_large

donderdag 22 mei 2025 21:51

Acties:

vrijdag 23 mei 2025 07:02

edit:
Pff als je de juiste zoekterm hebt is het niet zo moeilijk...
ipv caption had ik moeten zoeken op text overlay

[ Voor 89% gewijzigd door The-Source op 22-05-2025 21:56 ]

Taal fouten inbegrepen ;)

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

The-Source schreef op donderdag 22 mei 2025 @ 21:51:
edit:
Pff als je de juiste zoekterm hebt is het niet zo moeilijk...
ipv caption had ik moeten zoeken op text overlay

Geen idee waar het over gaat, maar wel een helder verhaal

vrijdag 23 mei 2025 07:14

Acties:

vrijdag 23 mei 2025 09:10

Mars Warrior schreef op vrijdag 23 mei 2025 @ 07:02:
[...]

Geen idee waar het over gaat, maar wel een helder verhaal

Was een lang verhaal met vraag hoe krijg ik captions goed in een afbeelding en dat in comfyui etc. En achteraf was het niet zo moeilijk als je maar de juiste term gebruikt.

Taal fouten inbegrepen ;)

Acties:

vrijdag 23 mei 2025 09:51

Generatieve AI

Corrigan schreef op donderdag 22 mei 2025 @ 19:26:
[...]

Je post hier zo ontzettend veel en vaak steeds dezelfde plaatjes zonder aanleiding, uitleg of interactie.

Weer een fantasie verhaaltje, dezelfde kwaliteit plaatjes van Flux, dezelfde tooling, dezelfde onderwerpen, je watermerk erop en weer klaar. Bijna dagelijks en dat maand in maand uit. Ik heb je hier al eens eerder een serieus belangstellende vraag voor gesteld waarom je dit steeds doet. Zonder reactie. Deze vele herhalingen om alleen te showen zonder aanleidng is met alle grote AI ontwikkelingen niet meer zo leuk.

Ik weet niet hoe andere gebruikers dit zien en of ik de enige hier ben die mij hier nu meer aan begint te storen.

Eensch. Gebruiker Yaksa staat duidelijk al lange tijd op repeat om hier met eenrichtings verkeer zoveel mogelijk dezelfde plaatjes te dumpen. Zijn negatieve manier van interactie maakt het hier ook niet echt leuker op. @Gonadan Dit lijkt mij verder iets meer voor de mods.

Ik post hier al een paar jaar met soms lange onderbrekingen. De technische ontwikkelingen gaan nu opeens weer hard.
Experimenteren met de nieuwste AI-technieken en elkaar hier helpen met tips is toch het leukste aan dit hele topic.

Uit de oude doos: CR2032 in "Het grote AI art show- & kletstopic"

Acties:

vrijdag 23 mei 2025 12:07

Na aanleiding over die captions waar ik het eerder over had.
Afbeeldingslocatie: https://tweakers.net/i/3MPgY3Jstb6XzYJHnHmSbJeY5R0=/fit-in/4000x4000/filters:no_upscale():strip_exif()/f/image/ZF7I1HXF4ldci5jqAnZIDIuv.png?f=user_large

Afbeeldingslocatie: https://tweakers.net/i/3MPgY3Jstb6XzYJHnHmSbJeY5R0=/fit-in/4000x4000/filters:no_upscale():strip_exif()/f/image/ZF7I1HXF4ldci5jqAnZIDIuv.png?f=user_large

Ben zelf bezig met verhalen maker > dus verhaaltje maken > in hoofdstukken > per hoofstuk plaatje, captions etc en dit wil ik dan geautomatiseerd doen.
Stukje van verhaal naar database per hoofdstuk een summary en short description en tags gaat ok.
Nu dus img workflow gaan koppelen voor landscape en portrait plaatjes en daarbij dus de captions in het plaatje verwerken.
De prompt die gebruikt wordt voor IMG wordt na aanleiding van system prompt, aangeboden genre en summary gegenereerd. En de systemprompt heb ik nu wel redelijk tot goed om plaatje consistent te krijgen hoe ik ze wil hebben.

Hierbij gaat het dus niet direct om kwaliteit van het plaatje maar de clickbait caption

Wanneer IMG deel goed gaat kan ik over naar TTS deel
Workflow daarvoor is nog lange na niet af en zal vast nog wel wat uurtjes in gaan zitten

hieronder dus huidige stand van de flow.

Afbeeldingslocatie: https://tweakers.net/i/O04UncrUrlWVyiRQBRdDC-lhH0c=/234x176/filters:strip_exif()/f/image/toJhaUFa7GTJAiWbUj506kS6.png?f=fotoalbum_medium

Taal fouten inbegrepen ;)

Acties:

Material 3 Thema's | Swiss Army Knife card | Flex Horseshoe Card

Earth, the final frontier

Generatieve AI

Een leuke manier om deepfakes te ontdekken: https://nos.nl/artikel/25...om-deepfakes-te-herkennen

Nu werkt dit enkel met video's en niet met foto's natuurlijk, maar ik weet dat het werkt.
Ik heb dit ook al vaker gewoon live kunnen gebruiken: met een stereo-camera van bijv. Oak aangesloten op je laptop kun je van afstand (niet té ver) iemands hartslag detecteren.

Wordt door in een overleg door dames niet altijd gewaardeerd overigens, zo'n live hartslag check

vrijdag 23 mei 2025 12:24

Acties:

vrijdag 23 mei 2025 13:20

Maar als je zelf filmt weet je toch dat je een echt persoon voor je hebt

Straks ga je een AI label krijgen terwijl je een echte robot interviewed (geen hartslag )

Verder natuurlijk wel gaaf hoever camera technieken gaan qua resolutie en wat er gedetecteerd kan worden. En bij het genoemde artikel wordt zeer waarschijnlijk AI gebruikt om in het beeld AI te detecteren

Taal fouten inbegrepen ;)

Acties:

StGermain

The-Source schreef op vrijdag 23 mei 2025 @ 12:24:
Maar als je zelf filmt weet je toch dat je een echt persoon voor je hebt

Straks ga je een AI label krijgen terwijl je een echte robot interviewed (geen hartslag )

Dan hebben we geen Duitse Herders meer nodig om binnenkomende Terminators te identificeren

vrijdag 23 mei 2025 17:27

Acties:

vrijdag 23 mei 2025 23:24

Admin Beeld & Geluid, Harde Waren

De discussie over de stijl van posten heb ik gezien maar ik laat hem voor nu staan. Het is niet per se on-topic, maar ook wel weer waardevol voor de sfeer in het topic. Als men gewoon tegen elkaar uitspreek wat wel of niet gewaardeerd wordt dan komen we alleen maar dichter bij een topic wat voor zoveel mogelijk tweakers leuk is lijkt me.
Maar, houd het wel netjes en op de inhoud.

Look for the signal in your life, not the noise.

Canon R6 | RF 24-70 f/2.8 L | 50 f/1.8 STM | 430EX II
Sigma 85 f/1.4 Art | 100-400 Contemporary
Zeiss Distagon 21 f/2.8

Acties:

Verwijderd

Yaksa schreef op donderdag 22 mei 2025 @ 16:57:

[....]

Prompt (FLUX): Picture a Woman working in her garden, with a focus on planting flowers and vegetables. She is living on an alien Gaia planet which has a serene nature and ecological human cities. The woman is looking straight ahead in an intricated pose, she has large symetrical identical eyes, a natural skin and a few tattoos. Picture the serene alien Gaia atmosphere of the woman and her garden. Shot through a Hasselblad X2D with a Hasselblad XCD 100mm portrait lens

Wat ik me hier dan afvraag, is wat de dik gedrukte delen van de prompt toevoegen aan het resultaat. Ik zie het namelijk niet terug. Dus doen dit soort uitdrukkingen in algemenere zin iets met de sfeer of zo?

vrijdag 23 mei 2025 23:35

Acties:

zaterdag 24 mei 2025 11:34

Kunstmatige intelligentie
Generatieve AI

Verwijderd schreef op vrijdag 23 mei 2025 @ 23:24:
[...]

Wat ik me hier dan afvraag, is wat de dik gedrukte delen van de prompt toevoegen aan het resultaat. Ik zie het namelijk niet terug. Dus doen dit soort uitdrukkingen in algemenere zin iets met de sfeer of zo?

Ja, en het helpt om niet elke keer de 'generieke' modellen met het kuiltje in de kin te krijgen. Ofschoon er met deze prompt ook heel af en toe 'alienachtige' vrouwspersonen gecreëerd worden. Zie ook mijn eerder posts over hoe in FLUX een prompt op te bouwen.
Hier staat ook een soortgelijke manier van promptwriting voor FLUX omschreven. (TLDR: het plaatsen van [brackets] om de focus op een bepaald deel van de prompt te leggen).

Edit: Voorbeeldje alienachtig vrouwspersoon:

Afbeeldingslocatie: https://tweakers.net/i/UmF9iSWHlgud-6V3rDkT9ktqC1E=/800x/filters:strip_icc():strip_exif()/f/image/uKFhkK4wqRdFCpGQFRLZ6ObE.jpg?f=fotoalbum_large

[ Voor 21% gewijzigd door Yaksa op 24-05-2025 08:46 ]

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

Acties:

Verwijderd

Als dat met dezelfde prompt is, toont dat wel dat de willekeur nog best groot is. Dat is een flink ander resultaat dan de voorgaande afbeeldingen, al valt het me voor de omgeving mee.

[ Voor 11% gewijzigd door Verwijderd op 24-05-2025 11:35 ]

zaterdag 24 mei 2025 11:44

Acties: