Toon posts:

Kan ChatGPT je WK-poule laten winnen?

Pagina: 1

Acties:

3.558 views
Reageer

donderdag 14 mei 2026 21:54

Acties:

dataanerd

Topicstarter

Ik liet ChatGPT (5.3), Claude (Opus 4.7) en Gemini op 1 mei alle 72 WK-groepswedstrijden voorspellen. Verse chat per model, identieke prompt.

ChatGPT voorspelde Ivoorkust-Curaçao binnen één antwoord twee keer: eerst 2-0, vier regels later 1-0. Door dat duplicaat ontbraken Duitsland-Ivoorkust en Ecuador-Curaçao volledig uit de output. Verifieerbaar via de gedeelde sessie.

Op de 66 vergelijkbare wedstrijden:
- 19/66 alle drie identiek
- 23/66 oneens over wie wint
- 14/66 drie verschillende scores

Toen ik in een tweede ronde de FIFA-loting, wedstrijdvolgorde én puntentelling letterlijk in de prompt plakte, bleven de drie modellen op 18 van de 72 wedstrijden een andere winnaar geven. 1 op 4, ook met maximale context.

Niet schokkend voor wie weet hoe LLMs werken, maar wel een aardig reproduceerbaar voorbeeld van zero self-consistency over 30 regels gestructureerde output. Methodiek en de Excel staan op pouletips.nl/ai-experiment.

Benieuwd of iemand de duplicate-bug op dezelfde prompt kan reproduceren.

donderdag 14 mei 2026 21:56

Acties:

Hahn

Waarom heb je wel de nieuwste Opus (4.7) gebruikt, maar ben je bij ChatGPT voor 2 versies ouder gegaan (5.3 ipv 5.5)?

The devil is in the details.

donderdag 14 mei 2026 22:09

Acties:

dataanerd

Topicstarter

Terecht punt! 5.3 Instant was op 1 mei de default voor alle ChatGPT-gebruikers, ook gratis-accounts. Vier dagen later (5 mei) heeft OpenAI overgeschakeld naar 5.5 Instant als nieuwe default. Mijn test viel dus net voor die switch, maar ik wil het richting het WK nog een keer draaien met beter modellen.

donderdag 14 mei 2026 22:33

Acties:

eheijnen

Misschien ze ook eens de lotto laten invullen ....

Wie du mir, so ich dir.

zaterdag 16 mei 2026 13:15

Acties:

MueR

Admin Devschuur® & Discord

is niet lief

Ik zie niet wat dit in de Devschuur te zoeken heeft, dus even een schopje naar Client software algemeen

Anyone who gets in between me and my morning coffee should be insecure.

dinsdag 2 juni 2026 19:59

Acties:

DeNachtwacht

Haha ik moet eerlijk bekennen dat ik ook wat hulp gevraagd heb. Het zou een interessante zijn om te maken: een test waarop mensen een poule kunnen invullen en dan per door mensen ingevulde poule ook een AI gegenereerde te maken.

Ik denk dat je er uiteindelijk bij heel grote aantallen wel komt dat de AI grotere kans heeft om te winnen. Alle mogelijke statistische data (welke standen komen het meest voor? hoeveel % van wedstrijden wordt gewonnen/verloren/gelijkgespeeld etc) zullen op grote aantallen natuurlijk wel zorgen dat de AI betere inschattingen kan maken dan veel mensen.

dinsdag 2 juni 2026 20:09

Acties:

Yaksa

DeNachtwacht schreef op dinsdag 2 juni 2026 @ 19:59:
Haha ik moet eerlijk bekennen dat ik ook wat hulp gevraagd heb. Het zou een interessante zijn om te maken: een test waarop mensen een poule kunnen invullen en dan per door mensen ingevulde poule ook een AI gegenereerde te maken.

Ik denk dat je er uiteindelijk bij heel grote aantallen wel komt dat de AI grotere kans heeft om te winnen. Alle mogelijke statistische data (welke standen komen het meest voor? hoeveel % van wedstrijden wordt gewonnen/verloren/gelijkgespeeld etc) zullen op grote aantallen natuurlijk wel zorgen dat de AI betere inschattingen kan maken dan veel mensen.

Uitslagen uit het verleden geven geen garantie voor de toekomst.
Wanneer AI modellen getraind zijn met nieuws e.d. van (laten we zeggen) 2 maanden oud en ouder dan zijn de selecties (en wijzigingen in de selecties) bij AI niet bekend. Dat kan heel veel uitmaken hoe een ploeg gaat spelen en de kans die ze maken om te winnen.

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former

dinsdag 2 juni 2026 20:48

Acties:

DeNachtwacht

Klopt, maar er zijn allerlei statistische feiten over alle voetbalwedstrijden in den algemene te bedenken die wél helpen. Bijvoorbeeld:
- de stand 0-5 vullen mensen met enige regelmaat in voetbalpoules in maar het is gewoon een feit dat dit soort uitslagen statistisch vrijwel niet voorkomen. dus ook bij brazilië vs turkmenistan kun je beter gewoon 2-0 invullen bijvoorbeeld
- zoals gezegd is het % gelijkspel, winst voor A of winst voor B vrij stabiel. Dat is statistiek die AI wél goed mee kan wegen in mogeijke uitslagen, voor mensen is dat veel te complex.

Dit zijn dan even 2 snelle voorbeeldjes maar met een goed gekozen rij variabelen die AI voor je uitzoekt om de uitslagen mee te voorspellen kom je denk ik een behoorlijk eind.

donderdag 11 juni 2026 08:50

Acties:

Stukfruit

Ik gok vooral dat de startpost verkapte spam is

Zie de "verborgen" link in de startpost en de gevibecodete site vol referrallinks naar goksites en apps. Links op homepage, zoals deze (blauwe knop op iedere bijbehorende pagina).

Als dit serieus zou zijn dan was er meer tijd in de prompt gestoken, aangezien ts zelf al aangeeft te weten dat het zo niet erg realistisch is.

Dat zit wel Schnorr.

donderdag 11 juni 2026 09:00

Acties:

jaspermeul

Ik heb het voor de lol eens ingevoerd zoals op de site.

Maar heel realistisch lijkt mij dat niet. In de 72 wedstrijden in de poulfase zou er precies geen enkel tegendoelpunt vallen. De tegenstander blijft altijd op 0 doelpunten staan.

donderdag 11 juni 2026 09:05

Acties:

chengbondkwok

Ik heb met behulp van Gemini / CoPilot / ChatGPT gekeken of er een model geschreven kon worden die uitslagen kon voorspellen o.b.v. de bookmaker odds die ik handmatig heb gescreenshot en de odds laten vertalen in een werkbare tabel. Voor de lolz heb ik ook de EA FC ratings aan toegevoegd.

Uiteindelijk kwam er een Python script uit en na wat finetuning heb ik redelijke resultaten (voornamelijk 1-0, 2-1 uitslagen, en bij een grotere verschil in kracht obv EA FC Ratings en poule odds, wat grotere uitslagen). We gaan het zien

donderdag 11 juni 2026 09:17

Acties:

Ikke_niet

Zijn we even vergeten dat het een TAAL-model is? Deze geeft waarschijnlijk gewoon een samenvatting van wat hij op internet gevonden heeft. Zit geen kansberekening achter, al brengt hij het wel zo.

Enigste voorspelbare waarde is de ranking. Hierbij komt nog een dosis geluk. Hoe dichter de teams qua niveau bij elkaar zitten des te kleiner het doelpunten verschil en hoe meer de hoeveelheid geluk. Die laatste is gewoon een dobbelsteen.

dinsdag 23 juni 2026 09:50

Acties:

Caelorum

Tja.. na ronde 1 stond ik op de 2e plek. Degene boven mij had ook AI gebruikt. Nu kan het zo zijn dat de concurrentie niet zo goed is, maar tja...
Enige reden waarom ik nu op plek 4 sta is omdat ik wat wedstrijden heb gemist en om nog een kans van slagen te hebben de instructies heb gegeven om meer risico te nemen. Dat pakt op sommige wedstrijden niet zo goed uit, omdat de teams blijkbaar wat passief spelen.

donderdag 25 juni 2026 13:42

Acties:

spartacusNLD

This is Sparta!!

Ik heb in Scorito nu 2 spellen met behulp van Claude gedaan. Alle 2 gewonnen (werk poules). Het ging om wielrennen (voorjaars klassiers en de Giro) en nu bezig met het WK spel, stond tot gisteren 1e en nu 2e.

Vooral leuk om zo Claude te leren kennen en alle functionaliteit te testen.

[ Voor 6% gewijzigd door spartacusNLD op 25-06-2026 13:44 ]

Ryzen 7 7800X3D - Gigabyte B850 AORUS ELITE - Sapphire Nitro+ Radeon RX 9070 XT - Fractal Design Meshify 3 - Arctic Liquid Freezer III Pro 280 - Kingston Fury Beast 32GB - WD_Black 2TB

donderdag 25 juni 2026 13:44

Acties:

spartacusNLD

This is Sparta!!

Ikke_niet schreef op donderdag 11 juni 2026 @ 09:17:
Zijn we even vergeten dat het een TAAL-model is? Deze geeft waarschijnlijk gewoon een samenvatting van wat hij op internet gevonden heeft. Zit geen kansberekening achter, al brengt hij het wel zo.

Enigste voorspelbare waarde is de ranking. Hierbij komt nog een dosis geluk. Hoe dichter de teams qua niveau bij elkaar zitten des te kleiner het doelpunten verschil en hoe meer de hoeveelheid geluk. Die laatste is gewoon een dobbelsteen.

Ik heb Claude specifiek instructies gegeven welke bronnen wel, en welke niet. Betting odds etc. Zonder al dat werk sloeg het advies nergens op. Daarna kwamen er zeer goede adviezen uit. Je moet Claude ook wel echt alle regels (stap voor stap) aanleren van een poule of spel, en Claude meenemen in strategie etc. Dit gezegd hebbende.. zonder deze invloed van mij had Claude nooit gewonnen.

Dus eigenlijk gewoon een verdomd handige tool, maar het kan het nog niet autonoom IMHO.

Ik heb hiervoor Claude Sonnet gebruikt. Ik heb Opus proberen te gebruiken maar dan was je budget na 30 min analyse al op

[ Voor 6% gewijzigd door spartacusNLD op 25-06-2026 13:46 ]

Ryzen 7 7800X3D - Gigabyte B850 AORUS ELITE - Sapphire Nitro+ Radeon RX 9070 XT - Fractal Design Meshify 3 - Arctic Liquid Freezer III Pro 280 - Kingston Fury Beast 32GB - WD_Black 2TB

donderdag 16 juli 2026 15:08

Acties:

Lollercopter

Ik heb Codex de bedrijfs voetbal wk pool in laten vullen, de odds stonden al in de pool zelf dus dat was een makkie. Dus ik heb alleen ingelogd en Codex heeft zelf op de website alles ingevuld, alle tabbladen gewisselt en daarna de voorspelling ingediend. 100% hands off.

Ik sta nu op nummer #1, nog even de finale afwachten maar het ziet er goed uit

$_/-\o_$

[ Voor 26% gewijzigd door Lollercopter op 16-07-2026 15:08 ]

dinsdag 21 juli 2026 15:57

Acties:

DeNachtwacht

Nou @dataanerd het antwoord op je vraag is iig duidelijk ja: https://www.nu.nl/tech/6403753/sophie-uit-rotterdam-won-wk-pool-van-scorito-weet-eigenlijk-niks-van-voetbal.html

Vraag is dan natuurlijk is het toeval en dat antwoord is natuurlijk ook ja, maar zoals te lezen is het iemand die het met goed prompten serieus heeft aangepakt en gewonnen heeft.

dinsdag 21 juli 2026 16:45

Acties:

Stukfruit

Ik heb het vermoeden dat ts daar met een posthistorie van twee reacties die beiden gericht zijn op het indirecte promoten van z'n referrallinkjes niet meer op gaat reageren

Bewijs wordt het pas zodra het te reproduceren is. Haar prompts zouden bestaan uit:

"Ik vroeg aan Claude of-ie op basis van historische gegevens kon voorspellen wat de wedstrijduitslagen zouden kunnen zijn. In het begin kwamen daar best wat onvoorspelbare uitslagen uit, maar later ging het beter. Mijn score ging na de kwalificatiewedstrijden een stuk sneller omhoog, omdat ik bepaalde uitslagen precies goed had."

...wat in principe verstandig is omdat het de boel zou moeten grounden in op z'n minst prestaties die min of meer te verwachten zijn, maar je weet niet hoe ver ze is gegaan, hoe selectief zij in verdere reacties (of juist het model) is geweest, er is nog het befaamde "resultaten in het verleden geven geen garantie voor de toekomst", enz.

Maakt het waarschijnlijk geluk met een klein beetje voorselectie (om het maar in passende termen uit te drukken) door Claude te gebruiken als zoekmachine ipv als kunstmatige intelligentie.

Dat zit wel Schnorr.

dinsdag 21 juli 2026 16:45

Acties:

Stukfruit

En een hogere winkans omdat zij wel achtergrondonderzoek heeft gedaan, dus toch intelligent gedrag maar dat juist aan de kant van de mens

[ Voor 5% gewijzigd door Stukfruit op 21-07-2026 16:46 ]

Dat zit wel Schnorr.

dinsdag 21 juli 2026 16:57

Acties:

SgtElPotato

Hier is het mislukt. Ik heb hele analyses met Claude / Chat en Gemini laten uitvoeren, maar helaas heb ik niet gewonnen. Ik denk dat AI de informatie over VArgentinië niet had.

Zucht...

Pagina: 1

Reageer