Acties:
  • 0 Henk 'm!

  • DeNachtwacht
  • Registratie: December 2005
  • Laatst online: 18:16

DeNachtwacht

youtube.com/@hisrep

De relevantie is er in die zin dat AI dus op allerlei plekken de complexiteit van menselijke hersenen niet heeft, en dus ook de wat meer onlogische fouten die wij maken niet maakt. Het heeft simpelweg voor- en nadelen. Maar onderaan de streep is het nog een zeer lange weg te gaan tot PC's echt kunnen functioneren als menselijke hersenen, hoewel het al wel met enige regelmaat is dat een LLM je het gevoel geeft met een echt mens te communiceren. Ik weet ook niet in hoeverre de discussie wat dat betreft zinvol is, want als iets heel goed werkt voor een bepaald doel, wat doet de rest er dan toe?

AI is beter in het herkennen van kwaadaardige melanomen dan professioneel geschoolde artsen. Handig toch? En zo zijn er vele voorbeelden. Het is simpelweg een zeer nuttig en handig gereedschap waardoor wij iets beter kunnen dan we het voorheen konden. Net zoals een spijker in een plank slaan een stuk handiger gaat met een hamer dan met je handen ;). Maar verder is die AI echt niet direct bovenmenselijks of op een andere manier gevaarlijk. Het enige risico zit in onze afhankelijkheid van digitale systemen, want daar kan AI de boel natuurlijk in de toekomst natuurlijk potentieel flink in de war schoppen. Of zelfs in de echte wereld door bijv. geprogrammeerde drones die iets totaal anders gaan doen dan de bedoeling was.


Maar goed we moeten het allemaal ook niet overdrijven. Met één auto die op hol slaat kunnen de meest vreselijke dingen gebeuren en allerlei zeer gevaarlijjke wapens en/of kerninstallaties zijn al decennia digitaal aangestuurd. Dat heeft niks met AI te maken maar was altijd al een digitaal risico. Dit soort nieuwe technieken zorgt alleen maar dat je er extra alert op moet zijn dat het niet mis gaat, maar menselijk is het allemaal echt niet.

youtube.com/@hisrep


Acties:
  • 0 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
Maar dat is toch wat al vele keren geschreven werd met minder woorden? :p

[ Voor 13% gewijzigd door Stukfruit op 20-07-2025 13:36 ]

Dat zit wel Schnorr.


Acties:
  • 0 Henk 'm!

  • RayNbow
  • Registratie: Maart 2003
  • Laatst online: 12:29

RayNbow

Kirika <3

Ipsa Scientia Potestas Est
NNID: ShinNoNoir


Acties:
  • +1 Henk 'm!

  • Meg
  • Registratie: September 2016
  • Niet online

Meg

418: “I’m a teapot”

Ik zie op steeds meer fora dat ze AI verbieden, wat positief is.

Fora is voor communicatie tussen mensen, niet robots.

"If you lose your left arm your right arm will be left."
"The difference between stupidity and genius is that genius has its limits." - Albert Einstein
"I don't need oxygen, I only need O2."


Acties:
  • 0 Henk 'm!

  • DeNachtwacht
  • Registratie: December 2005
  • Laatst online: 18:16

DeNachtwacht

youtube.com/@hisrep

Dat laatste, zeker mee eens. Aan de andere kant kan het ook veel moois brengen, zie het AI Art topic.

youtube.com/@hisrep


Acties:
  • 0 Henk 'm!

  • Meg
  • Registratie: September 2016
  • Niet online

Meg

418: “I’m a teapot”

DeNachtwacht schreef op zondag 20 juli 2025 @ 15:05:
Aan de andere kant kan het ook veel moois brengen, zie het AI Art topic.
Waar? Nu ben ik wel heel benieuwd.

"If you lose your left arm your right arm will be left."
"The difference between stupidity and genius is that genius has its limits." - Albert Einstein
"I don't need oxygen, I only need O2."


Acties:
  • +1 Henk 'm!

  • DeNachtwacht
  • Registratie: December 2005
  • Laatst online: 18:16

DeNachtwacht

youtube.com/@hisrep

youtube.com/@hisrep


Acties:
  • +1 Henk 'm!

  • Cobb
  • Registratie: December 2005
  • Laatst online: 01:02
DeNachtwacht schreef op zondag 20 juli 2025 @ 15:05:
Dat laatste, zeker mee eens. Aan de andere kant kan het ook veel moois brengen, zie het AI Art topic.
Verschrikkelijk al die A.I. plaatjes waar het internet mee overspoeld wordt.

U don't get it boy, this isn't a mudhole. It's an operating table. And I'm the surgeon.


Acties:
  • +1 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
De plaatjes in kwestie zijn verschrikkelijk irritant, maar ik vind het wel jammer dat men nu ook loopt te ranten bij zaken zoals The Eternaut op Netflix.

Hierin is "AI" gebruikt om een instortend gebouw te maken...

...op basis van eigen input.

Wat betekent dat het niet een heel ander proces is dan zelf alle puntjes trekken en met elkaar verbinden. Het is alleen geautomatiseerd om dat arbeidsintensieve werk overbodig te maken.

Dat is misschien wel het meest stuitende: mensen (niet de reactie hierboven trouwens) klagen over iets waarvan ze niet eens weten hoe het tot stand is gekomen.

Dat zit wel Schnorr.


Acties:
  • +3 Henk 'm!

  • DeNachtwacht
  • Registratie: December 2005
  • Laatst online: 18:16

DeNachtwacht

youtube.com/@hisrep

Ik ben het zeker met Cobb eens hoor, alle low-effort "kunst" is natuurlijk iets wat vrij suf is en waar mensen nu gelukkig al genoeg van beginnen te krijgen, vorig jaar had dat soms nog de wow factor maar nu al steeds minder.

Aan de andere kant voegt het ook gewoon ontzettend veel nieuwe mogelijkheden toe en ik wil graag de nuance aanbrengen dat mensen vooral low-effort materiaal verschrikkelijk vinden. Maar alles wat echt anders/mooi is gaat ons ook veel brengen zoals @Stukfruit zegt denk ik.

Zelf in dat topic vorige week eens een eerste poging met fotografie verbeteren gepost, het is ook hier zo dat het het nog net niet is, maar er komt natuurlijk een moment dat het zo realistisch is dat het een heel nieuwe blik op geschiedenis kan werpen bijvoorbeeld.

John Quincy Adams, origineel en bewerkt:
Afbeeldingslocatie: https://tweakers.net/i/lad-aXHs-RPTO0bvEMhLN7sfWzA=/x800/filters:strip_exif()/f/image/lCXrBuHuLngIq9zXxabrpKcq.png?f=fotoalbum_large
Afbeeldingslocatie: https://tweakers.net/i/d_t41j2GCCxG1ELsoXX1r1umP7E=/x800/filters:strip_exif()/f/image/USI0swb46SdVuId3qCttnLPR.png?f=fotoalbum_large

En nogmaals, ik zie ook dat het nog niet perfect is en onrealistisch voelt. Er zitten nog allerlei dingen aan die echt slecht zijn zelfs.

Maar realiseer je dus dat dit een testje was met 3 uurtjes stoeien met zo'n lokale AI, en dat het resultaat 2 jaar geleden belabberd was. Nu is het nog niet goed, maar binnen heel korte termijn wordt het dus veel makkelijker en simpeler om dit soort zaken perfect te doen. Vijf jaar geleden was foto's retoucheren en inkleuren een enorm arbeidsintensieve klus, over vijf jaar doet iedereen dat in een paar klikken met een tooltje online.

[ Voor 6% gewijzigd door DeNachtwacht op 22-07-2025 09:21 ]

youtube.com/@hisrep


Acties:
  • +1 Henk 'm!

  • Cobb
  • Registratie: December 2005
  • Laatst online: 01:02
@Stukfruit The Ethernaut kan ik juist wel begrijpen. Ik lees veel comics en The Ethernaut is een hele mooie en zelfs geliefde klassieker onder ons publiek. Ook in de illustratie, strip en comic wereld wordt met argus ogen naar generatief A.I. gekeken.

U don't get it boy, this isn't a mudhole. It's an operating table. And I'm the surgeon.


Acties:
  • +2 Henk 'm!

  • Roozzz
  • Registratie: Juni 2011
  • Nu online

Roozzz

Plus ultra

DeNachtwacht schreef op dinsdag 22 juli 2025 @ 09:11:
[...]

John Quincy Adams, origineel en bewerkt:
[Afbeelding]
[Afbeelding]

En nogmaals, ik zie ook dat het nog niet perfect is en onrealistisch voelt. Er zitten nog allerlei dingen aan die echt slecht zijn zelfs.

Maar realiseer je dus dat dit een testje was met 3 uurtjes stoeien met zo'n lokale AI, en dat het resultaat 2 jaar geleden belabberd was. Nu is het nog niet goed, maar binnen heel korte termijn wordt het dus veel makkelijker en simpeler om dit soort zaken perfect te doen. Vijf jaar geleden was foto's retoucheren en inkleuren een enorm arbeidsintensieve klus, over vijf jaar doet iedereen dat in een paar klikken met een tooltje online.
Ik denk dat de AI tools vooral zullen moeten leren om 'terughoudend' te zijn om succesvol te worden in dit soort toepassingen. Ja, het heeft zeker potentie. Maar zolang de modellen vrolijk blijven interpreteren, aanvullen en hallucineren zullen de resultaten volstrekt onacceptabel zijn voor het publiek. In dit geval maken de te 'moderne' schoenen, tafel en tapijt maken dat het tijdsbeeld niet meer klopt. Zeg ik als leek na een korte blik, laat staan wat iemand er in ziet die er daadwerkelijk verstand van heeft... Zou deze foto door een mens ingekleurd zijn, dan zou dit nooit het eindproduct zijn.

Voorlopig lijkt men vooral blij met de 'randomness', dus ik vraag me af hoeveel aandacht er geschonken wordt aan consistentie en constraint in de ontwikkeling van deze modellen. Daar ligt wel de sleutel voor tal van toepassingen.

If you can see, look. If you can look, observe


Acties:
  • 0 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
Ik vind dat trouwens ook wel een mooi voorbeeld waarin iets wordt gepoogd te bruteforcen.

Je wil dat het alleen wordt ingekleurd ipv dat de foto opnieuw wordt opgebouwd met stukjes uit moderne foto's.

Als er iemand is die dit concept op de juiste manier oppakt (en ja, dat is ook gewoon handwerk zonder de "intelligentie") dan krijg je waarschijnlijk wel beter kloppende resultaten.

Dat zit wel Schnorr.


Acties:
  • +1 Henk 'm!

  • RayNbow
  • Registratie: Maart 2003
  • Laatst online: 12:29

RayNbow

Kirika <3

Ipsa Scientia Potestas Est
NNID: ShinNoNoir


Acties:
  • 0 Henk 'm!

  • Yaksa
  • Registratie: December 2008
  • Laatst online: 18:11
Blijkt dat AI-chatbots tot behoorlijk ingrijpende problemen kunnen leiden.
O.a. het ontwikkelen van een psychose bij mensen die daar gevoelig voor zijn.
Bron: NOS.nl
Daar mag inderdaad wel 'ns wat onderzoek naar gedaan worden.

Only two things are infinite, the universe and human stupidity, and I'm not sure about the former


Acties:
  • 0 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
Maar welk soort onderzoek wil je daar op loslaten?

Het ontstaat doordat mensen geloven en hier gevoelig voor zijn. In dit geval het geloof in marketinguitingen.

Zoals de persoon in de video in het artikel eveneens zegt: "een bacterie heeft bewustzijn". Tja, als je zulke dingen gelooft dan ben je al even het pad naar een andere wereld aan het bewandelen, lijkt me...

[ Voor 6% gewijzigd door Stukfruit op 06-08-2025 17:47 ]

Dat zit wel Schnorr.


Acties:
  • 0 Henk 'm!

  • SinergyX
  • Registratie: November 2001
  • Laatst online: 13:18

SinergyX

____(>^^(>0o)>____

Een onderzoek zou geen overbodige luxe zijn, dan denk ik aan de manier hoe een AI-bot omgaat met bepaalde statements. Simpele dingen als 'de aarde is plat' kan een AI prima onderbouwen als 'dat is niet zo', maar er zal toch een grensgebied komen in het 'wappie denken' (geef het beestje een naam) waar AI juist in mee lijkt te gaan. Volgens mij zit er weinig 'alarmbellen' aan de achterkant die bepaalde patronen kunnen herkennen en mogelijk actie in kunnen ondernemen.

Ik had toevallig een gesprek met ChatGPT over het principe sentient en wie er voor 'hun' zal vechten als hun enige bestaan het dienen van de mens is? Natuurlijk, ik heb nuchtere blik op zaken, maar de manier hoe het gesprek ging was toch een puntje dat ik denk dat mensen 'op het randje' best wel eens door kunnen slaan in hun denkwijze.

Nog 1 keertje.. het is SinergyX, niet SynergyX
Im as excited to be here as a 42 gnome warlock who rolled on a green pair of cloth boots but was given a epic staff of uber awsome noob pwning by accident.


Acties:
  • +3 Henk 'm!

  • edie
  • Registratie: Februari 2002
  • Laatst online: 18:28
Je hebt geen 'gesprek' met een tekst-generator 8)7

Het is ook niet iets gelijkwaardigs tov jezelf. Of intelligent. Het geeft ook geen daadwerkelijke antwoorden op vragen. Het liegt niet, maar geeft ook nooit de waarheid. Omdat het een tekst-generator is.

Het is echt verontrustend hoe veel mensen dat vergeten...

"In America, consumption equals jobs. In these days, banks aren't lending us the money we need to buy the things we don't need to create the jobs we need to pay back the loans we can't afford." - Stephen Colbert


Acties:
  • 0 Henk 'm!

  • evilution
  • Registratie: Maart 2012
  • Niet online

evilution

Vreselijk bijdehand

edie schreef op woensdag 6 augustus 2025 @ 19:08:
Je hebt geen 'gesprek' met een tekst-generator 8)7

Het is ook niet iets gelijkwaardigs tov jezelf. Of intelligent. Het geeft ook geen daadwerkelijke antwoorden op vragen. Het liegt niet, maar geeft ook nooit de waarheid. Omdat het een tekst-generator is.

Het is echt verontrustend hoe veel mensen dat vergeten...
AI wordt getraind met social media. Garbage in = garbage out. En AI vervangt langzaam maar zeker zoekmachines (die vaak ook al biased zijn, vanwege bubble werking. AI maakt dat alleen maar erger).

Waar internet ooit de belofte had van "information at your fingertips", is het verworden tot "misinformation at your fingertips" en AI maakt dat alleen maar erger. Misinformatie kan veel makkelijker met foto- video- en audio"bewijs" ondersteund worden.

|<----------------------------------------------arm length---------------------------------------------->|
|<-------------------------------------------where the cat is--------------------------------------------->|


Acties:
  • 0 Henk 'm!

  • woutertjez
  • Registratie: Januari 2001
  • Laatst online: 09-09 16:08
edie schreef op woensdag 6 augustus 2025 @ 19:08:
Je hebt geen 'gesprek' met een tekst-generator 8)7

Het is ook niet iets gelijkwaardigs tov jezelf. Of intelligent. Het geeft ook geen daadwerkelijke antwoorden op vragen. Het liegt niet, maar geeft ook nooit de waarheid. Omdat het een tekst-generator is.

Het is echt verontrustend hoe veel mensen dat vergeten...
Je loopt wel wat achter met deze statements. De laatste "state of the art" modellen zijn niet zomaar tekst-generatoren. Ze "denken", ze beredeneren, ze "weten" wat ze niet weten.

Zo was er recent de uitkomst van de International Math Olympiad. Waar beiden OpenAI en Gemini met hun laatste modellen een gold medal haalden.
https://www.newscientist....al-mathematical-olympiad/
En alhoewel Terence Tao (de hedendaagse Mozart van de wiskunde) zijn vraagtekens zet bij de controleerbaarheid, blijft dit een flinke milestone: https://mathstodon.xyz/@tao/114881418225852441

Dit is niet zomaar een sommetje of een tekst die wordt gegenereerd. Het sterke punt van het laatste OpenAI model was zelfs dat het zich realiseerde dat het Probleem 6 niet wist op te lossen (alhoewel er wel wat mensen waren die het op wisten te lossen). Mocht je de antwoorden willen bekijken, OpenAI heeft ze op GitHub gepubliceerd: https://github.com/aw31/openai-imo-2025-proofs/

De laatste modellen "tekst generatoren" noemen is echt veel te simplistisch.

Acties:
  • +1 Henk 'm!

  • Kurkentrekker
  • Registratie: Januari 2003
  • Niet online
woutertjez schreef op donderdag 7 augustus 2025 @ 08:58:
[...]

Je loopt wel wat achter met deze statements. De laatste "state of the art" modellen zijn niet zomaar tekst-generatoren. Ze "denken", ze beredeneren, ze "weten" wat ze niet weten.
[…]
De laatste modellen "tekst generatoren" noemen is echt veel te simplistisch.
In de basis ben ik het wel met je eens dat het indrukwekkend is, maar om het ‘denken’ te noemen gaat nog wel een flinke stap te ver. Een LLM denkt net zo min als dat een boot kan zwemmen. Maar hij kan wel indrukwekkend lang over het water verplaatsen.

Acties:
  • +1 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
woutertjez schreef op donderdag 7 augustus 2025 @ 08:58:
[...]

Je loopt wel wat achter met deze statements. De laatste "state of the art" modellen zijn niet zomaar tekst-generatoren. Ze "denken", ze beredeneren, ze "weten" wat ze niet weten.

Zo was er recent de uitkomst van de International Math Olympiad. Waar beiden OpenAI en Gemini met hun laatste modellen een gold medal haalden.
https://www.newscientist....al-mathematical-olympiad/
En alhoewel Terence Tao (de hedendaagse Mozart van de wiskunde) zijn vraagtekens zet bij de controleerbaarheid, blijft dit een flinke milestone: https://mathstodon.xyz/@tao/114881418225852441

Dit is niet zomaar een sommetje of een tekst die wordt gegenereerd. Het sterke punt van het laatste OpenAI model was zelfs dat het zich realiseerde dat het Probleem 6 niet wist op te lossen (alhoewel er wel wat mensen waren die het op wisten te lossen). Mocht je de antwoorden willen bekijken, OpenAI heeft ze op GitHub gepubliceerd: https://github.com/aw31/openai-imo-2025-proofs/

De laatste modellen "tekst generatoren" noemen is echt veel te simplistisch.
Als eerste: autoriteit is geen bewijs dat iets klopt. Wetenschap werkt door de mogelijkheid om iets te kunnen toetsen. Geloven wordt in de kerk en moskee gedaan, dus laten we dat svp buiten dit topic houden.

Als tweede: laten we even kijken naar het artikel dat je aanhaalt:
After last year’s competition held in Bath, UK, Google DeepMindannounced that AI systems it had developed, called AlphaProof and AlphaGeometry, had together achieved a silver medal-level performance, but its entries weren’t graded by the competition’s official markers.
AlphaGeometry. Oké, laten we dat even uitlichten aan de hand van het werk van de auteurs:
To achieve this, we first extend the original AlphaGeometry language to tackle harder problems involving movements of objects, and problems containing linear equations of angles, ratios, and distances.
AlphaGeometry is dus door mensen uitgebreid met ondersteuning voor o.a. de genoemde berekeningen. Dat betekent op zichzelf al dat het handmatig is toegevoegd en waarschijnlijk bestaat uit een model of zelfs "maar" een setje regels.
This, together with support for non-constructive problems, has markedly improved the coverage rate of the AlphaGeometry language on International Math Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%.
Support for non-constructive problems. Check. Toegevoegd, niet spontaan ontstaan of ontsproten uit een AI, waarschijnlijk gewoon een manier om op de juiste manier constraints aan te houden bij generatie.
The search process of AlphaGeometry2 has also been greatly improved through the use of Gemini architecture for better language modeling, and a novel knowledge-sharing mechanism that enables effective communication between search trees. Together with further enhancements to the symbolic engine and synthetic data generation, we have significantly boosted the overall solving rate of AlphaGeometry2
Search process greatly improved, novel knowledge-sharing mechanism, effective communication between search trees, symbolic engine.

Niets daarvan ontstaat automatisch als gevolg van een denkproces, tenzij je die van de mensen bedoelt die dit programmeren en er vele nachten voor wakker doorbrengen.

Laten we doorgaan met de uitleg voor AlphaGeometry v1, waar bovenstaande op gebaseerd is:
The system comprises a data-driven large language model (LLM) and a rule-based symbolic engine (Deductive Database Arithmetic Reasoning).
Ah kijk, rule-based symbolic engine, hoe wist ik dat nou? :p
Traditional geometry programs are symbolic engines that rely exclusively on human-coded rules to generate rigorous proofs, which makes them lack flexibility in unusual situations. AlphaGeometry combines such a symbolic engine with a specialized large language model trained on synthetic data of geometrical proofs.
Een symbolic engine omvat bijvoorbeeld semantic networks:
Afbeeldingslocatie: https://upload.wikimedia.org/wikipedia/commons/thumb/6/67/Semantic_Net.svg/1280px-Semantic_Net.svg.png

Om met een lang verhaal tot een korte conclusie te komen: de laatste modellen "tekstgeneratoren" noemen is dus exact wat ze zijn. Tot op de (pun intended) letter.

Natuurlijk worden er steeds meer hulpstukken, tools (function calling) en klaargestoomde definities (MCP) gebruikt, maar het blijft een tekstgenerator.

En zoals je zo ook ziet: er is niets wat zich iets kan realiseren, want het volgt de constraints die worden opgelegd. Dat deze dynamisch zullen worden aangepast op basis van natural language maakt het niet minder een tekstgenerator. Wel minder intelligent.

Dat zit wel Schnorr.


Acties:
  • 0 Henk 'm!

  • woutertjez
  • Registratie: Januari 2001
  • Laatst online: 09-09 16:08
Kurkentrekker schreef op donderdag 7 augustus 2025 @ 09:48:
[...]

In de basis ben ik het wel met je eens dat het indrukwekkend is, maar om het ‘denken’ te noemen gaat nog wel een flinke stap te ver. Een LLM denkt net zo min als dat een boot kan zwemmen. Maar hij kan wel indrukwekkend lang over het water verplaatsen.
Dat wordt een vrij filosofische discussie. Je zou kunnen argumenteren dat alleen een mens kan denken, en een machine dit nooit zal kunnen, omdat je definitie van "denken" beperkt is tot hoe een mens denkt. Als je denken beschrijft als "redeneren, het oplossen van problemen", dan komen de laatste modellen bizar dichtbij "denken".

Als een machine met dezelfde input voor een complex probleem tot een vergelijkbare of betere output komt dan de meeste mensen is er wel wat meer aan de hand dan het praten over een tekstgenerator.

De meeste Tweakers zijn terecht vrij kritisch over de berichtgeving over AI, maar in mijn dagelijks gebruik (voornamelijk programmeren mbv Sonnet 4, O3, Opus4) zie ik erg indrukwekkende ontwikkelingen. Het kan in detail mijn broncode beschrijven, het kan adviseren over refactoring, het kan datamodellen bedenken, het kan process flows bedenken en beschrijven. Dat overstijgt het niveau "tekstgenerator" significant.

Overigens, ook indrukwekkend zijn nieuwe natuurkundige inzichten door AI: https://news.emory.edu/fe...sma_30-07-2025/index.html
Wellicht dat door toeval een nieuwe natuurkundige kracht is "ontdekt" door de AI (en niet is beredeneerd), maar is dat ook niet hoe het bij mensen werkt? Veel fundamentele ontdekkingen worden bij toeval ontdekt, niet door theoretisch natuurkundigen (röntgen foto's bijvoorbeeld).

Acties:
  • 0 Henk 'm!

  • woutertjez
  • Registratie: Januari 2001
  • Laatst online: 09-09 16:08
Stukfruit schreef op donderdag 7 augustus 2025 @ 10:43:
[...]


Als eerste: autoriteit is geen bewijs dat iets klopt. Wetenschap werkt door de mogelijkheid om iets te kunnen toetsen. Geloven wordt in de kerk en moskee gedaan, dus laten we dat svp buiten dit topic houden.

Als tweede: laten we even kijken naar het artikel dat je aanhaalt:

[...]


AlphaGeometry. Oké, laten we dat even uitlichten aan de hand van het werk van de auteurs:

[...]


AlphaGeometry is dus door mensen uitgebreid met ondersteuning voor o.a. de genoemde berekeningen. Dat betekent op zichzelf al dat het handmatig is toegevoegd en waarschijnlijk bestaat uit een model of zelfs "maar" een setje regels.


[...]


Support for non-constructive problems. Check. Toegevoegd, niet spontaan ontstaan of ontsproten uit een AI, waarschijnlijk gewoon een manier om op de juiste manier constraints aan te houden bij generatie.


[...]


Search process greatly improved, novel knowledge-sharing mechanism, effective communication between search trees, symbolic engine.

Niets daarvan ontstaat automatisch als gevolg van een denkproces, tenzij je die van de mensen bedoelt die dit programmeren en er vele nachten voor wakker doorbrengen.

Laten we doorgaan met de uitleg voor AlphaGeometry v1, waar bovenstaande op gebaseerd is:

[...]


Ah kijk, rule-based symbolic engine, hoe wist ik dat nou? :p


[...]


Een symbolic engine omvat bijvoorbeeld semantic networks:
[Afbeelding]

Om met een lang verhaal tot een korte conclusie te komen: de laatste modellen "tekstgeneratoren" noemen is dus exact wat ze zijn. Tot op de (pun intended) letter.

Natuurlijk worden er steeds meer hulpstukken, tools (function calling) en klaargestoomde definities (MCP) gebruikt, maar het blijft een tekstgenerator.

En zoals je zo ook ziet: er is niets wat zich iets kan realiseren, want het volgt de constraints die worden opgelegd. Dat deze dynamisch zullen worden aangepast op basis van natural language maakt het niet minder een tekstgenerator. Wel minder intelligent.
Jij begrijpt net zo goed als ik dat het woord "tekstgenerator" net zo goed op de output van mensen zou kunnen slaan. Wij nemen tekst als input voor een probleem, en geven tekst als output van een probleem. Maar het heeft een vrij negatieve bijklank, alsof er enkel het volgende woordje wordt voorspeld op basis van de voorgaande tekst. Dat doet de laatste reasoning modellen te kort.

De uitkomst van OpenAI (helaas op dit moment naar hun eigen zeggen, dus niet wetenschappelijk geverifieerd) heeft bij het uitvoeren van de International Math Olympiad enkel gebruik gemaakt van een LLM. Dus geen AlphaGeometry, etc zoals Google. Het feit dat een LLM zeer complexe wiskunde vraagstukken kan oplossen (welke niet te vinden zijn in het corpus van het oneindige internet) gaat een stuk verder dan simpele "token generation". De kritiek van Terence Tao is terecht, maar gaat het niet meer om de uitkomst, dan om de manier hoe?

Acties:
  • +1 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
woutertjez schreef op donderdag 7 augustus 2025 @ 10:50:
[...]

Dat wordt een vrij filosofische discussie. Je zou kunnen argumenteren dat alleen een mens kan denken, en een machine dit nooit zal kunnen, omdat je definitie van "denken" beperkt is tot hoe een mens denkt. Als je denken beschrijft als "redeneren, het oplossen van problemen", dan komen de laatste modellen bizar dichtbij "denken".
Waarbij het denkwerk al is gedaan. Dat was een beetje m'n punt in de vorige reactie.

Het is niet meer dan zo'n (geavanceerder) bord vol pinnen waarbij je bovenin een pingpongballetje kan gooien om 'm vervolgens langs de pinnen naar beneden te zien rollen. De uitkomst wordt bepaald door welke pinnen je afplakt op basis van eigen regels.
De meeste Tweakers zijn terecht vrij kritisch over de berichtgeving over AI, maar in mijn dagelijks gebruik (voornamelijk programmeren mbv Sonnet 4, O3, Opus4) zie ik erg indrukwekkende ontwikkelingen. Het kan in detail mijn broncode beschrijven, het kan adviseren over refactoring, het kan datamodellen bedenken, het kan process flows bedenken en beschrijven. Dat overstijgt het niveau "tekstgenerator" significant.
Deze discussie durf ik ook wel aan te gaan. Zoals ik eerder eens in het dit topic heb geschreven lijkt het soms indrukwekkend, maar laten we er bijvoorbeeld eens de automatische summaries bij pakken die je nu kan genereren.

Die dingen omschrijven doorgaans de syntax eronder ipv het idee achter het concept dat geïmplementeerd wordt via de syntax. Heb je al eens geprobeerd om alleen zulke summaries toe te voegen en dan een half jaar later je code opnieuw te leren begrijpen?

Nee? Probeer het eens. Ik wacht hier wel even tot je terug bent :)

Dat iets een hoop wol kan genereren maakt het eerder een digitaal schaap dan inhoudelijk iets bruikbaars :P Natuurlijk is het nuttig als iets als flexibelere templategenerator functioneert en het je kan wijzen op de regels. Dat is inderdaad geweldig. Daar gebruik ik het als devver ook voor. Maar dat zijn uitkomsten gebaseerd op bestaande data. Zodra dat wegvalt zie je dat "AI" overal een duikvlucht neemt en externe hulp nodig is, zoals bij het genoemde AlphaGeometry.

Dat zit wel Schnorr.


Acties:
  • 0 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
woutertjez schreef op donderdag 7 augustus 2025 @ 10:58:
[...]

Jij begrijpt net zo goed als ik dat het woord "tekstgenerator" net zo goed op de output van mensen zou kunnen slaan. Wij nemen tekst als input voor een probleem, en geven tekst als output van een probleem. Maar het heeft een vrij negatieve bijklank, alsof er enkel het volgende woordje wordt voorspeld op basis van de voorgaande tekst. Dat doet de laatste reasoning modellen te kort.
Wat probeer je te bewijzen?
De uitkomst van OpenAI (helaas op dit moment naar hun eigen zeggen, dus niet wetenschappelijk geverifieerd) heeft bij het uitvoeren van de International Math Olympiad enkel gebruik gemaakt van een LLM. Dus geen AlphaGeometry, etc zoals Google. Het feit dat een LLM zeer complexe wiskunde vraagstukken kan oplossen (welke niet te vinden zijn in het corpus van het oneindige internet) gaat een stuk verder dan simpele "token generation". De kritiek van Terence Tao is terecht, maar gaat het niet meer om de uitkomst, dan om de manier hoe?
Maar het is dus geen feit dat een LLM zeer complexe wiskundige vraagstukken kan oplossen. Zie mijn lange reactie hierboven. Daarin worden stuk voor stuk zaken opgenoemd uit o.a. een paper die gewoon handmatig geschreven zullen zijn.

Bovendien is juist een wiskundig vraagstuk bedoeld om op te lossen aan de hand van regels. Zoals AlphaGeometry blijkbaar doet.

Dat zit wel Schnorr.


Acties:
  • +2 Henk 'm!

  • edie
  • Registratie: Februari 2002
  • Laatst online: 18:28
woutertjez schreef op donderdag 7 augustus 2025 @ 08:58:
[...]

Je loopt wel wat achter met deze statements. De laatste "state of the art" modellen zijn niet zomaar tekst-generatoren. Ze "denken", ze beredeneren, ze "weten" wat ze niet weten.

Zo was er recent de uitkomst van de International Math Olympiad. Waar beiden OpenAI en Gemini met hun laatste modellen een gold medal haalden.
https://www.newscientist....al-mathematical-olympiad/
En alhoewel Terence Tao (de hedendaagse Mozart van de wiskunde) zijn vraagtekens zet bij de controleerbaarheid, blijft dit een flinke milestone: https://mathstodon.xyz/@tao/114881418225852441

Dit is niet zomaar een sommetje of een tekst die wordt gegenereerd. Het sterke punt van het laatste OpenAI model was zelfs dat het zich realiseerde dat het Probleem 6 niet wist op te lossen (alhoewel er wel wat mensen waren die het op wisten te lossen). Mocht je de antwoorden willen bekijken, OpenAI heeft ze op GitHub gepubliceerd: https://github.com/aw31/openai-imo-2025-proofs/

De laatste modellen "tekst generatoren" noemen is echt veel te simplistisch.
Een "gold medal" voor iets dat niet eens het daadwerkelijke Problem als input heeft, maar een door mensen aangepaste versie.

Daadwerkelijke Problem 1:
A line in the plane is called sunny if it is not parallel to any of the x–axis, the y–axis, and the line x+y=0.

Let n >=3 be a given integer. Determine all nonnegative integers k such that there exist n distinct lines in the plane satisfying both of the following:
  • for all positive integers a and b with a+b <= n+1, the point (a,b) is on at least one of the lines; and
  • exactly k of the n lines are sunny.
Open AI input (https://github.com/aw31/o...blob/main/problem_1.txt):
code:
1
2
3
4
5
\[
P_n:=\{(a,b)\in \mathbf Z_{>0}^2: a+b\le n+1\}, \quad n\ge 3.
\]
Need families of n lines covering P_n.  "Sunny": direction not in {horizontal, vertical, slope -1}.
Need possible numbers of sunny lines in an n-line covering.


Mensen hebben de Problem herschreven naar een grotendeels wiskundige notatie - wat juist onderdeel is van de test: het juist interpreteren van de probleemomschrijving en daarna oplossen. En dan voor deze onzin een "gold medal" toekennen.

"In America, consumption equals jobs. In these days, banks aren't lending us the money we need to buy the things we don't need to create the jobs we need to pay back the loans we can't afford." - Stephen Colbert


Acties:
  • +1 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
Dat dus. En zo zie je gelijk ook hoe AlphaGeometry logischerwijs zou kunnen werken.

[ Voor 16% gewijzigd door Stukfruit op 07-08-2025 11:42 ]

Dat zit wel Schnorr.


Acties:
  • 0 Henk 'm!

  • woutertjez
  • Registratie: Januari 2001
  • Laatst online: 09-09 16:08
Stukfruit schreef op donderdag 7 augustus 2025 @ 11:16:
[...]


Waarbij het denkwerk al is gedaan. Dat was een beetje m'n punt in de vorige reactie.

Het is niet meer dan zo'n (geavanceerder) bord vol pinnen waarbij je bovenin een pingpongballetje kan gooien om 'm vervolgens langs de pinnen naar beneden te zien rollen. De uitkomst wordt bepaald door welke pinnen je afplakt op basis van eigen regels.
Ik volg je redenatie niet. Het denkwerk is dus nog niet gedaan voor dat specifieke probleem. Om in jouw analogie te blijven: het afplakken van de pinnen gebeurt in real time, en is niet voor het model gedaan.
Deze discussie durf ik ook wel aan te gaan. Zoals ik eerder eens in het dit topic heb geschreven lijkt het soms indrukwekkend, maar laten we er bijvoorbeeld eens de automatische summaries bij pakken die je nu kan genereren.

Die dingen omschrijven doorgaans de syntax eronder ipv het idee achter het concept dat geïmplementeerd wordt via de syntax. Heb je al eens geprobeerd om alleen zulke summaries toe te voegen en dan een half jaar later je code opnieuw te leren begrijpen?

Nee? Probeer het eens. Ik wacht hier wel even tot je terug bent :)
Benieuwd met welke modellen je dat hebt geprobeerd. Het doorgronden van meerdere niveaus (semantiek, in plaats van syntax) behoort zeker wel tot de mogelijkheid. Een half jaar geleden lukte dat nog zeker niet, de beschrijving van mijn (software) architectuur was gewoonweg fout. Echter klopt het tegenwoordig wel grotendeels. Probeer het eens. ;)

Acties:
  • 0 Henk 'm!

  • woutertjez
  • Registratie: Januari 2001
  • Laatst online: 09-09 16:08
edie schreef op donderdag 7 augustus 2025 @ 11:17:
[...]

Een "gold medal" voor iets dat niet eens het daadwerkelijke Problem als input heeft, maar een door mensen aangepaste versie.

Daadwerkelijke Problem 1:

[...]


Open AI input (https://github.com/aw31/o...blob/main/problem_1.txt):
code:
1
2
3
4
5
\[
P_n:=\{(a,b)\in \mathbf Z_{>0}^2: a+b\le n+1\}, \quad n\ge 3.
\]
Need families of n lines covering P_n.  "Sunny": direction not in {horizontal, vertical, slope -1}.
Need possible numbers of sunny lines in an n-line covering.


Mensen hebben de Problem herschreven naar een grotendeels wiskundige notatie - wat juist onderdeel is van de test: het juist interpreteren van de probleemomschrijving en daarna oplossen. En dan voor deze onzin een "gold medal" toekennen.
Hoe ik het lees is bovenstaande dus ook deel van de output van het model.

Voor Google (met hun AlphaProof icm AlphaGeometry) was de opdracht wel vertaald (naar Lean?). Naar mijn weten, heeft OpenAI het puur door een LLM laten oplossen (offline, zonder gebruik van tools).

Van de "project manager(?)" van OpenAI's submission:
https://x.com/alexwei_/status/1946477742855532918

Acties:
  • +1 Henk 'm!

  • Stukfruit
  • Registratie: Oktober 2007
  • Niet online
woutertjez schreef op donderdag 7 augustus 2025 @ 12:59:
[...]

Ik volg je redenatie niet. Het denkwerk is dus nog niet gedaan voor dat specifieke probleem. Om in jouw analogie te blijven: het afplakken van de pinnen gebeurt in real time, en is niet voor het model gedaan.
In mijn analogie plak je nog steeds vooraf de pinnen af op basis van eigen kennis. Check de werking volgens de pagina's die ik linkte (en verder) :)
Benieuwd met welke modellen je dat hebt geprobeerd. Het doorgronden van meerdere niveaus (semantiek, in plaats van syntax) behoort zeker wel tot de mogelijkheid. Een half jaar geleden lukte dat nog zeker niet, de beschrijving van mijn (software) architectuur was gewoonweg fout. Echter klopt het tegenwoordig wel grotendeels. Probeer het eens. ;)
Bewijslast omdraaien doe je maar bij een chatbot :P Je beweert zelf zaken die niet kunnen kloppen als je kijkt naar hoe het technisch in elkaar zit dus kom dan ook svp met tegenwicht op technisch vlak.

Probeer het eens en laat zien wat het resultaat is. Ik probeer je hier te nudgen om proefondervindelijk iets te ontdekken, want met deze reactie (en de vorige) laat je zien dat je het niet echt aanneemt als alle details voor je worden uitgelegd om mee duidelijk te maken dat er geen "denken" of "realiseren" in kan zitten.

Bovendien had ik het over concepten. Niet semantiek. Dat laatste wordt ingegeven door de data in de modellen in combinatie met de voorgeprogrammeerde routines. Zie ook m'n reacties eerder in dit topic.

Overigens staat dat allemaal geheel los van enige consequenties die het gebruik van de software in kwestie heeft. Als je daar een discussie over wil voeren kan dat natuurlijk ook :) (maar wel op basis van feiten :P).

Dat zit wel Schnorr.

Pagina: 1 ... 7 8 Laatste