Mijn vraag:
Hoe maak ik een taalmodel beter reagerend in het Nederlands?
Is Nederlands wel goed te doen of beter volledig op Engels overgaan?
Moet ik stug doorgaan met corrigeren voor het lerend deel?
Relevante software en hardware die ik gebruik:
Alles gewist en begin geheel opnieuw.
Wat ik al gevonden of geprobeerd heb:
- Ollama met vele taalmodellen (geen specifieke Nederlandse modellen).
- Prompt gedreven basis gedrag. (ook met jailbraiks, wat goed helpt)
- PostgrSQL met 3 laags geheugen:
1. Korte termijn chats (40 max)
2. Middel termijn (Samenvattingen van chats, projecten, over de dag van alle chats)
3. Vaste feiten, voorkeuren, relaties en etc.
- Zelf "lerend" door confidense met timestamps.
- Vele variaties op Temp. Top_p, Num_pred, repeat_pen en num_ctx.
- Rol keuze op basis van vraag (bepaald welk model reageert)
- Prompt variaties tussen: je mag nooit, je moet, je bent, de gebruiker wil graag (en combinaties onderling).
- Uitgebreide few-shot promting (voorbeelden van hoe het kan reageren)
Conclusie
Het systeem van zichzelf werkt prima, maar de Nederlandse antwoorden blijven heel slecht. Je ziet harde vertaling van Engelse zinnen en daardoor ook combinaties van onlogisch woord gebruik. Ondanks het zelflerend gedeelte, waar ik kan aangeven dat de zin niet klopt (wat het wel oppakt en meeneemt), blijft er een eindeloze stroom van nieuwe rare zinnen komen in het geheel. Alleen met een heel laag num_pred gaat het nog redelijk, maar dat is niet gewenst voor mijn doel (Dagelijkse chat partner met groot geheugen over tijd en chats heen).
Mijn vraag:
Hoe maak ik een taalmodel beter reagerend in het Nederlands?
Is Nederlands wel goed te doen of beter volledig op Engels overgaan?
Moet ik stug doorgaan met corrigeren voor het lerend deel?
Bij voorbaat dank.
Hoe maak ik een taalmodel beter reagerend in het Nederlands?
Is Nederlands wel goed te doen of beter volledig op Engels overgaan?
Moet ik stug doorgaan met corrigeren voor het lerend deel?
Relevante software en hardware die ik gebruik:
Alles gewist en begin geheel opnieuw.
| # | Categorie | Product | Prijs | Subtotaal |
|---|---|---|---|---|
| 1 | Processors | AMD Ryzen 9 9900X3D Boxed | € 524,99 | € 524,99 |
| 1 | Moederborden | MSI MAG X870 TOMAHAWK WIFI | € 279,- | € 279,- |
| 1 | Videokaarten | Zotac Gaming GeForce RTX 5070 Ti SOLID SFF OC | € 1.015,79 | € 1.015,79 |
| 1 | Geluidskaarten | Creative Labs Sound BlasterX AE-5 Plus | € 114,95 | € 114,95 |
| 1 | Behuizingen | be quiet! Pure Base 500 Wit | € 59,95 | € 59,95 |
| 1 | Monitors | Samsung S49DG912S Zilver | € 759,- | € 759,- |
| 1 | Processorkoeling | Thermalright Peerless Assassin 120 SE | € 38,90 | € 38,90 |
| 3 | Case fans | be quiet! Pure Wings 3 140mm, 140mm | € 11,95 | € 35,85 |
| 1 | Toetsenborden | Logitech MK295 Silent Wireless Combo (Qwerty US) Wit | € 40,84 | € 40,84 |
| 1 | Muizen | Trust Ozaa+ | € 32,90 | € 32,90 |
| 1 | Geheugen intern | G.Skill Flare X5 F5-6000J2836G32GX2-FX5 | € 939,- | € 939,- |
| 1 | Voedingen | Corsair HX1200i ATX 3.1 | € 235,86 | € 235,86 |
| 1 | Interne ssd's | Samsung 990 EVO Plus 4TB | € 489,- | € 489,- |
| 1 | Interne ssd's | Samsung 9100 Pro, geen heatsink 1TB | € 209,- | € 209,- |
| Bekijk collectie Importeer producten | Totaal | € 5.375,02 | ||
- Ollama met vele taalmodellen (geen specifieke Nederlandse modellen).
- Prompt gedreven basis gedrag. (ook met jailbraiks, wat goed helpt)
- PostgrSQL met 3 laags geheugen:
1. Korte termijn chats (40 max)
2. Middel termijn (Samenvattingen van chats, projecten, over de dag van alle chats)
3. Vaste feiten, voorkeuren, relaties en etc.
- Zelf "lerend" door confidense met timestamps.
- Vele variaties op Temp. Top_p, Num_pred, repeat_pen en num_ctx.
- Rol keuze op basis van vraag (bepaald welk model reageert)
- Prompt variaties tussen: je mag nooit, je moet, je bent, de gebruiker wil graag (en combinaties onderling).
- Uitgebreide few-shot promting (voorbeelden van hoe het kan reageren)
Conclusie
Het systeem van zichzelf werkt prima, maar de Nederlandse antwoorden blijven heel slecht. Je ziet harde vertaling van Engelse zinnen en daardoor ook combinaties van onlogisch woord gebruik. Ondanks het zelflerend gedeelte, waar ik kan aangeven dat de zin niet klopt (wat het wel oppakt en meeneemt), blijft er een eindeloze stroom van nieuwe rare zinnen komen in het geheel. Alleen met een heel laag num_pred gaat het nog redelijk, maar dat is niet gewenst voor mijn doel (Dagelijkse chat partner met groot geheugen over tijd en chats heen).
Mijn vraag:
Hoe maak ik een taalmodel beter reagerend in het Nederlands?
Is Nederlands wel goed te doen of beter volledig op Engels overgaan?
Moet ik stug doorgaan met corrigeren voor het lerend deel?
Bij voorbaat dank.
[ Voor 53% gewijzigd door Basic2me op 25-04-2026 11:39 ]