Artikel: nieuws: Microsoft brengt twee nieuwe versies van taalmodel Phi-4 uit
Auteur: @EvelineM
De uitleg over taalmodellen klopt hier niet.
In generatieve taalmodellen is het de norm dat enkel de linkercontext gebruikt wordt. In encoder-modellen is dat niet zo.
Auteur: @EvelineM
De uitleg over taalmodellen klopt hier niet.
Het onderscheid tussen encoder en decoder modellen is inderdaad hoe informatie verwerkt/gegenereerd wordt. Alle bekende huidige generatieve modellen doen dat autoregressief, dat wil zeggen van links naar rechts, waar elk nieuw token dus enkel de linker context kan meenemen. Encoder-modellen (zoals BERT en afgeleiden, meer bedoeld voor klassificatie) nemen wel de hele context mee, maar zijn niet bedoeld voor generatie. (Je hebt ook nog encoder-decoder modellen, maar die laten we buiten beschouwing.)Deze versie bevat een decoder-only transformer, die anders werkt dan veel andere taalmodellen. Normaal gesproken wordt de tekst voor en na een woord geanalyseerd om de betekenis ervan te begrijpen. Maar de Phi-4mini analyseert alleen de tekst die voorafgaat aan een woord om de betekenis te bepalen. Daardoor is minder krachtige hardware nodig en is de verwerkingssnelheid hoger, stelt Microsoft.
In generatieve taalmodellen is het de norm dat enkel de linkercontext gebruikt wordt. In encoder-modellen is dat niet zo.