Alibaba brengt Qwen3-AI-taalmodel uit

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • djwice
  • Registratie: September 2000
  • Niet online
Artikel: nieuws: Alibaba brengt Qwen3-AI-taalmodel uit
Auteur: @Andrei Stiru
Het grootste model, Qwen-3-235B-A22B, presteert volgens interne benchmarks beter dan OpenAI's o3-mini en Google's Gemini 2.5 Pro op programmeerplatform Codeforces. Het publiek beschikbare Qwen3-32B-model kan zich volgens het bedrijf meten met AI-modellen als DeepSeeks R1.
Suggereert dat Qwen3-235B-A22B niet publiek beschikbaar is, maar dat is het wel:
https://huggingface.co/co...-67dd247413f0e2e4f653967f
=>
https://huggingface.co/Qwen/Qwen3-235B-A22B
=>
https://huggingface.co/Qwen/Qwen3-235B-A22B/tree/main

Let overigens op de dash - volgens mij hoort die niet voor de 3 in Qwen-3-235B-A22B => Qwen3-235B-A22B

modelnaam: Qwen3
parameters intern: 235 miljard (en: billion , vandaar de B postfix)
parameters actief (=extern beschikbaar): 22 miljard (vandaar de A prefix)

Daarom - tekens tussen de verschillende onderdelen en niet in de namen.

[ Voor 12% gewijzigd door djwice op 01-05-2025 08:53 ]

Mijn LEGO MOC's met PDF bouwinstructies en stop-motion animaties vind je op https://rebrickable.com/users/BrickDesignerNL/mocs/


Acties:
  • 0 Henk 'm!

  • djwice
  • Registratie: September 2000
  • Niet online
@arnoudwokke Ik zie dat er nog niets gedaan is met bovenstaande feedback (o.a. spelling van model naam met minnetje), kun jij kijken of @Andrei Stiru bereikbaar is of anders iemand het over kan nemen?

Mijn LEGO MOC's met PDF bouwinstructies en stop-motion animaties vind je op https://rebrickable.com/users/BrickDesignerNL/mocs/