Onderzoeksbedrijf: DeepSeek R1-model heeft meer geld gekost…

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • mOrPhie
  • Registratie: September 2000
  • Laatst online: 18-09 15:41

mOrPhie

❤️❤️❤️❤️🤍

Topicstarter
Artikel: nieuws: Onderzoeksbedrijf: DeepSeek R1-model heeft meer geld gekost om te tra...
Auteur: @JayStout

Ik heb al een paar keer gezien dat Tweakers DeepSeek V3 en R1 door elkaar haalt. DeepSeek heeft nooit gezegd dat R1 5,6 miljoen dollar kostte om te trainen. Dat hebben ze gezegd over V3. V3 performt ongeveer zo goed als GPT-4o. Het is R1 dat zo goed presteert als o1, maar over R1 heeft DeepSeek geen cijfers uitgebracht. In alle gevallen gaat het om het grootste model en niet om de dense distilled versies.

Bronnen:

Kosten van V3:
https://arxiv.org/pdf/2412.19437
DeepSeek-V3 costs only 2.788M GPU hours for its full training. Assuming the rental price of
the H800 GPU is $2 per GPU hour, our total training costs amount to only $5.576M.
Performance-verschil V3 vs R1:
https://github.com/deepse...blob/main/DeepSeek_R1.pdf

Overigens staat dit allemaal ook in het bronartikel van het Tweakers-artikel:
https://semianalysis.com/...-v3%e2%80%99s-performance
Dit geeft wel aan dat ik me afvraag of jullie de bron goed hebben bestudeerd voordat het artikel is geschreven.

Een experimentele community-site: https://technobabblenerdtalk.nl/. DM voor invite code.


Acties:
  • 0 Henk 'm!

  • HallonRubus
  • Registratie: Mei 2011
  • Laatst online: 21:05
De titel is gewoon clickbait en in de lead wordt al iets anders gesteld ('Volgens het analysebureau geeft DeepSeek enkel het kostenplaatje van de officiële training vrij, zonder de aanverwante kosten te hebben vermeld.')

De titel zou eerder iets in de trant moeten zijn van:

Onderzoeksbedrijf schat totale investeringskosten DeepSeek R1-model in op 1,6 miljard dollar


Acties:
  • 0 Henk 'm!

  • mOrPhie
  • Registratie: September 2000
  • Laatst online: 18-09 15:41

mOrPhie

❤️❤️❤️❤️🤍

Topicstarter
Wel jammer dat blijkbaar geen enkele redacteur hierop wil reageren. Het artikel is nu al de hele dag online en heeft inmiddels 120 reacties.

Een experimentele community-site: https://technobabblenerdtalk.nl/. DM voor invite code.


Acties:
  • +1 Henk 'm!

  • TijsZonderH
  • Registratie: Maart 2012
  • Laatst online: 21:38

TijsZonderH

Nieuwscoördinator
Ai je hebt gelijk! Ik heb het aangepast en er een update bij geplaatst!

Deze handtekening kan worden opgenomen voor trainingsdoeleinden.