We weten dat Google AI traint op de teksten van Reddit. Dat is hoofdzakelijk een Engelstalig forum. Weet iemand of Google ook op Nederlandstalige forums traint (tweakers?).
In de meeste gevallen wordt een generiek model getraind op data die voorhanden is (vaak Engelstalig), en vervolgens wordt er een vertaalmodel overheen gegooid om te converteren naar output voor specifieke landen.
't Het nog nooit, nog nooit zo donker west, of 't wer altied wel weer licht