Laut einer Studie von Amazon Web Services (AWS) AI Labs werden etwa 57,1 Prozent aller Online-Inhalte mit künstlicher Intelligenz (KI) erstellt oder übersetzt. Leider sind die meisten dieser KI-Übersetzungen von sehr geringer Qualität.
Um zu diesem Ergebnis zu kommen, analysierten die Forscher 6,38 Milliarden Sätze aus dem Internet. Obwohl die Arbeit noch nicht von Fachleuten begutachtet wurde, lässt die enorme Zahl der Übersetzungen die Forscher vermuten, dass es Unstimmigkeiten geben könnte. Große Sprachmodelle, die mit Hilfe künstlicher Intelligenz erstellt werden, neigen dazu, sowohl Übersetzungen als auch den Originalinhalt selbst zu produzieren.
Besonders problematisch sind übersetzte Texte in Sprachen mit begrenzten Originalressourcen. Infolgedessen nehmen die von großen Sprachmodellen generierten Inhalte einen erheblichen Teil der verfügbaren Ressourcen in diesen Sprachen in Anspruch. Die Forscher betonen, dass „maschinengenerierte, mehrseitige Parallelübersetzungen … einen großen Teil der gesamten Webinhalte in diesen Sprachen ausmachen“.
Die übermäßige Verwendung einer großen Zahl fehlerhafter und minderwertiger Inhalte könnte die Qualität künftiger KI-Modelle beeinträchtigen. Dieses Problem geht über die Sprachübersetzung hinaus, da das Trainieren von KI-Modellen mit künstlich erzeugten Daten zu einem Verlust an Realismus bei den Ergebnissen führen kann.
Quelle: T3N