🤔

Next-Token-Prediction: Das Herzstück des Modells

Wie Sprachmodelle das nächste Wort vorhersagen

Wie funktioniert die Vorhersage?

Das KI-Modell berechnet Wahrscheinlichkeiten für jedes mögliche nächste Wort

Das Kernstück eines Sprachmodells ist seine Fähigkeit, das nächste Wort in einer Sequenz vorherzusagen. Es berechnet für jeden möglichen Token eine Wahrscheinlichkeit.

Wahrscheinlichkeitsverteilung

Das Modell berechnet Wahrscheinlichkeiten für alle möglichen nächsten Tokens (über 50.000!), aber nur wenige davon haben eine hohe Wahrscheinlichkeit. Die meisten Tokens haben eine Wahrscheinlichkeit nahe Null.

Das Modell kann deterministisch den wahrscheinlichsten Token auswählen oder zufällig einen Token basierend auf seiner Wahrscheinlichkeit auswählen. Bei höherer Zufälligkeit (Temperatur) werden auch weniger wahrscheinliche Tokens manchmal ausgewählt.

Probiere es aus!

Schreibe den Anfang eines Satzes und beobachte echte KI-Vorhersagen

Klicke auf "Nächsten Token vorhersagen", um echte KI-Vorhersagen zu sehen.

Du kannst einzelne Tokens auswählen, um zu sehen, wie das Modell Schritt für Schritt Text generiert. Oder wähle "Zufälliger Token" für eine wahrscheinlichkeitsbasierte Auswahl.