Die -ehn haeu-i-sten -u-hsta-en i- Deuts-hen -i-den -ereits drei -ierte- des -esa-tte-tes.
Häufigkeiten
In jeder natürlichen Sprache kommen einige Buchstaben häufiger vor als andere. Der häufigste Buchstabe im Deutschen ist das e. In der folgenden Tabelle sind die typischen Häufigkeiten der Buchstaben in deutschen Texten angegeben. (Nach Beutelspacher)
Buchstabe | Häufigkeit | Buchstabe | Häufigkeit |
a | 6,51% | n | 9,78% |
b | 1,89% | o | 2,51% |
c | 3,06% | p | 0,79% |
d | 5,08% | q | 0,02% |
e | 17,40% | r | 7,00% |
f | 1,66% | s | 7,27% |
g | 3,01% | t | 6,51% |
h | 4,76% | u | 4,35% |
i | 7,55% | v | 0,67% |
j | 0,27% | w | 1,89% |
k | 1,21% | x | 0,03% |
l | 3,44% | y | 0,04% |
m | 2,53% | z | 1,13% |
Mit folgendem Applet kannst du die Häufigkeitsverteilung in beliebigen Texten berechnen lassen und mit der typischen Verteilung vergleichen.
Bei Verschlüsselungen, die jeden Klartextbuchstaben immer durch den selben Geheimbuchstaben ersetzen, bleibt diese Verteilung gleich. Es wird ja im Diagramm nur die Beschriftung der x-Achse geändert, also z.B. a b c d e f ... durch 1 2 3 4 5 6 ... ersetzt. In einem so erzeugten Geheimtext ist dann die 5 das häufigste Zeichen.
So findet ein Spion ziemlich sicher die häufigsten Buchstaben heraus. Und den Rest schafft er dann schnell mit Raten und Ausprobieren.
Kannst du den linken Text 'knacken'?
Bigramme
Es gibt auch Buchstabenpaare (Bigramme), die häufiger vorkommen als andere. In folgender Tabelle sind die zehn häufigsten Bigramme mit ihrer Häufigkeit (nach Beutelspacher) angegeben.
Buchstabenpaar | Häufigkeit | Buchstabenpaar | Häufigkeit |
en | 3,88% | nd | 1,99% |
er | 3,75% | ei | 1,88% |
ch | 2,75% | ie | 1,79% |
te | 2,26% | in | 1,67% |
de | 2,00% | es | 1,52% |
Auch diese Bigramme kann ein Spion zur Hilfe nehmen, um einen so verschlüsselten Text zu knacken.
Verschlüsselungen, die jeden Klartextbuchstaben immer durch den selben Geheimbuchstaben ersetzen, sind also auf diese Weise ziemlich leicht zu knacken.
Die Verschlüsselung durch die Maschine Enigma ist eine solche polyalphabetische. Man kann sie mit der Häufigkeitsanalyse nicht knacken.