Buchstaben Verteilung

Die Anordnung der Buchstaben zu den Morsezeichen hat erkennbar einen Bezug zur Häufigkeit deren Benutzung. Das in vielen Sprachen oft benutze "e" hat als Morsezeichen einen "." nur ein Element also sehr kurz, hingegen haben die seltenen Buchstaben "q", "x" oder "j" 4 Elemente in einem Morsezeichen.

Welche Sprache war die Grundlage diese nun übliche Definition der Morsezeichen zu definieren?

The distribution of letters against the morse code symbols has an easily detectable relation to the frequency used in language. Many languages use extremely often "e", quite short only one element. On the other hand characters like "q", "x" or "j" are less frequently required.

Which language was the source to define the morse characters as we use it now for years?

Die diversen Quellen sind sich einig, daß Samuel Morse 1837 einen reinen Zahlencode erfand mit dem über Codetabellen auf Sätze umgeschlüsselt wurde. Ein Mitarbeiter von ihm Alfred Lewis Vail erfand einen vollständigen Buchstabencode der es erlaubt hat, direkt Freitext zu übertragen. Die Zeichen waren aber sehr schwer zu erlernen (3 Längen für die Zeichen und auch 3 unterschiedliche Längen für Pausen), dieser Code wurde aber lange benutzt bei Eisenbahnen in USA bis in die 1960'er Jahre.

Various sources agree that Samuel Morse invented 1837 a number code which was translated to sentences. One of his employees Alfred Lewis Vail invented a complete codeset which represents all characters. It uses 3 length types of signal and 3 length of pauses. It was quite hard to learn bus was used on railroad systems till the 1960'ies.

Friedrich Clemens Gerke der in Hamburg lebte, definierte 1848 eine Buchstaben Tabelle die in weiterer Folge als internationaler Morsecode bekannt geworden und von der ITU so genormt wurde.
Manche Quellen berichten, daß Gerke in Druckereinen nachgefragt haben soll wie viele Stück Lettern diese zum Setzen von Texten verbrauchen. Aufgrund dieser Verteilung soll er seine Anordnung entwickelt haben. Hier stünde dann Deutsch als Pate, stimmt das? Vor allem in US und UK Quellen wird immer betont das Englische sei Quelle für die Ermittlung der Häufigkeit sei. Für die 26 Kernbuchstaben in der lateinischen Schrift reichen 4 Elemente, also Punke und Striche aus. Es stehen 1²+2²+3²+4² = 2+4+8+16 also 30 Zeichen in dieser Codierung zur Verfügung. Interessant ist daß die deutschen Umlaute ä, ö, ü als auch das "ch" die nach der Nutzung durch die 26 Buchstaben verbrauchen 4 übrig gebliebenen Zeichen in dem 30'er Zeichenraum von 4 Elementen nutzen. Also doch eher Deutsch als Sprachenparte? Alle anderen Sonderzeichen die man in diversen Sprachen braucht haben 5 Elemente. Somit haben ä, ö, ü mit ihrer Verwendung in Deutsch eine besodere Stellung.

Friedrich Clemens Gerke who lived in Hamburg defined 1848 a table which later became the international morse code. It was also normed by the ITU. Some sources report that Gerke went to print shops to ask for the number of individual letters they use to set the pages. According to the volumes he defined the code set. If that is true German would be the source of the way the code is defined. Especially US and UK sources claim that English is the defining language for the code distribution. For the characters of the Latin script 4 elements are enough to cover them. But there is room for 30 of them 1²+2²+3²+4² = 2+4+8+16. It is quite remarkable that the remaining 4 characters with 4 elements are used for the German Umlauts ä, ö, ü and "ch". So could that mean it is German??? Other languages requre a 5 element coding for their special characters. This describes a special treatment for the german ä, ö, ü umlaut characters.

Auf der Suche nach Buchstaben Verteilungen in Sprachen die die lateinische Schrift benutzen bin ich über eine Wikipedia Seite gestolpert. Die hier angegebenen Werte habe ich genutzt um mir eine Übersicht zu verschaffen. Die Auswertung über ein Excel Sheet zeigt interessantes.

I was looking around to find patterns in character distribution compared to other languages. I found a Wikipedia page where I used the data for my comarisation. I wrote a Excel sheet to do my analysis.

Buchstaben und Morsezeichen Tabelle Sortiert nach Zeichenlänge

Buchstaben und Morsezeichen

Die Häufigkeit der Buchstaben alleine in Deutsch oder Englisch war nicht alleine ausschlaggebend für die Definition. In beiden Sprachen kommt "m" weniger häufig vor als manch anderes Zeichen dennoch hat es prominent die Definition mit 2 Elementen: "- -"

The occurrence of the characters in German or English alone was not the final decision to define the code. In both languages the "m" is less popular than other characters bit gets the prominent 2 element code: "- -".

Sortiert nach Verteilung in Deutsch

Buchstaben in Deutsch

Sortiert man die Tabelle nach Sprachen wird deutlich sichtbar, daß weder Deutsch noch Englisch allein die Reihung bestimmt haben. Man erkennt aber daß die Abweichung zur rein mathematisch bestimmten Reihung im Deutschen geringer ist als bei Englisch.

Sorting the data per language shows that the alignment in morse code does not strictly follow one of the languages. It is visible that the overall deviation to a simple mathematically followed ordering is smaller in German than in English.

Sortiert nach Verteilung in Englisch

Buchstaben in Englisch

Das Excel zur Analyse verlinke ich hier nochmals falls jemand Lust hat sich die Sache anzusehen. Die Daten stammen von der deutschen Wikipedia Seite

Here is the Excel for your analysis if you want to play with the date yourself. The data was copied from the germen Wikipedia page.

published on: 2024 07 11

OE1IAH.at