Zählung der bisher erfassten lateinischen
Redewendungen
Ich hatte keine Lust, alle Dicta zu zählen. Das
ist ein langwieriges Geschäft. Zudem verzählt man sich häufig
und muss in relativ geringen Abständen aufschreiben, wie weit man gekommen
ist. Am einfachsten schreibt man die erreichten Zahlen, etwa jede
fünfzigste (maximal!) bis zum Ende der Zählung unter die jeweils
lertzte Zeile. Ich wollte mich aber mit der Auszählung von Stichproben
begnügen. Um die Zahl der bisher erfassten Dicta abschätzen zu
können, zählte ich Portionen in einem Vergleichsbuch aus, in dem die
Gesamtzahl der Redewendung angegeben ist. So etwa in der von mir mit N
bezeichneten Sammlung. Werbetexte behaupten, es enthielte 3000 Redewendungen.
Nehmen wir an, Eine Stichprobe von 10 Seiten (etwa S,211-220) enthalte 50
Redewendungen. Zähle ich vergleichsweise die Dicta in meiner Sammlung vom
ersten bis zum letzten Dictum dieser Probe aus und komme auf 150 Redewendungen,
dann kann ich bei mir auf eine Gesamtzahl 3*3000=9000 Redewendungen
schließen. Natürlich muss ich eine ganze Reihe solcher Stichproben
erheben, bis sich die Relation (im Beispiel 3:1) von Probe zu Probe addiert
sich auf einen einigermaßen konstant bleibenden Wert einpendeltund nicht
mehr bedeutend variiert. Die am 6.4.2010 so geschätzte Zahl meiner
Dicta betrug 8040. Dieses Verfahren setzt voraus, dass die alphabetische
Reihenfolge in beiden Sammlungen übereinsitmmt. das ist aber, wie
anderenorts erwähnt nicht der Fall. Ich behandle jetzt Wort für Wort
als alphabetische Einheiten. Für die meisten anderen Sammlungen wird das
ganze Dictum wie ein Wort behandelt Bei mir folgen ab alio ... ab hoc ...
abducet aufeinander, bei N aber ist deren Reihenfolge ab alio ... abducet ...
ab hoc. Der Bestand an Redewendungen in gleich begrenzten Proben stimmt dadurch
bei unterschiedlicher Alphabetisierung nicht überiein. Jede Probe
alphabetisch entsprechend der Vergleichsprobe umzustellen ist eine lästige
Arbeit. Bei einer Wiederholung der Schätzung habe auf eine Sammlung
zurückgegriffen, die nach der (selteneren) von mir bevorzugten
alphabetische Reihenfolge sortiert ist. Ich wählte T, eine ins Englische
überetzende Ausgabe. Die neue Sprache macht keinen so großen
Unterschied, weil beide ja nach der Reihenfolge der lateinischen Sätze
sortiert sind. Allerdings wird ein Einfluß auf eine
traditionell bedingte unterschiedliche Auswahl gebrauchter und damit
aufgeführter Redewendungen bestehen. Aber: T enthältt
insgesamt nur 1628 Redewendungen. Allerdings sind die wenig Sinn mitteilenden
Floskeln ("Common Words and Expressions") wie dies natalis, ex commodo oder non
licet darin nicht enthalten und extra aufgelstet. Es handelt sich um eine
beträchtliche Anzahl. Inhalt und Umfang von T weicht also von meiner
Gesamtliste (mit Unterbetonung der Floskeln) ab. Auffällig war eine starke
Schwankung in der Bestandsrelation der einzelnen Stichproben. Meine Proben
enthielten das 1.9 bis 7,6 fache der von T! Insgesamt errechnete ich für
mich 8457 Dicta, hatte aber große Zweifel an der Verwendbarkeit der
Schätzung. Für eine spätere Zählung nach dem gleichen
Verfahrens wurde das Buch "T" verwendet, weil es die gleiche Alphabetisierung
wie meine Sammlung verwendet. Dadurch wurde das zeitraubende Umsetzen der
alphabetischen Reihenfolge auf meinen Modus gespart. Der Stichprobenumfang
wurde vergrößert und auf weitere Bereiche ausgedehnt. Störend
und das Ergebnis sicher beeinflussend ist, dass in "T" die Floskeln (wie dies
natalis, hic et nunc, per se, also Ausdrücke, die meist kein Prädikat
und Objekt enthalten, keine Sätze bilden) für sich in einer
besonderen Zusammenstellung sortiert sind, während sie bei mir im
Zählgut erhalten sind. Da sie häufig mit einer Präposiiton
eingeleitet sind ist das Vielfache meines Bestandes zu dem des Vergleichsbuches
in Portionen, die mit a, ad, in, per beginnen, auffallend groß. Dadurch
ist eine große Streuung dieses Verhätnisses (mit)bedingt. Es
schwankt zwischen 1,968 und 7,618, Dass die Gesamtzahl der verglichenen
Sammlung von "T" nur 1628 Redewendungen umfasst, wirkt einem Ausgleich eher
entgegen. Dass "T" die englische Übersetzung der Redewndungen, meine die
deutsche enthält, Die am 4.3.2010 so geschätzte Zahl meiner Dicta
betrug 8457. In der Zwischenzeit hatte meine unermüdliche freie
Mitarbeiterin sich von sich aus die große Mühe gemacht, alle Dicta
auszuzählen, Oft verzählt man sich, vom Inhalt oder meinen
häufigen Schreibfehlern abgelenkt. Man muss in engen Abständen
Zwischenergebnisse notieren s.o.!). Ihre Zählung im Februar/März
2010 erbrachte 9672 Dicta. Sie zählte sinnvollerweise nicht Datei
für Datei, sondern Buchstaben für Buchstaben, so dass ich den
prozentualen Anteil der Anfangsbuchstabev angeben kann: A=14.3%, N=9.4%,
i(J)=8.5%, C=S=7.4%, M=7.2%, P=6.8%, D=6.9%, E=5.0%, Q=4.8%, F=3.9%, H=L=3.4%,
O=3.0%, V=2.1%, B=U=1.9%, R=1.8%, T=1.7%, G=0.9%, Z<0,0%. Numerisch schwankt
es zwischen A=1380 und Z=2. K kommt vor in "ad Kalendas Graecas", aber nicht
als Anfangsbuchstabe eines Dictums.
Diese Zahlen spiegeln nur teilweise
die Anfangsbuchstabenhäufigkeiten lateinischer Redewendungen wider,
sondern mehr die Verteilung in meiner Suchtätigkeit. Fängt man
gleichzeitig mit einer größerer Zahl alphabetisch sortierender
Quellenschriften an (zur Zeit sind es 86) und fängt man überall vorne
an, droht Kopflastigkeit, jedenfalls eine Abweichung von der tatsächlichen
Verteilung der Dicta-Anfänge. In Zukunft werde ich die von dieser wohl
einmaligen Gesamtzählung ausgehen. Vor alle neuen, darin noch nicht
erfassten Dicta setze ichneu, bis irgendwann
deren Zahl buchstabenweise der bisherigen Gesamtzahl hinzugefügt und das
vorgesetzte neu gelöscht wird Jedes
neu bezeichnet eine in der bisherig korrigierten
Fortschreibung der Gesamtzahl noch nicht mitgezählte Redewendung. Das wird
sich über längere Zeit hinziehen. Deshalb wird keine
Synchronizität erreicht. Aber die tatsächliche Gesamtzahl wird immer
über dem angegebenen Endergebnis liegen. Ab und zu wird ein treuer Helfer
oder werde ich selbst einzelne Buchstaben zur Kontrolle ganz
durchzählen.
(100331) |