Wer meine Seiten besucht und sich, etwa per eMail zu erkennen gibt, wird insofern "registriert", dass ich mir seine Mail-Adresse notiere und ihm (etwa) alle Vierteljahr bis auf Widerruf einen Newsletter schicke. Nur dort sind zwei Links angegeben, die auf diese News-Seite und auf die Seite "Forum" verweisen.
Die News-Seite stellt eine Erweiterung der Newsletters dar, die ich nicht vermehren will. um die Mailflut und die durch sie verursachte Belästigung gering zu halten. Hier kann ich ein wenig ausführlicher werden. und über Pläne, neue Vorhaben, neue Seiten oder größere Veränderunen alter Seiten berichten oder .ältere Themen in Erinnerung bringen, Wer nur einmal kommt, für den ist alles neu; er braucht keine News. Wer öfter kommt, will nicht alle Seiten durchsehen, bis er Neues entdeckt. Diese Arbeit kann ihm ein Bericht über Ausbau und Veränderung bestehender Texte abnehmen oder wenigstens erleichtern. (verändert 100401)

================================

Schande

In meinem letzten Newsletter fand meine freie Mitarbeiterin H.W., eine professionelle Korrektorin, 18 Fehler (hoffentlich nur Flüchtigkeitsfehler) auf den wenigen Zeilen. Ich entschuldige mich beschämt und werde in Zukunft die Newsletters vor dem Versand ihr zur Korrektur zuleiten.

(100713)
 

================================

Alle bisher (seit 1998) erschienenen Newsletter

finden Sie neben Informationen zur Geschichte meiner Website und ihrer Vorläufer ("Privat-Disketten" und "Clubdisketten") in CORE.jot.
Wie Sie JOT.Seiten herunterladen und lesen können, erfahren Sie am besten aus der Download-Anleitung,

(100620)

================================

Zählung der bisher erfassten lateinischen Redewendungen

Ich hatte keine Lust, alle Dicta zu zählen. Das ist ein langwieriges Geschäft. Zudem verzählt man sich häufig und muss in relativ geringen Abständen aufschreiben, wie weit man gekommen ist. Am einfachsten schreibt man die erreichten Zahlen, etwa jede fünfzigste (maximal!) bis zum Ende der Zählung unter die jeweils lertzte Zeile.
Ich wollte mich aber mit der Auszählung von Stichproben begnügen. Um die Zahl der bisher erfassten Dicta abschätzen zu können, zählte ich Portionen in einem Vergleichsbuch aus, in dem die Gesamtzahl der Redewendung angegeben ist. So etwa in der von mir mit N bezeichneten Sammlung. Werbetexte behaupten, es enthielte 3000 Redewendungen. Nehmen wir an, Eine Stichprobe von 10 Seiten (etwa S,211-220) enthalte 50 Redewendungen. Zähle ich vergleichsweise die Dicta in meiner Sammlung vom ersten bis zum letzten Dictum dieser Probe aus und komme auf 150 Redewendungen, dann kann ich bei mir auf eine Gesamtzahl 3*3000=9000 Redewendungen schließen. Natürlich muss ich eine ganze Reihe solcher Stichproben erheben, bis sich die Relation (im Beispiel 3:1) von Probe zu Probe addiert sich auf einen einigermaßen konstant bleibenden Wert einpendeltund nicht mehr bedeutend variiert. Die am 6.4.2010 so geschätzte Zahl meiner Dicta betrug 8040.
Dieses Verfahren setzt voraus, dass die alphabetische Reihenfolge in beiden Sammlungen übereinsitmmt. das ist aber, wie anderenorts erwähnt nicht der Fall. Ich behandle jetzt Wort für Wort als alphabetische Einheiten. Für die meisten anderen Sammlungen wird das ganze Dictum wie ein Wort behandelt Bei mir folgen ab alio ... ab hoc ... abducet aufeinander, bei N aber ist deren Reihenfolge ab alio ... abducet ... ab hoc. Der Bestand an Redewendungen in gleich begrenzten Proben stimmt dadurch bei unterschiedlicher Alphabetisierung nicht überiein. Jede Probe alphabetisch entsprechend der Vergleichsprobe umzustellen ist eine lästige Arbeit.
Bei einer Wiederholung der Schätzung habe auf eine Sammlung zurückgegriffen, die nach der (selteneren) von mir bevorzugten alphabetische Reihenfolge sortiert ist. Ich wählte T, eine ins Englische überetzende Ausgabe. Die neue Sprache macht keinen so großen Unterschied, weil beide ja nach der Reihenfolge der lateinischen Sätze sortiert sind. Allerdings wird ein Einfluß auf eine traditionell bedingte unterschiedliche Auswahl gebrauchter und damit aufgeführter Redewendungen bestehen. Aber: T enthältt insgesamt nur 1628 Redewendungen. Allerdings sind die wenig Sinn mitteilenden Floskeln ("Common Words and Expressions") wie dies natalis, ex commodo oder non licet darin nicht enthalten und extra aufgelstet. Es handelt sich um eine beträchtliche Anzahl. Inhalt und Umfang von T weicht also von meiner Gesamtliste (mit Unterbetonung der Floskeln) ab. Auffällig war eine starke Schwankung in der Bestandsrelation der einzelnen Stichproben. Meine Proben enthielten das 1.9 bis 7,6 fache der von T! Insgesamt errechnete ich für mich 8457 Dicta, hatte aber große Zweifel an der Verwendbarkeit der Schätzung.
Für eine spätere Zählung nach dem gleichen Verfahrens wurde das Buch "T" verwendet, weil es die gleiche Alphabetisierung wie meine Sammlung verwendet. Dadurch wurde das zeitraubende Umsetzen der alphabetischen Reihenfolge auf meinen Modus gespart. Der Stichprobenumfang wurde vergrößert und auf weitere Bereiche ausgedehnt. Störend und das Ergebnis sicher beeinflussend ist, dass in "T" die Floskeln (wie dies natalis, hic et nunc, per se, also Ausdrücke, die meist kein Prädikat und Objekt enthalten, keine Sätze bilden) für sich in einer besonderen Zusammenstellung sortiert sind, während sie bei mir im Zählgut erhalten sind. Da sie häufig mit einer Präposiiton eingeleitet sind ist das Vielfache meines Bestandes zu dem des Vergleichsbuches in Portionen, die mit a, ad, in, per beginnen, auffallend groß. Dadurch ist eine große Streuung dieses Verhätnisses (mit)bedingt. Es schwankt zwischen 1,968 und 7,618, Dass die Gesamtzahl der verglichenen Sammlung von "T" nur 1628 Redewendungen umfasst, wirkt einem Ausgleich eher entgegen. Dass "T" die englische Übersetzung der Redewndungen, meine die deutsche enthält, Die am 4.3.2010 so geschätzte Zahl meiner Dicta betrug 8457.
In der Zwischenzeit hatte meine unermüdliche freie Mitarbeiterin sich von sich aus die große Mühe gemacht, alle Dicta auszuzählen, Oft verzählt man sich, vom Inhalt oder meinen häufigen Schreibfehlern abgelenkt. Man muss in engen Abständen Zwischenergebnisse notieren s.o.!). Ihre Zählung im Februar/März 2010 erbrachte 9672 Dicta. Sie zählte sinnvollerweise nicht Datei für Datei, sondern Buchstaben für Buchstaben, so dass ich den prozentualen Anteil der Anfangsbuchstabev angeben kann:
A=14.3%, N=9.4%, i(J)=8.5%, C=S=7.4%, M=7.2%, P=6.8%, D=6.9%, E=5.0%, Q=4.8%, F=3.9%, H=L=3.4%, O=3.0%, V=2.1%, B=U=1.9%, R=1.8%, T=1.7%, G=0.9%, Z<0,0%. Numerisch schwankt es zwischen A=1380 und Z=2. K kommt vor in "ad Kalendas Graecas", aber nicht als Anfangsbuchstabe eines Dictums.

Diese Zahlen spiegeln nur teilweise die Anfangsbuchstabenhäufigkeiten lateinischer Redewendungen wider, sondern mehr die Verteilung in meiner Suchtätigkeit. Fängt man gleichzeitig mit einer größerer Zahl alphabetisch sortierender Quellenschriften an (zur Zeit sind es 86) und fängt man überall vorne an, droht Kopflastigkeit, jedenfalls eine Abweichung von der tatsächlichen Verteilung der Dicta-Anfänge.
In Zukunft werde ich die von dieser wohl einmaligen Gesamtzählung ausgehen. Vor alle neuen, darin noch nicht erfassten Dicta setze ichneu, bis irgendwann deren Zahl buchstabenweise der bisherigen Gesamtzahl hinzugefügt und das vorgesetzte neu gelöscht wird Jedes neu bezeichnet eine in der bisherig korrigierten Fortschreibung der Gesamtzahl noch nicht mitgezählte Redewendung. Das wird sich über längere Zeit hinziehen. Deshalb wird keine Synchronizität erreicht. Aber die tatsächliche Gesamtzahl wird immer über dem angegebenen Endergebnis liegen. Ab und zu wird ein treuer Helfer oder werde ich selbst einzelne Buchstaben zur Kontrolle ganz durchzählen.

(100331)

Zur Startseite Varia

Zum Stichwortverzeichnis