OSA Baden-Württemberg
BW Quadrat Logo
× Die Beispielaufgaben sollten an einem PC bearbeitet werden.

Mathematik – Statistik

Die Statistik ist ein weiteres Teilgebiet der Mathematik[1] Sie kann allgemeingültige Aussagen beweisen, indem sie Erkenntnisse der Analysis und der linearen Algebra anwendet.

Es geht dabei um Methoden zur systematischen Analyse von Daten und um die Möglichkeit, die tatsächliche Erfahrung mit der Theorie zu verknüpfen. Die Statistik und die aus ihr abgeleitete Analyse von Daten wird zunehmend zentraler für die Maschinelle Sprachverarbeitung (wie auch für viele andere Bereiche), da die Menge an Daten rasant zunimmt, z.B. durch immer mehr öffentlich zugängliche Texte von Privatpersonen im Internet.


Das Quellen- und Literaturverzeichnis zu dieser Seite finden Sie hier.

Aufgabe 1 von 1

Ein Würfel wird dreimal nacheinander geworfen. Mit welcher Wahrscheinlichkeit erscheint mindestens eine Sechs?

Bitte auswählen

1/6

1/36

36%

42%

„Mindestens eine Sechs“ kann „übersetzt“ werden in „Alles außer keine Sechs“.

P=1 − 5/6 * 5/6 * 5/6  ≈0,42 =42%

6%

5/6 ist die Wahrscheinlichkeit für „keine Sechs“. Es wird dreimal gewürfelt, daher 5/6 * 5/6 * 5/6. „Alles außer“ wird errechnet durch „1 – x“ (1 = Wahrscheinlichkeit, dass irgendeine Zahl gewürfelt wird).

Solche Berechnungen sind z.B. in der halb-automatischen Erstellung von Wörterbüchern nützlich – wenn für ein bestimmtes Wort gilt, dass es mit einem bestimmten anderen Wort besonders häufig in Kombination vorkommt, kann solch eine Information (etwa für das Fremdsprachenlernen) mit ins Wörterbuch aufgenommen werden, z.B. „einen Vortrag halten“ anstatt „einen Vortrag geben“ (solche Wortkombinationen werden als Kollokationen bezeichnet).

Auch die Maschinelle Übersetzung z.B. setzt stark auf die Statistik – wenn es eine große Zahl von bereits korrekt übersetzten Dokumenten gibt, in denen die einzelnen Sätze einander zugeordnet sind, kann das System die Wahrscheinlichkeit berechnen, dass ein neuer (evtl. zu vielen schon übersetzten Sätzen sehr ähnlicher) Satz auf eine bestimmte Art und Weise übersetzt wird. Wenn diese Wahrscheinlichkeit sehr hoch ist, kann z.B. entschieden werden, dass es nicht mehr nötig ist einen „menschlichen“ Übersetzer Korrektur lesen zu lassen.