|
Notes:
Foil 20 of 26
The task is to find utterances
with an environment in which the utterances occur with a percentage of
more than 40%. You have to capture the environments for which this is true.
In this chart the detection
of areal structure is realized by a statistical evaluation based on mask-procedures,
a variant of pattern matching.
I will demonstrate this
technique in a simplified manner - but basically this is the way in which
the map above was constructed:
Given a language area with
equi-distant representation. Given also a linguistic classification of
the representations. We define a square with a margin size of 3 units.
Now we match the language
area for a particular classification: We evaluate every match: if the result
of the match is in the defined range we copy the successful area into a
derived area. If the result is not successful we copy the area as a blank
area into the derived area.
You see the result.
Impact: the open parametrization
of the pattern (form and size, exclusive or inclusive, area building)
Problems: marginal areas |
|
Notizen:
Folie 20 von 26
Die Aufgabe besteht darin,
Äußerungen mit einem Umfeld zu finden, in dem sie zu mehr als
40 % vorkommen. Sie müssen die Gebiete, für die das zutrifft,
belegen.
In diesem Diagramm wird
die Entdeckung von Bereichsbildungen durch statistische Auswertungen, die
auf Masken-Prozeduren, einer Variante der Musterübereinstimmung, basieren,
dargestellt. Ich werde duese Technik in vereinfachter Art demonstrieren
- aber grundsätzliche ist dies der Weg, wie obige Karte entstand:
Voraussetzung sind ein Sprachbereich
mit equi-entfernten Repräsentationen-sowie eine linguistische Klassifikation
dieser Repräsentationen. Wir definieren ein Feld mit einer Randseite
von 3 Einheiten..
Nun durchsuchen wir
den Sprachbereich nach einer speziellen Klassifikation: Wir werten jeden
Treffer aus: Wenn das Ergebnis der Übereinstimmung im definierten
Bereich liegt, kopieren wir den positiven Abschnitt in einen derivaten
Bereich. Wenn keine Übereinstimmung gefunden werden konnte, kopieren
wir den Abschnitt als Leerfeld in den derivaten Bereich.
Sie sehen das Ergebnis.
Auswirkung: die offene Parameterisierung
der Muster (Form und Größe, exklusiv oder inklusiv, Bereichsbildung)
Probleme: Grenzbereiche
|