Automatische Schreibfehlerkorrektur in Texten
BücherAngebote / Angebote:
Der Vergleich von Zeichenreihen oder allgemeiner Bltketten spielt in der Dalenverarbeitung eine zentrale Rolle. Bei vielen Problemen genugt eine Unterscheidung von Gleichheit und Ungleichheit zweier Zeichen reihen nicht, sondern es mussen definierte Abstufungen von "Ahnlichkeil" betrachtet werden. Die Auf gabe kann etwa darin bestehen, eine vorgegebene Zeichenreihe durch eine ihr ahnliche Zeichenreihe zu ersetzen, um etwa eine Normierung, elne Klassifikation oder auch eine Korrektur durchzufUhren. Das vorliegende Buch beschaftigt sich mit der letzten Moglichkeit. Aus der Literatur sind viele Ahnlichkeitsdefinitionen und daraus resultierende Korrektur-Algorithmen be kannt, die nicht allgemein werlend miteinander verglichen werden konnen, da sie sowohl auf die erfor derlichen Arten von Korrekturen als auch auf die Eigenheiten der zu korrigierenden Zeichenreihen zu geschnitten sind. Es wird sich jedoch zeigen, daB Korrektur-Algorithmen, die dem sogenannten HAMMING Prinzip genugen, allen ancjeren uberlegen sind. Ein solcher Algorithmus, der Schreibfehler korrigierel1 5011, wird hier beschrieben und auf ein spezielles Lexikon medizinischer Begriffe angewendet. Die berucksichtigten Fehlerarten und ihre Bewertungen ha ben dabei nicht nur Beispielcharakter, wie man der Literatur entnehmen kann. Derselbe Algorithmus kann daher, gar nichl oder nach Bedarf geringfUgig verandert, fur die Korrektur andersartiger Zeichenreihen eingesetzt werden. Daruber hinaus wird versucht, moglichst aile bekannten Algorithmen vorzustellen und zu diskutieren, die gegenuber dem hier beschriebenen Algorithmus bei veranderter Problemstellung Vorzuge haben konnten. Eine erschOpfende Behandlung aller bekannten Algorithmen ist in diesem Rahmen aber nicht ]11oglich.
Folgt in ca. 5 Arbeitstagen