> refined | soundex | encoder <

// Refined Soundex - Erweiterte phonetische Kodierung mit mehreren Varianten

0 Zeichen
0 Zeichen
[GENAUER]

Höhere Genauigkeit

Präziser als der klassische Soundex-Algorithmus.

[VARIANTEN]

Mehrere Varianten

Unterstützt Refined-, Apache- und SQL-Server-Varianten.

[PHONETIK]

Phonetisches Matching

Gruppiert ähnlich klingende Konsonanten intelligent.

>> Technische Details

Funktionsweise von Refined Soundex

Refined Soundex verbessert den ursprünglichen Soundex-Algorithmus durch verfeinerte Zeichenzuordnungen, die phonetische Ähnlichkeiten besser erfassen. Der erste Buchstabe bleibt erhalten, während nachfolgende Konsonanten in Zifferngruppen kodiert werden, die ihre Lautmerkmale widerspiegeln. Der Algorithmus bietet drei Varianten: die Standard-Refined-Version, die Apache-Commons-Implementierung und eine Variante, die mit der SQL-Server-Funktion SOUNDEX kompatibel ist.

Warum Refined Soundex verwenden?

  • Bessere Genauigkeit als Standard-Soundex
  • Mehrere Varianten für unterschiedliche Systeme
  • Verbesserte Gruppierung von Konsonanten
  • Bewahrt Abwärtskompatibilität
  • Datenbankfreundliche Kodierung

Refined-Soundex-Beispiele

Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length

Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9

Examples:
THOMPSON � T81938
  T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]

JACKSON � J23938
  J-A-C[2]-K[3]-S[9]-O-N[3][8]

Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings

>> Häufig gestellte Fragen

Was ist Refined Soundex?

Refined Soundex ist eine erweiterte Version des ursprünglichen Soundex-Algorithmus, die eine genauere phonetische Kodierung von Namen ermöglicht. Er verwendet verbesserte Konsonantzuordnungen, die die tatsächliche Aussprache besser abbilden.

Worin unterscheidet er sich vom Standard-Soundex?

Refined Soundex verwendet mehr Zifferngruppen (0–9 statt 0–6) und feinere Konsonantzuordnungen. Zum Beispiel erhalten M und N unterschiedliche Codes und es werden mehr Konsonantlaute unterschieden als im ursprünglichen Algorithmus.

Welche Variante sollte ich verwenden?

Nutzen Sie die Standard-Refined-Variante für die beste Genauigkeit. Wählen Sie die Apache-Variante, wenn Sie Kompatibilität mit der Apache-Commons-Codec-Bibliothek benötigen. Verwenden Sie die SQL-Server-Variante, wenn Sie mit der SOUNDEX-Funktion von SQL Server vergleichen.

Ist Refined Soundex für alle Namen besser?

Refined Soundex liefert im Allgemeinen bessere Ergebnisse für englische Namen, besonders bei feinen Ausspracheunterschieden. Bei nichtenglischen Namen oder speziellen Anwendungsfällen können Algorithmen wie Double Metaphone oder Daitch-Mokotoff geeigneter sein.

KOPIERT!