codificar | decodificar | comprimir

> soundex | fonético | fuzzy <

// Soundex - algoritmo fonético para indexar nombres por sonido

[PHONETIC]

Basado en sonido

Codifica los nombres según la pronunciación, no la ortografía.

[FUZZY]

Coincidencia difusa

Encuentra nombres que suenan parecido aunque se escriban distinto.

[GENEALOGY]

Genealogía

Herramienta esencial para genealogía y registros históricos.

>> información técnica

Cómo funciona Soundex:

Soundex mantiene la primera letra y reemplaza las consonantes por dígitos según grupos fonéticos. Las consonantes con sonido similar comparten el mismo número, se ignoran las vocales y el resultado se rellena o recorta a 4 caracteres (American) o longitud variable (Refined).

Reglas de codificación:

1 = B,F,P,V 2 = C,G,J,K,Q,S,X,Z 3 = D,T 4 = L 5 = M,N 6 = R Robert → R163 Rupert → R163 Rubin → R150

¿Por qué usar Soundex?:

  • >Eliminación de duplicados en bases de datos
  • >Investigación genealógica
  • >Análisis de censos
  • >Coincidencia de clientes
  • >Corrección ortográfica

>> preguntas frecuentes

¿Qué es Soundex?

Soundex es un algoritmo fonético patentado en 1918 para indexar nombres por su sonido. Se diseñó para el censo de EE. UU. con el fin de encontrar apellidos con pronunciaciones similares a pesar de tener grafías distintas.

¿American vs. Refined Soundex?

American Soundex produce códigos de 4 caracteres (letra + 3 dígitos). Refined Soundex (usado, por ejemplo, en SQL Server) utiliza más grupos de dígitos y códigos de longitud variable para una mayor precisión.

¿Por qué diferentes grafías tienen el mismo código?

¡Ese es el objetivo! Soundex agrupa nombres que suenan parecido. Smith y Schmidt suenan de forma similar, de modo que reciben códigos parecidos y así es más fácil encontrar variantes en una base de datos.

¿Qué limitaciones tiene Soundex?

Soundex funciona mejor con nombres en inglés. Puede no manejar igual de bien otros idiomas y algunas grafías muy distintas de un mismo nombre pueden terminar con códigos diferentes.

Otros idiomas