> shannon | fano | entropía <
// Shannon-Fano – Codificación de entropía descendente para compresión de datos
Basado en entropía
Utiliza teoría de la información para generar códigos eficientes de longitud variable.
Enfoque descendente
Divide recursivamente los símbolos en grupos con probabilidades similares.
Algoritmo histórico
Método pionero que influyó en muchas técnicas modernas de compresión.
>> información técnica
Cómo funciona Shannon-Fano:
La codificación Shannon-Fano ordena los símbolos por frecuencia y los divide recursivamente en dos grupos con probabilidades totales lo más parecidas posible. Cada división añade un bit al código (0 a la izquierda, 1 a la derecha). El resultado es un código prefijo de longitud variable.
Proceso de codificación:
Texto: "AAABBCD" Frecuencias: A:3, B:2, C:1, D:1 División: [A] | [B,C,D] Códigos: A: 0 B: 10 C: 110 D: 111 Codificado: 0 0 0 10 10 110 111
Por qué usar Shannon-Fano:
- >Fácil de implementar
- >Buenos índices de compresión
- >Importancia histórica
- >Útil para aprendizaje
- >Códigos prefijo
>> preguntas frecuentes
¿Qué es la codificación Shannon-Fano?
La codificación Shannon-Fano es una técnica de codificación por entropía desarrollada por Claude Shannon y Robert Fano en la década de 1940. Fue uno de los primeros algoritmos en usar códigos de longitud variable basados en la probabilidad de los símbolos.
¿Shannon-Fano o Huffman?
Ambos generan códigos de longitud variable, pero Huffman es óptimo y produce la longitud media de código más corta. Shannon-Fano es más sencillo, aunque puede generar códigos ligeramente más largos. Huffman construye el árbol de abajo hacia arriba, Shannon-Fano de arriba hacia abajo.
¿Cómo funciona la división de símbolos?
Los símbolos se ordenan por frecuencia y se dividen en dos grupos con probabilidades totales lo más cercanas posible. El proceso se repite de forma recursiva hasta que cada grupo contiene solo un símbolo.
¿Sigue utilizándose Shannon-Fano?
Shannon-Fano se usa hoy principalmente con fines históricos y educativos. En la práctica fue reemplazado en gran medida por la codificación de Huffman, que garantiza la optimalidad. Aun así, sigue siendo valioso para entender los conceptos básicos de la compresión.