// Código Comma: códigos binarios auto-delimitados con límites automáticos
No se necesitan separadores entre códigos consecutivos.
Prefijo de longitud en unario seguido de los bits de datos.
La variante tabú evita patrones de bits concretos cuando es necesario.
El código Comma codifica un entero n así: 1) escribe la longitud en bits L-1 en unario (L-1 unos seguidos de un cero), 2) añade la representación binaria sin el 1 inicial. La variante tabú modifica la codificación para evitar patrones como 11, útil en ciertos canales de comunicación.
Basic Comma Code: 0 → 0 (special case) 1 → 01 (0 ones + 0 + empty) 2 → 100 (1 one + 0 + '0') 3 → 101 (1 one + 0 + '1') 4 → 11000 (2 ones + 0 + '00') 5 → 11001 (2 ones + 0 + '01') Concatenated: 1,2,3 → 01 100 101 → 01100101 Self-delimiting - can decode without separators Taboo variant avoids '11' pattern: Uses different encoding to prevent consecutive 1s
El código Comma es un código binario auto-delimitado que codifica enteros usando su longitud en bits en unario seguida de los bits de datos. Se llama "Comma" porque los códigos pueden concatenarse sin separadores explícitos, como elementos en una lista.
El prefijo de longitud unario indica al decodificador cuántos bits de datos siguen. Cuando ves k unos seguidos de un cero, sabes que debes leer exactamente k bits más. Esto permite concatenar múltiples códigos sin separadores adicionales.
La variante tabú del código Comma modifica la codificación para evitar ciertos patrones de bits (como 11). Es útil en canales donde determinados patrones causan problemas o tienen significados especiales, por ejemplo, marcadores de sincronización.
El código Comma se utiliza en compresión de datos, protocolos de red y sistemas de almacenamiento donde las propiedades auto-delimitadas son valiosas. Es especialmente útil cuando se guardan múltiples enteros de longitud variable sin campos de longitud separados.