> tunstall | zmienna | stała <

// Kodowanie Tunstalla – optymalna kompresja od długości zmiennej do stałej

Długość kodu:

Pokaż słownik Pokaż drzewo parsowania

WEJŚCIE

0 znaki

WYJŚCIE

0 znaki

>> funkcje

[VAR→STAŁA]

Kodowanie V2F

Mapuje sekwencje o zmiennej długości na kody o stałej długości.

[OPTYMALNE]

Oparte na prawdopodobieństwie

Słownik budowany jest na podstawie rozkładu prawdopodobieństwa symboli.

[DEKODOWALNE]

Łatwe dekodowanie

Kody o stałej długości umożliwiają prostą i szybką dekodację.

>> informacje techniczne

Jak działa kodowanie Tunstalla

Kodowanie Tunstalla buduje słownik sekwencji o zmiennej długości, które są mapowane na binarne kody o stałej długości. Zaczynamy od pojedynczych symboli, a następnie iteracyjnie rozszerzamy sekwencję o najwyższym prawdopodobieństwie poprzez dodanie każdego symbolu alfabetu. Powstaje optymalny kod od zmiennej do stałej długości, w którym bardziej prawdopodobne sekwencje otrzymują własne słowa kodowe.

Przykład Tunstalla

Tekst: 'aabaa' przy P(a)=0.8, P(b)=0.2

Budowa słownika (kody 3‑bitowe):
Początkowo: a, b
Rozszerz 'a': aa, ab
Rozszerz 'aa': aaa, aab
Rozszerz 'ab': aba, abb

Końcowy słownik (8 kodów):
aaa → 000
aab → 001
aba → 010
abb → 011
aa  → 100
ab  → 101
a   → 110
b   → 111

Kodowanie: 'aabaa' → 001 100 (aab + aa)

Dlaczego warto używać kodowania Tunstalla?

▸ Wyjściowe kody o stałej długości
▸ Prosta implementacja dekodera
▸ Brak problemów z synchronizacją
▸ Dobrze nadaje się do implementacji sprzętowych
▸ Optymalne dla źródeł bezpamięciowych

>> najczęściej zadawane pytania

Czym jest kodowanie Tunstalla?

Kodowanie Tunstalla to metoda kodowania entropijnego o zmiennej długości wejścia i stałej długości wyjścia. W przeciwieństwie do kodowania Huffmana (stała→zmienna), Tunstall mapuje sekwencje o zmiennej długości na słowa kodowe o stałej długości, co jest idealne dla zastosowań wymagających stałej przepływności bitów.

Tunstall a kodowanie Huffmana?

Huffman: stałe wejście → zmienne wyjście (np. 'a' → '0', 'b' → '10'). Tunstall: zmienne wejście → stałe wyjście (np. 'aa' → '000', 'ab' → '001'). Tunstall jest korzystniejszy dla sprzętu i synchronizacji, ale zwykle daje nieco niższy współczynnik kompresji.

Jak buduje się słownik?

Zaczynamy od pojedynczych symboli. Następnie powtarzamy: 1) znajdujemy sekwencję o najwyższym prawdopodobieństwie, 2) usuwamy ją i dodajemy wszystkie możliwe rozszerzenia o jeden symbol, 3) kontynuujemy, aż osiągniemy pożądany rozmiar słownika (2^n dla kodów n‑bitowych).

Gdzie stosuje się kodowanie Tunstalla?

Kodowanie Tunstalla jest stosowane w kompresji mowy, kodowaniu obrazów oraz w sytuacjach, w których wymagana jest stała szybkość wyjściowa. Jest szczególnie przydatne w implementacjach sprzętowych i systemach czasu rzeczywistego, gdzie kody o zmiennej długości komplikowałyby synchronizację.

[Base64.sh]