> delta | diff | comprimeer <
// Delta-codering – sla verschillen op in plaats van absolute waarden
Sequentiële data
Geoptimaliseerd voor data met kleine verschillen tussen opeenvolgende waarden.
Meerdere varianten
Ondersteunt Simple-, XOR- en ZigZag-delta-coderingsmethoden.
Ruimte-efficiënt
Verkleint de benodigde bitbreedte voor sequentiële data.
>> technische info
Hoe delta-codering werkt:
Bij delta-codering wordt eerst de eerste waarde opgeslagen en daarna de verschillen tussen opeenvolgende waarden. Zo worden langzaam veranderende gegevens omgezet in kleine getallen die goed te comprimeren zijn. XOR-delta gebruikt een bitwise XOR in plaats van een aftrekking. ZigZag-codering mapt signed integers naar unsigned voor betere compressie.
Delta-voorbeelden:
Eenvoudige delta: [100, 102, 107, 110, 108] → [100, 2, 5, 3, -2] XOR-delta: [15, 14, 12, 8, 0] → [15, 1, 2, 4, 8] ZigZag-delta: [10, 8, 12, 9] → [10, -2, 4, -3] → [10, 3, 8, 5] (gecodeerd)
Waarom delta-codering gebruiken:
- >Compressie van tijdreeksgegevens
- >Opslag van sensordata
- >Audio-/video-encoding
- >Databasecompressie
- >Netwerkprotocollen
>> veelgestelde vragen
Wat is delta-codering?
Delta-codering is een datacompressietechniek waarbij de verschillen tussen opeenvolgende waarden worden opgeslagen in plaats van de ruwe waarden. Dit is effectief wanneer opeenvolgende waarden op elkaar lijken, omdat de verschillen kleiner zijn en minder bits vereisen.
Simple vs XOR-delta?
Simple-delta gebruikt aftrekking (huidige − vorige waarde), terwijl XOR-delta een bitwise XOR-operatie gebruikt. XOR-delta is omkeerbaar zonder overflow-problemen en werkt goed voor data met vergelijkbare bitpatronen. Simple-delta is intuïtiever voor numerieke reeksen.
Wat is ZigZag-codering?
ZigZag-codering mapt signed integers naar unsigned, waarbij kleine absolute waarden behouden blijven. Het codeert -1 als 1, 1 als 2, -2 als 3, enzovoort, zodat kleine negatieve getallen net zo goed worden gecomprimeerd als kleine positieve.
Wanneer is delta-codering effectief?
Delta-codering is met name effectief voor gesorteerde lijsten, tijdreeksgegevens, sequentiële ID’s, geleidelijk veranderende sensormetingen, audiosamples en alle data waarbij aangrenzende waarden met elkaar gecorreleerd zijn.