> golomb | ضغط | أمثل <
// ترميز غولومب - ضغط أمثل للأعداد الصحيحة مع مقسوم عليه مرن
>> المزايا
مقسوم عليه مرن
اختر أي قيمة لـ M للحصول على أعلى كفاءة في الضغط.
ثنائي مقطوع
يستخدم أقل عدد ممكن من البِتّات لترميز الباقي.
استخدام عام
يعمل مع أي توزيع للأعداد الصحيحة غير السالبة.
>> معلومات تقنية
كيف يعمل ترميز غولومب
يقسم ترميز غولومب كل عدد صحيح n على المقسوم عليه M للحصول على خارج q وباق r. يُرمَّز الخارج بترميز أحادي، بينما يُرمَّز الباقي بترميز ثنائي مقطوع يستخدم أقل عدد من البِتّات الممكنة لـ M قيم. ينتج عن ذلك ترميز أمثل للتوزيعات الهندسية ذات المعامل p = 1/M.
مثال على ترميز غولومب (M=5)
M=5, b=⌈log₂(5)⌉=3, c=2³-5=3 0 → q=0, r=0 → 0|00 → 000 (بتّان لـ r<3) 1 → q=0, r=1 → 0|01 → 001 (بتّان لـ r<3) 2 → q=0, r=2 → 0|10 → 010 (بتّان لـ r<3) 3 → q=0, r=3 → 0|110 → 0110 (3 بِتّات لـ r≥3) 4 → q=0, r=4 → 0|111 → 0111 (3 بِتّات لـ r≥3) 5 → q=1, r=0 → 10|00 → 1000 6 → q=1, r=1 → 10|01 → 1001 7 → q=1, r=2 → 10|10 → 1010 ثنائي مقطوع: يستخدم r<3 بتّين، ويستخدم r≥3 ثلاث بِتّات
لماذا نستخدم ترميز غولومب؟
- أمثل للتوزيعات الهندسية
- معامل M مرن
- استخدام حد أدنى من البِتّات
- تنفيذ بسيط
- مثبت نظريًا كترميز أمثل
>> أسئلة متكررة
ما هو ترميز غولومب؟
ترميز غولومب هو ترميز أمثل خالٍ من البوادئ وذو طول متغير للتوزيعات الهندسية. يقسم الأعداد الصحيحة باستخدام معامل قابل للضبط M، ويُرمِّز الخارج بترميز أحادي والباقي بترميز ثنائي مقطوع، مما يحقق ضغطًا أمثل للبيانات التي تتبع P(n) = (1-p)^n × p.
كيف أختار معامل M؟
تعتمد القيمة المثلى لـ M على المعامل الهندسي p في بياناتك. للبيانات ذات المتوسط μ يمكن تقريبًا اختيار M ≈ μ + 1. أما للاحتمالات ذات التناقص الأسي بمعامل p فالقيمة المثلى هي M = ⌈-1/log₂(1-p)⌉. استخدم وظيفة التحليل لاختيار أفضل M لبياناتك.
ما هو الترميز الثنائي المقطوع؟
الترميز الثنائي المقطوع يقلل عدد البِتّات اللازمة عند ترميز واحدة من قيم M الممكنة. إذا كانت M قوة للعدد 2 يستخدم الترميز الثنائي القياسي. وإلا فإن بعض القيم تستخدم ⌊log₂M⌋ بِتّات وأخرى تستخدم ⌈log₂M⌉ بِتّات، مع ضمان فك ترميز وحيد وبطول متوسط أدنى.
أين يُستخدم ترميز غولومب؟
يُستخدم ترميز غولومب في ضغط الصور JPEG-LS، وترميز الفيديو H.264 (باسم Exp-Golomb)، وفي صيغ الصوت عديمة الفقد. وهو مثالي لترميز أطوال التكرار، وترميز البواقي بعد التنبؤ، وأي بيانات ذات توزيعات هندسية أو أسية.