T1: use more compact flags to optimize cache usage in encoder passes. (#172)
[openjpeg.git] / src / lib / openjp2 / t1_generate_luts.c
index 2f7505d8fa4678f99acfd1c41b37f929b95bae74..be0243c3f9ee44c643c00af64c8e3489a9889d4a 100644 (file)
@@ -12,6 +12,7 @@
  * Copyright (c) 2003-2014, Antonin Descampe
  * Copyright (c) 2005, Herve Drolon, FreeImage Team
  * Copyright (c) 2007, Callum Lerwick <seg@haxxed.com>
+ * Copyright (c) 2012, Carl Hetherington
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
@@ -118,6 +119,83 @@ static int t1_init_ctxno_zc(unsigned int f, unsigned int orient)
     return (T1_CTXNO_ZC + n);
 }
 
+static int t1_init_enc_ctxno_zc(int f, int orient)
+{
+    int h, v, d, n, t, hv;
+    n = 0;
+    h = ((f & T1_SIGMA_3) != 0) + ((f & T1_SIGMA_5) != 0);
+    v = ((f & T1_SIGMA_1) != 0) + ((f & T1_SIGMA_7) != 0);
+    d = ((f & T1_SIGMA_0) != 0) + ((f & T1_SIGMA_2) != 0) + ((
+                f & T1_SIGMA_8) != 0) + ((f & T1_SIGMA_6) != 0);
+
+    switch (orient) {
+    case 2:
+        t = h;
+        h = v;
+        v = t;
+    case 0:
+    case 1:
+        if (!h) {
+            if (!v) {
+                if (!d) {
+                    n = 0;
+                } else if (d == 1) {
+                    n = 1;
+                } else {
+                    n = 2;
+                }
+            } else if (v == 1) {
+                n = 3;
+            } else {
+                n = 4;
+            }
+        } else if (h == 1) {
+            if (!v) {
+                if (!d) {
+                    n = 5;
+                } else {
+                    n = 6;
+                }
+            } else {
+                n = 7;
+            }
+        } else {
+            n = 8;
+        }
+        break;
+    case 3:
+        hv = h + v;
+        if (!d) {
+            if (!hv) {
+                n = 0;
+            } else if (hv == 1) {
+                n = 1;
+            } else {
+                n = 2;
+            }
+        } else if (d == 1) {
+            if (!hv) {
+                n = 3;
+            } else if (hv == 1) {
+                n = 4;
+            } else {
+                n = 5;
+            }
+        } else if (d == 2) {
+            if (!hv) {
+                n = 6;
+            } else {
+                n = 7;
+            }
+        } else {
+            n = 8;
+        }
+        break;
+    }
+
+    return (T1_CTXNO_ZC + n);
+}
+
 static int t1_init_ctxno_sc(unsigned int f)
 {
     int hc, vc, n;
@@ -162,6 +240,50 @@ static int t1_init_ctxno_sc(unsigned int f)
     return (T1_CTXNO_SC + n);
 }
 
+static int t1_init_enc_ctxno_sc(int f)
+{
+    int hc, vc, n;
+    n = 0;
+
+    hc = opj_int_min(((f & (T1_LUT_SIG_E | T1_LUT_SGN_E)) ==
+                      T1_LUT_SIG_E) + ((f & (T1_LUT_SIG_W | T1_LUT_SGN_W)) == T1_LUT_SIG_W),
+                     1) - opj_int_min(((f & (T1_LUT_SIG_E | T1_LUT_SGN_E)) ==
+                                       (T1_LUT_SIG_E | T1_LUT_SGN_E)) +
+                                      ((f & (T1_LUT_SIG_W | T1_LUT_SGN_W)) ==
+                                       (T1_LUT_SIG_W | T1_LUT_SGN_W)), 1);
+
+    vc = opj_int_min(((f & (T1_LUT_SIG_N | T1_LUT_SGN_N)) ==
+                      T1_LUT_SIG_N) + ((f & (T1_LUT_SIG_S | T1_LUT_SGN_S)) == T1_LUT_SIG_S),
+                     1) - opj_int_min(((f & (T1_LUT_SIG_N | T1_LUT_SGN_N)) ==
+                                       (T1_LUT_SIG_N | T1_LUT_SGN_N)) +
+                                      ((f & (T1_LUT_SIG_S | T1_LUT_SGN_S)) ==
+                                       (T1_LUT_SIG_S | T1_LUT_SGN_S)), 1);
+
+    if (hc < 0) {
+        hc = -hc;
+        vc = -vc;
+    }
+    if (!hc) {
+        if (vc == -1) {
+            n = 1;
+        } else if (!vc) {
+            n = 0;
+        } else {
+            n = 1;
+        }
+    } else if (hc == 1) {
+        if (vc == -1) {
+            n = 2;
+        } else if (!vc) {
+            n = 3;
+        } else {
+            n = 4;
+        }
+    }
+
+    return (T1_CTXNO_SC + n);
+}
+
 static int t1_init_spb(unsigned int f)
 {
     int hc, vc, n;
@@ -189,14 +311,43 @@ static int t1_init_spb(unsigned int f)
     return n;
 }
 
+static int t1_init_enc_spb(int f)
+{
+    int hc, vc, n;
+
+    hc = opj_int_min(((f & (T1_LUT_SIG_E | T1_LUT_SGN_E)) ==
+                      T1_LUT_SIG_E) + ((f & (T1_LUT_SIG_W | T1_LUT_SGN_W)) == T1_LUT_SIG_W),
+                     1) - opj_int_min(((f & (T1_LUT_SIG_E | T1_LUT_SGN_E)) ==
+                                       (T1_LUT_SIG_E | T1_LUT_SGN_E)) +
+                                      ((f & (T1_LUT_SIG_W | T1_LUT_SGN_W)) ==
+                                       (T1_LUT_SIG_W | T1_LUT_SGN_W)), 1);
+
+    vc = opj_int_min(((f & (T1_LUT_SIG_N | T1_LUT_SGN_N)) ==
+                      T1_LUT_SIG_N) + ((f & (T1_LUT_SIG_S | T1_LUT_SGN_S)) == T1_LUT_SIG_S),
+                     1) - opj_int_min(((f & (T1_LUT_SIG_N | T1_LUT_SGN_N)) ==
+                                       (T1_LUT_SIG_N | T1_LUT_SGN_N)) +
+                                      ((f & (T1_LUT_SIG_S | T1_LUT_SGN_S)) ==
+                                       (T1_LUT_SIG_S | T1_LUT_SGN_S)), 1);
+
+    if (!hc && !vc) {
+        n = 0;
+    } else {
+        n = (!(hc > 0 || (!hc && vc > 0)));
+    }
+
+    return n;
+}
+
 static void dump_array16(int array[], int size)
 {
     int i;
     --size;
     for (i = 0; i < size; ++i) {
-        printf("0x%04x, ", array[i]);
+        printf("0x%04x,", array[i]);
         if (!((i + 1) & 0x7)) {
-            printf("\n  ");
+            printf("\n    ");
+        } else {
+            printf(" ");
         }
     }
     printf("0x%04x\n};\n\n", array[size]);
@@ -208,6 +359,7 @@ int main(int argc, char **argv)
     double u, v, t;
 
     int lut_ctxno_zc[1024];
+    int lut_enc_ctxno_zc[2048];
     int lut_nmsedec_sig[1 << T1_NMSEDEC_BITS];
     int lut_nmsedec_sig0[1 << T1_NMSEDEC_BITS];
     int lut_nmsedec_ref[1 << T1_NMSEDEC_BITS];
@@ -230,35 +382,89 @@ int main(int argc, char **argv)
         }
     }
 
-    printf("static const OPJ_BYTE lut_ctxno_zc[1024] = {\n  ");
+    printf("static const OPJ_BYTE lut_ctxno_zc[1024] = {\n    ");
     for (i = 0U; i < 1023U; ++i) {
-        printf("%i, ", lut_ctxno_zc[i]);
+        printf("%i,", lut_ctxno_zc[i]);
         if (!((i + 1U) & 0x1fU)) {
-            printf("\n  ");
+            printf("\n    ");
+        } else {
+            printf(" ");
         }
     }
     printf("%i\n};\n\n", lut_ctxno_zc[1023]);
 
+    /* lut_enc_ctxno_zc */
+    for (j = 0; j < 4; ++j) {
+        for (i = 0; i < 512; ++i) {
+            int orient = j;
+            if (orient == 2) {
+                orient = 1;
+            } else if (orient == 1) {
+                orient = 2;
+            }
+            lut_enc_ctxno_zc[(orient << 9) | i] = t1_init_enc_ctxno_zc(i, j);
+        }
+    }
+
+    printf("static const OPJ_BYTE lut_enc_ctxno_zc[2048] = {\n    ");
+    for (i = 0; i < 2047; ++i) {
+        printf("%i,", lut_enc_ctxno_zc[i]);
+        if (!((i + 1) & 0x1f)) {
+            printf("\n    ");
+        } else {
+            printf(" ");
+        }
+    }
+    printf("%i\n};\n\n", lut_enc_ctxno_zc[2047]);
+
     /* lut_ctxno_sc */
-    printf("static const OPJ_BYTE lut_ctxno_sc[256] = {\n  ");
+    printf("static const OPJ_BYTE lut_ctxno_sc[256] = {\n    ");
     for (i = 0U; i < 255U; ++i) {
-        printf("0x%x, ", t1_init_ctxno_sc(i << 4));
+        printf("0x%x,", t1_init_ctxno_sc(i << 4));
         if (!((i + 1U) & 0xfU)) {
-            printf("\n  ");
+            printf("\n    ");
+        } else {
+            printf(" ");
         }
     }
     printf("0x%x\n};\n\n", t1_init_ctxno_sc(255U << 4));
 
+    /* lut_enc_ctxno_sc */
+    printf("static const OPJ_BYTE lut_enc_ctxno_sc[256] = {\n    ");
+    for (i = 0; i < 255; ++i) {
+        printf("0x%x,", t1_init_enc_ctxno_sc(i));
+        if (!((i + 1) & 0xf)) {
+            printf("\n    ");
+        } else {
+            printf(" ");
+        }
+    }
+    printf("0x%x\n};\n\n", t1_init_enc_ctxno_sc(255));
+
     /* lut_spb */
-    printf("static const OPJ_BYTE lut_spb[256] = {\n  ");
+    printf("static const OPJ_BYTE lut_spb[256] = {\n    ");
     for (i = 0U; i < 255U; ++i) {
-        printf("%i, ", t1_init_spb(i << 4));
+        printf("%i,", t1_init_spb(i << 4));
         if (!((i + 1U) & 0x1fU)) {
-            printf("\n  ");
+            printf("\n    ");
+        } else {
+            printf(" ");
         }
     }
     printf("%i\n};\n\n", t1_init_spb(255U << 4));
 
+    /* lut_enc_spb */
+    printf("static const OPJ_BYTE lut_enc_spb[256] = {\n    ");
+    for (i = 0; i < 255; ++i) {
+        printf("%i,", t1_init_enc_spb(i));
+        if (!((i + 1) & 0x1f)) {
+            printf("\n    ");
+        } else {
+            printf(" ");
+        }
+    }
+    printf("%i\n};\n\n", t1_init_enc_spb(255));
+
     /* FIXME FIXME FIXME */
     /* fprintf(stdout,"nmsedec luts:\n"); */
     for (i = 0U; i < (1U << T1_NMSEDEC_BITS); ++i) {
@@ -289,16 +495,16 @@ int main(int argc, char **argv)
                                 T1_NMSEDEC_FRACBITS) * 8192.0));
     }
 
-    printf("static const OPJ_INT16 lut_nmsedec_sig[1U << T1_NMSEDEC_BITS] = {\n  ");
+    printf("static const OPJ_INT16 lut_nmsedec_sig[1U << T1_NMSEDEC_BITS] = {\n    ");
     dump_array16(lut_nmsedec_sig, 1U << T1_NMSEDEC_BITS);
 
-    printf("static const OPJ_INT16 lut_nmsedec_sig0[1U << T1_NMSEDEC_BITS] = {\n  ");
+    printf("static const OPJ_INT16 lut_nmsedec_sig0[1U << T1_NMSEDEC_BITS] = {\n    ");
     dump_array16(lut_nmsedec_sig0, 1U << T1_NMSEDEC_BITS);
 
-    printf("static const OPJ_INT16 lut_nmsedec_ref[1U << T1_NMSEDEC_BITS] = {\n  ");
+    printf("static const OPJ_INT16 lut_nmsedec_ref[1U << T1_NMSEDEC_BITS] = {\n    ");
     dump_array16(lut_nmsedec_ref, 1U << T1_NMSEDEC_BITS);
 
-    printf("static const OPJ_INT16 lut_nmsedec_ref0[1U << T1_NMSEDEC_BITS] = {\n  ");
+    printf("static const OPJ_INT16 lut_nmsedec_ref0[1U << T1_NMSEDEC_BITS] = {\n    ");
     dump_array16(lut_nmsedec_ref0, 1U << T1_NMSEDEC_BITS);
 
     return 0;