alpha channel querying improved

2022-04-13 17:31:33 +02:00 · 2022-04-13 17:31:33 +02:00 · 7aee00cb49
commit 7aee00cb49
parent 2cc52c4630
3 changed files with 56 additions and 8 deletions
--- a/image_prediction/image_extractor/extractors/parsable.py
+++ b/image_prediction/image_extractor/extractors/parsable.py
@ -1,3 +1,4 @@
+import atexit
 import io
 from functools import partial, lru_cache
 from itertools import chain, starmap, filterfalse
@ -90,6 +91,7 @@ def clear_caches():
    get_image_infos.cache_clear()
    load_image_handle_from_xref.cache_clear()
    get_images_on_page.cache_clear()
+    xref_to_image.cache_clear()


 def validate_coords_and_passthrough(metadata):
@ -106,11 +108,18 @@ def load_image_handle_from_xref(doc, xref):


 def has_alpha_channel(doc, xref):
+
    maybe_image = load_image_handle_from_xref(doc, xref)
-    return doc.extract_image(maybe_image["smask"]) is not None if maybe_image else False
+    maybe_smask = maybe_image["smask"] if maybe_image else None
+
+    if maybe_smask:
+        return any([doc.extract_image(maybe_smask) is not None, bool(fitz.Pixmap(doc, maybe_smask).alpha)])
+    else:
+        return bool(fitz.Pixmap(doc, xref).alpha)


-def xref_to_image(doc, xref):
+@lru_cache(maxsize=None)
+def xref_to_image(doc, xref) -> Image:
    maybe_image = load_image_handle_from_xref(doc, xref)
    return Image.open(io.BytesIO(maybe_image["image"])) if maybe_image else None

@ -152,3 +161,5 @@ def get_page_metadata(page):


 rounder = rcompose(round, int)
+
+atexit.register(clear_caches)
--- a/test/conftest.py
+++ b/test/conftest.py
@ -337,11 +337,11 @@ def pdf(image_metadata_pairs):
    return pdf_stream(pdf)


-def add_image(pdf, image_metadata_pair):
+def add_image(pdf, image_metadata_pair, suffix="png"):
    while fewer_pages_then_required(image_metadata_pair.metadata[Info.PAGE_IDX], pdf):
        pdf.add_page()

-    add_image_to_last_page(pdf, image_metadata_pair)
+    add_image_to_last_page(pdf, image_metadata_pair, suffix=suffix)


 def fewer_pages_then_required(page_idx, pdf):
@ -352,13 +352,13 @@ def pdf_stream(pdf: fpdf.fpdf.FPDF):
    return pdf.output(dest="S").encode("latin1")


-def add_image_to_last_page(pdf: fpdf.fpdf.FPDF, image_metadata_pair):
+def add_image_to_last_page(pdf: fpdf.fpdf.FPDF, image_metadata_pair, suffix):
    image, metadata = image_metadata_pair
    x, y, w, h = itemgetter(Info.X1, Info.Y1, Info.WIDTH, Info.HEIGHT)(metadata)

-    with tempfile.NamedTemporaryFile(suffix=".png") as temp_image:
+    with tempfile.NamedTemporaryFile(suffix=f".{suffix}") as temp_image:
        image.save(temp_image.name)
-        pdf.image(temp_image.name, x=x, y=y, w=w, h=h, type="png")
+        pdf.image(temp_image.name, x=x, y=y, w=w, h=h, type=suffix)


@pytest.fixture
--- a/test/unit_tests/image_extractor_test.py
+++ b/test/unit_tests/image_extractor_test.py
@ -1,12 +1,19 @@
 import random
+from operator import itemgetter

 import fitz
+import fpdf
 import numpy as np
 import pytest
+from PIL import Image
+from funcy import first, rest

 from image_prediction.estimator.preprocessor.utils import images_to_batch_tensor
 from image_prediction.extraction import extract_images_from_pdf
-from image_prediction.image_extractor.extractors.parsable import extract_pages
+from image_prediction.image_extractor.extractor import ImageMetadataPair
+from image_prediction.image_extractor.extractors.parsable import extract_pages, get_image_infos, has_alpha_channel
+from image_prediction.info import Info
+from test.conftest import add_image, pdf_stream


@pytest.mark.parametrize("extractor_type", ["mock"])
@ -39,3 +46,33 @@ def test_extract_pages(pdf):
    pages = list(extract_pages(doc, page_range))
    assert all((isinstance(p, fitz.Page) for p in pages))
    assert len(pages) == len(page_range)
+
+
+@pytest.mark.parametrize("suffix", ["gif", "png", "jpeg"])
+@pytest.mark.parametrize("mode", ["RGB", "RGBA"])
+def test_has_alpha_channel(base_patch_metadata, suffix, mode):
+
+    mode = "RGB" if suffix == "jpeg" else mode
+
+    pdf = fpdf.FPDF(unit="pt")
+
+    image = Image.new(mode, itemgetter(Info.WIDTH, Info.HEIGHT)(base_patch_metadata), color=(10, 10, 10))
+
+    add_image(pdf, ImageMetadataPair(image, base_patch_metadata), suffix=suffix)
+
+    doc = fitz.Document(stream=pdf_stream(pdf))
+
+    page = first(doc)
+
+    xrefs = map(itemgetter("xref"), get_image_infos(page))
+
+    result = has_alpha_channel(doc, first(xrefs))
+
+    if mode == "RGBA":
+        assert result
+    if mode == "RGB":
+        assert not result
+
+    assert not list(rest(xrefs))
+
+    doc.close()