cv-analysis-service/test/fixtures/page_generation/page.py

import itertools
import sys
from typing import Tuple, Iterable, List

import blend_modes
import numpy as np
import pytest
from PIL import Image, ImageEnhance
from PIL.Image import Transpose
from loguru import logger

from cv_analysis.utils.conversion import normalize_image_format_to_array, normalize_image_format_to_pil
from cv_analysis.utils.image_operations import blur, sharpen, overlay, superimpose, compute_pasting_coordinates
from cv_analysis.utils.merging import merge_related_rectangles
from cv_analysis.utils.postprocessing import remove_overlapping, remove_included
from synthesis.partitioner.two_column import TwoColumnPagePartitioner
from synthesis.random import rnd, probably
from synthesis.segment.content_rectangle import ContentRectangle
from cv_analysis.utils.geometric import is_square_like
from synthesis.segment.table.table import generate_random_plot, generate_recursive_random_table, paste_contents
from synthesis.segment.text_block import TextBlock
from synthesis.text.text_block_generator.caption import CaptionGenerator
from synthesis.text.font import pick_random_font_available_on_system

logger.remove()
logger.add(sys.stderr, level="INFO")


from funcy import (
    juxt,
    compose,
    identity,
    lmap,
    lsplit,
    lfilter,
    repeatedly,
)

from cv_analysis.locations import TEST_PAGE_TEXTURES_DIR

from cv_analysis.utils.display import show_image
from cv_analysis.utils.rectangle import Rectangle


@pytest.fixture(
    params=[
        # "rough_grain",
        # "plain",
        # "digital",
        "crumpled",
    ]
)
def base_texture(request, size):
    texture = Image.open(TEST_PAGE_TEXTURES_DIR / (request.param + ".jpg"))
    texture = texture.resize(size)
    # texture.putalpha(255)  # ISSUE 1!!!
    return texture


@pytest.fixture(
    params=[
        "portrait",
        # "landscape",
    ]
)
def orientation(request):
    return request.param


@pytest.fixture(
    params=[
        # 30,
        100,
    ]
)
def dpi(request):
    return request.param


@pytest.fixture(
    params=[
        # "brown",
        # "sepia",
        # "gray",
        "white",
        # "light_red",
        # "light_blue",
    ]
)
def color_name(request):
    return request.param


@pytest.fixture(
    params=[
        # "smooth",
        # "coarse",
        "neutral",
    ]
)
def texture_name(request):
    return request.param


@pytest.fixture(
    params=[
        # 30,
        70,
        # 150,
    ]
)
def color_intensity(request):
    return request.param


def random_flip(image):
    if rnd.choice([True, False]):
        image = image.transpose(Transpose.FLIP_LEFT_RIGHT)
    if rnd.choice([True, False]):
        image = image.transpose(Transpose.FLIP_TOP_BOTTOM)
    return image


@pytest.fixture
def color(color_name):
    return {
        "brown": "#7d6c5b",
        "sepia": "#b8af88",
        "gray": "#9c9c9c",
        "white": "#ffffff",
        "light_red": "#d68c8b",
        "light_blue": "#8bd6d6",
    }[color_name]


@pytest.fixture
def texture_fn(texture_name, size):
    if texture_name == "smooth":
        fn = blur
    elif texture_name == "coarse":
        fn = compose(overlay, juxt(blur, sharpen))
    else:
        fn = identity

    return normalize_image_function(fn)


def normalize_image_function(func):
    def inner(image):
        image = normalize_image_format_to_array(image)
        image = func(image)
        image = normalize_image_format_to_pil(image)
        return image

    return inner


@pytest.fixture
def texture(tinted_blank_page, base_texture):
    texture = superimpose(base_texture, tinted_blank_page)
    return texture


@pytest.fixture
def tinted_blank_page(size, color, color_intensity):
    tinted_page = Image.new("RGBA", size, color)
    tinted_page.putalpha(color_intensity)
    return tinted_page


@pytest.fixture
def blank_page(size, color, color_intensity):
    page = Image.new("RGBA", size, color=(255, 255, 255, 0))
    return page


@pytest.fixture
def size(dpi, orientation):
    if orientation == "portrait":
        size = (8.5 * dpi, 11 * dpi)
    elif orientation == "landscape":
        size = (11 * dpi, 8.5 * dpi)
    else:
        raise ValueError(f"Unknown orientation: {orientation}")
    size = tuple(map(int, size))
    return size


class ContentGenerator:
    def __init__(self):
        self.constrain_layouts = True

    def __call__(self, boxes: List[Rectangle]) -> Image:
        rnd.shuffle(boxes)

        figure_boxes, text_boxes = lsplit(is_square_like, boxes)

        if self.constrain_layouts:
            figure_boxes = merge_related_rectangles(figure_boxes)
            figure_boxes = lfilter(is_square_like, figure_boxes)
            text_boxes = merge_related_rectangles(text_boxes)

        boxes = list(
            itertools.chain(
                map(generate_random_text_block, every_nth(2, text_boxes)),
                *zipmap(generate_recursive_random_table_with_caption, every_nth(2, text_boxes[1:])),
                *zipmap(generate_recursive_random_table_with_caption, every_nth(2, figure_boxes)),
                *zipmap(generate_random_plot_with_caption, every_nth(2, figure_boxes[1:])),
            )
        )

        if self.constrain_layouts:
            boxes = remove_included(boxes)
            boxes = remove_overlapping(boxes)

        return boxes


def zipmap(fn, boxes, n=2):
    rets = lmap(list, zip(*map(fn, boxes)))
    yield from repeatedly(lambda: [], n) if len(rets) < n else rets


def every_nth(n, iterable):
    return itertools.islice(iterable, 0, None, n)


def generate_random_plot_with_caption(rectangle: Rectangle):
    plot_box, caption_box = split_into_figure_and_caption(rectangle)
    plot_box = generate_random_plot(plot_box)
    caption_box = generate_random_image_caption(caption_box)
    return plot_box, caption_box


# TODO: deduplicate with generate_random_table_with_caption
def generate_recursive_random_table_with_caption(rectangle: Rectangle):
    table_box, caption_box = split_into_figure_and_caption(rectangle)
    table_box = generate_recursive_random_table(table_box, double_rule=probably())
    caption_box = generate_random_table_caption(caption_box)
    return table_box, caption_box


def split_into_figure_and_caption(rectangle: Rectangle):
    gap_percentage = rnd.uniform(0, 0.03)
    split_point = rnd.uniform(0.5, 0.9)
    figure_box = Rectangle(
        rectangle.x1, rectangle.y1, rectangle.x2, rectangle.y1 + rectangle.height * (split_point - gap_percentage / 2)
    )
    caption_box = Rectangle(
        rectangle.x1, rectangle.y1 + rectangle.height * (split_point + gap_percentage / 2), rectangle.x2, rectangle.y2
    )
    return figure_box, caption_box


def shrink_rectangle(rectangle: Rectangle, factor: float) -> Rectangle:
    x1, y1, x2, y2 = compute_scaled_coordinates(rectangle, (1 - factor))

    logger.trace(f"Shrinking {rectangle} by {factor} to ({x1}, {y1}, {x2}, {y2}).")

    assert x1 >= rectangle.x1
    assert y1 >= rectangle.y1
    assert x2 <= rectangle.x2
    assert y2 <= rectangle.y2

    shrunk_rectangle = Rectangle(x1, y1, x2, y2)

    if isinstance(rectangle, ContentRectangle):  # TODO: Refactor
        shrunk_rectangle = ContentRectangle(*shrunk_rectangle.coords, rectangle.content)

    return shrunk_rectangle


def compute_scaled_coordinates(rectangle: Rectangle, factor: float) -> Tuple[int, int, int, int]:
    # TODO: Refactor: Using image to compute coordinates is not clean
    image = Image.new("RGBA", (rectangle.width, rectangle.height))
    scaled = image.resize((int(rectangle.width * factor), int(rectangle.height * factor)))

    x1, y1 = compute_pasting_coordinates(scaled, image)
    x1 = rectangle.x1 + x1
    y1 = rectangle.y1 + y1
    x2, y2 = x1 + scaled.width, y1 + scaled.height
    return x1, y1, x2, y2


def generate_random_text_block(rectangle: Rectangle, n_sentences=3000) -> ContentRectangle:
    block = TextBlock(
        *rectangle.coords,
        font=pick_random_font_available_on_system(
            includes=("serif", "sans-serif"),
            excludes=("bold", "mono", "italic", "oblique", "cursive"),
        ),
        font_size=30,  # TODO: De-hardcode font size... Seems to have no effect on top of that
    )
    block.content = rectangle.content if isinstance(rectangle, ContentRectangle) else None  # TODO: Refactor
    block.generate_random_text(rectangle, n_sentences)
    return block


def generate_random_image_caption(rectangle: Rectangle) -> ContentRectangle:
    return generate_random_caption(rectangle, f"Fig {rnd.randint(1, 20)}")


def generate_random_table_caption(rectangle: Rectangle) -> ContentRectangle:
    return generate_random_caption(rectangle, f"Tabl {rnd.randint(1, 20)}")


def generate_random_caption(rectangle: Rectangle, caption_start, n_sentences=1000) -> ContentRectangle:
    block = TextBlock(
        *rectangle.coords,
        text_generator=CaptionGenerator(caption_start=caption_start),
        font=pick_random_font_available_on_system(
            includes=("italic",),
            excludes=("bold", "mono"),
        ),
        font_size=100,  # TODO: De-hardcode font size... Seems to have no effect on top of that
    )
    block.content = rectangle.content if isinstance(rectangle, ContentRectangle) else None  # TODO: Refactor
    block.generate_random_text(rectangle, n_sentences)
    return block


@pytest.fixture(
    params=[
        TwoColumnPagePartitioner,
        # RandomPagePartitioner
    ]
)
def page_partitioner(request):
    return request.param()


@pytest.fixture
def boxes(page_partitioner, blank_page):
    boxes = page_partitioner(blank_page)
    return boxes


@pytest.fixture
def prepared_texture(texture, texture_fn):
    texture = random_flip(texture)
    texture = texture_fn(texture)
    return texture


@pytest.fixture
def content_boxes(boxes):
    content_generator = ContentGenerator()
    content_boxes = content_generator(boxes)
    return content_boxes


@pytest.fixture
def page_with_opaque_content(
    blank_page, tinted_blank_page, prepared_texture, content_boxes
) -> Tuple[np.ndarray, Iterable[Rectangle]]:
    """Creates a page with content"""
    page = paste_contents(prepared_texture, content_boxes)

    return page, content_boxes


@pytest.fixture
def page_with_translucent_content(
    blank_page, tinted_blank_page, prepared_texture, content_boxes
) -> Tuple[np.ndarray, List[Rectangle]]:
    """Creates a page with content"""
    page_content = paste_contents(blank_page, content_boxes)
    page = blend_by_multiply(page_content, prepared_texture)

    return page, content_boxes


def blend_by_multiply(page_content, texture):
    def to_array(image: Image) -> np.ndarray:
        return np.array(image).astype(np.float32)

    texture.putalpha(255)
    page_content.putalpha(255)
    factor = 1.2
    enhancer = ImageEnhance.Contrast(texture)
    texture = enhancer.enhance(factor)

    page = blend_modes.multiply(
        *map(
            to_array,
            (
                page_content,
                texture,
            ),
        ),
        opacity=1,
    ).astype(np.uint8)
    return page


@pytest.fixture
def page_with_content(
    page_with_translucent_content,
    # page_with_opaque_content,
) -> np.ndarray:

    page, boxes = page_with_translucent_content
    # page, boxes = page_with_opaque_content

    draw_boxes(page, boxes)

    return page


def draw_boxes(page: Image, boxes: Iterable[Rectangle]):
    from cv_analysis.utils.drawing import draw_rectangles

    page = draw_rectangles(page, boxes, filled=False, annotate=True)
    show_image(page, backend="pil")