Source code for mapchete_eo.processes.merge_rasters

import logging
from enum import Enum
from typing import List, Optional

import numpy as np
import numpy.ma as ma
from mapchete import RasterInputGroup, VectorInputGroup, Timer
from mapchete.errors import MapcheteNodataTile
from mapchete.io.vector import to_shape
from mapchete.processing.mp import MapcheteProcess
from mapchete.tile import BufferedTile
from rasterio.features import geometry_mask
from shapely import unary_union
from shapely.geometry import mapping, shape
from shapely.geometry.base import BaseGeometry

from mapchete_eo.image_operations import filters

logger = logging.getLogger(__name__)



[docs]
class MergeMethod(str, Enum):
    fill = "fill"
    footprint_gradient = "footprint_gradient"




[docs]
def execute(
    mp: MapcheteProcess,
    rasters: RasterInputGroup,
    vectors: VectorInputGroup,
    gradient_buffer: int = 10,
    merge_method: MergeMethod = MergeMethod.footprint_gradient,
) -> ma.MaskedArray:
    """
    Merge multiple rasters into one.
    """
    raster_arrays = []
    region_footprints = []

    with Timer() as tt:
        for raster_region, vector_region in zip(rasters, vectors):
            # Vector Part
            if vector_region is not None:
                region_name_vector, region_vector = vector_region
                region_geoms = region_vector.read()
                if not region_geoms:
                    logger.debug("%s vector is empty", region_name_vector)
                    continue

                # When there are multiple overlaps of aois/clipping creates multiple geoms,
                # # make an union of all shapes, so that the rasters, vectors lists have the the same number of elements
                region_geoms_shapes = []
                for region_geom in region_geoms:
                    region_geoms_shapes.append(shape(region_geom["geometry"]))

                if len(region_geoms_shapes) > 1:
                    region_geoms_shapes = unary_union(region_geoms_shapes)
                    region_footprints.append(region_geoms_shapes)
                else:
                    region_footprints.append(shape(region_geoms[0]["geometry"]))

            # Raster Part
            region_name, region = raster_region

            if region_name != region_name_vector:
                raise ValueError(
                    "Raster and Vector names should be the same to make sure they match itself, before area property of RasterInput works!"
                )

            raster = region.read()
            if raster.mask.all():
                logger.debug("%s raster is empty", region_name)
                continue

            raster_arrays.append(raster)

            # This below wont work until area property of RasterInputs is working!
            # if vector_region is None:
            #     region_footprints.append(region.area)

    logger.debug("%s rasters created in %s", len(raster_arrays), tt)

    if len(raster_arrays) == 0:
        raise MapcheteNodataTile("no input rasters found")

    with Timer() as tt:
        merged = merge_rasters(
            raster_arrays,
            mp.tile,
            footprints=region_footprints,
            method=merge_method,
            gradient_buffer=gradient_buffer,
        )
    logger.debug("%s mosaics merged in %s", len(raster_arrays), tt)
    return merged




[docs]
def merge_rasters(
    rasters: List[ma.MaskedArray],
    tile: BufferedTile,
    method: MergeMethod = MergeMethod.fill,
    footprints: Optional[List[BaseGeometry]] = None,
    gradient_buffer: int = 10,
) -> ma.MaskedArray:
    footprints = footprints or []
    if len(rasters) == 0:
        raise ValueError("no rasters provided")
    elif len(rasters) == 1:
        return rasters[0]

    if method == MergeMethod.fill:
        return fillnodata_merge(rasters)

    elif method == MergeMethod.footprint_gradient:
        if footprints is None:
            raise TypeError(
                "for gradient_merge, a list of footprints has to be provided"
            )
        return gradient_merge(
            rasters=rasters,
            footprints=footprints,
            tile=tile,
            gradient_buffer=gradient_buffer,
        )
    else:  # pragma: no cover
        raise ValueError(f"unkonw merge method '{method}'")




[docs]
def fillnodata_merge(
    rasters: List[ma.MaskedArray],
) -> ma.MaskedArray:
    """
    Read rasters sequentially and update masked pixels with values of next raster.
    """
    out = ma.empty_like(rasters[0])
    for raster in rasters:
        out[~raster.mask] = raster[~raster.mask]
        out.mask[~raster.mask] = raster.mask[~raster.mask]
        # if output is already full, don't add any further raster data
        if not out.mask.any():
            break
    return out




[docs]
def gradient_merge(
    rasters: List[ma.MaskedArray],
    footprints: List[BaseGeometry],
    tile: BufferedTile,
    gradient_buffer: int = 10,
) -> ma.MaskedArray:
    """Use footprint geometries to merge rasters using a gradient buffer."""
    if len(footprints) != len(rasters):  # pragma: no cover
        raise ValueError(
            f"footprints ({len(footprints)}) do not match rasters ({len(rasters)}) count"
        )

    out_data = np.zeros(rasters[0].shape, dtype=np.float16)
    out_mask = np.ones(rasters[0].shape, dtype=bool)

    for raster, footprint in zip(rasters, footprints):
        # create gradient mask from footprint
        footprint_geom = to_shape(footprint)
        if footprint_geom.is_empty:
            footprint_mask = np.ones(shape=raster.mask[0].shape, dtype=bool)
        else:
            footprint_mask = geometry_mask(
                [mapping(footprint_geom)],
                raster.mask[0].shape,
                tile.transform,
                all_touched=False,
                invert=False,
            )

        # TODO: the gaussian_blur function demands a 3-band array, so we have to
        # hack around that. This could be improved.
        gradient_1band = filters.gaussian_blur(
            (~np.stack([footprint_mask for _ in range(3)]) * 255).astype("uint8"),
            radius=gradient_buffer,
        )[0]
        # gradient_1band now has values from 1 (no footprint coverage) to 255 (full
        # footprint coverage)
        # set 1 to 0:
        gradient_1band[gradient_1band == 1] = 0
        logger.debug(
            f"gradient_1band; min: {np.min(gradient_1band)}, max: {np.max(gradient_1band)}"
        )

        # extrude array to match number of raster bands
        gradient_8bit = np.stack([gradient_1band for _ in range(raster.shape[0])])
        logger.debug(
            f"gradient_8bit; min: {np.min(gradient_8bit)}, max: {np.max(gradient_8bit)}"
        )

        # scale gradient from 0 to 1
        gradient = gradient_8bit / 255
        logger.debug(f"gradient; min: {np.min(gradient)} , max: {np.max(gradient)}")

        # now only apply the gradient where out and raster have values
        # otherwise pick the remaining existing value or keep a masked
        # pixel if both are masked

        # clip raster with end of gradient:
        clip_mask = raster.mask + (gradient_8bit == 0)
        raster.mask = clip_mask

        # the weight array is going to be used to merge the existing output array with
        # current raster
        weight = np.zeros(gradient.shape, dtype=np.float16)

        # set weight values according to the following rules:
        # both values available: use gradient (1 for full raster and 0 for full out)
        weight[~out_mask & ~clip_mask] = gradient[~out_mask & ~clip_mask]
        # only raster data available: 1
        weight[out_mask & ~clip_mask] = 1.0
        # only out data available: 0
        weight[~out_mask & clip_mask] = 0.0
        # none of them available: 0
        weight[out_mask & clip_mask] = 0.0

        # update out mask
        weight_mask = np.zeros(weight.shape, dtype=bool)
        # both values available: False
        # only raster: False
        # only out: False
        # none: True
        weight_mask[out_mask & clip_mask] = True

        # sum of weighted existing data with new data
        out_data[~clip_mask] = (
            # weight existing data
            (out_data[~clip_mask] * (1.0 - weight[~clip_mask]))
            # weight new data
            + (raster[~clip_mask].astype(np.float16) * weight[~clip_mask])
        )
        out_mask[~clip_mask] = weight_mask[~clip_mask]

    return ma.MaskedArray(
        data=out_data.astype(rasters[0].dtype, copy=False), mask=out_mask
    )