autoimport/autoimport/select/metadata.py

import logging
import json
from PIL import Image, ExifTags
import exifread


def extract_metadata_from_file(filename):
    logger = logging.getLogger(__name__)

    logger.info("handling: {}".format(filename))


    try:
        img = Image.open(filename)
    except Exception as e:
        logger.error("failed to open and load '{}'".format(filename))
        img.close()
        raise e

    if(hasattr(img, "_getexif")):

        try:
            exif = {ExifTags.TAGS[k]: v for k, v in img._getexif().items() if k in ExifTags.TAGS}
        except Exception as e:
            logger.error("failed to read EXIF data from '{}'".format(filename))
            raise e
        finally:
            img.close()
    else:
        img.close()
        # We cannot use PIL because PIL is crap. So we use
        # exifread. This is a little slower but will produce
        # results more safely.
        exif = get_exif_with_exifread(filename)

    values_no_preprocessing = {"DateTime"
                , "DateTimeDigitized"
                , "DateTimeOriginal"
                , "Model"
                , "Make"
                , "Software"}

    for k in values_no_preprocessing:
        if(not k in exif):
            logger.error("missing EXIF value {} in '{}'".format(
                k, filename))
            raise KeyError("missing EXIF value {}".format(k))

    result = {k: exif[k] for k in values_no_preprocessing}

    return result

def get_exif_with_exifread(filename):
    with open(filename, "rb") as image:
        tags = exifread.process_file(image)
    exif_tag_header = "EXIF "
    exif_tag_header_length = len(exif_tag_header)
    data = {k[exif_tag_header_length:]: v.values for k,v in tags.items()
        if k.startswith(exif_tag_header)}

    # Not all the tags we want are in the EXIF section.
    data_from_image_section = {"DateTime", "Make", "Software", "Model"}
    image_tag_header = "Image "
    data.update({key: tags[real_key].values for key, real_key in
            ((i, image_tag_header + i) for i in data_from_image_section)})
    return data