OCR per Rechtsklick auf Dokument in Nemo ausführen

Online seit Di 17 August 2021 in Linux

Was passiert?

Es wird eine Rechtsklick-Aktion zu Nemo (Linux Mint Datei-Manager) hinzugfügt, die eine oder mehrere Bilder (Scans) zu PDFs konvertiert, OCR (Texterkennung) ausführt und anschließend:

  • pro Bild eine PDF erstellt und behält.
  • alle PDFs zu einer großen PDF zusammenführt.

Das ist, was ich benötige. Wenn ihr die einzelnen PDFs nicht benötigt oder das Zusammenführen auslassen möchtet, passt gerne das Script an.

Wie es geht...

Zuerst das Script für das Verarbeiten der Bilder erstellen: /usr/local/bin/nemo_ocr

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
#!/bin/bash

cd "$1"
shift

while ((${#})); do
  IFS=';' read -a files <<<"${1}"
  for word in "${files[@]}"; do
    tesseract "${word}" "${word}_ocr" -l deu pdf
  done
  shift
done
pdftk *_ocr.pdf cat output combined_$(date +"%Y_%m_%d_%I_%M").pdf

Anschließend ausführbar markieren: chmod +x /usr/local/bin/nemo_ocr

Nun das Script für die Nemo Aktion anlegen:

cd ~/.local/share/nemo/actions
cat << EOF > OCR.nemo_action
[Nemo Action]
Active=true
Name=OCR zu PDF (deu)
Comment=OCR auf Dokument ausführen und PDF erstellen (deu)
Exec=/usr/local/bin/nemo_ocr "%P" "%F"
Icon-Name=pdf
Selection=any
Extensions=any
EscapeSpaces=false
Separator=;
EOF

Diese Action kann entsprechend auf Extensions limitiert werden (Extensions=jpeg;jpg;png; etwa).

Benötigt selbstverständlich die jeweiligen Pakete:

sudo apt-get install tesseract-ocr tesseract-ocr-deu pdftk

tesseract-ocr-deu steht dabei für das deutsche Sprachpaket. Mit pdftk werden PDFs verändert - in dem Fall zusammengefügt.

Mehr zu den Nemo Actions hier.