OCR per Rechtsklick auf Dokument in Nemo ausführen
Posted on Di 17 August 2021 in Linux
Was passiert?
Es wird eine Rechtsklick-Aktion zu Nemo (Linux Mint Datei-Manager) hinzugfügt, die eine oder mehrere Bilder (Scans) begradigt, zu PDFs konvertiert, OCR (Texterkennung) ausführt und anschließend:
- pro Bild eine PDF erstellt und behält.
- alle PDFs zu einer großen PDF zusammenführt.
Das ist, was ich benötige. Wenn ihr die einzelnen PDFs nicht benötigt oder das Zusammenführen auslassen möchtet, passt gerne das Script an.
Wie es geht...
Zuerst das Script für das Verarbeiten der Bilder erstellen: /usr/local/bin/nemo_ocr
#!/bin/bash
cd "$1"
shift
while ((${#})); do
IFS=';' read -a files <<<"${1}"
for word in "${files[@]}"; do
deskew -b ffffff "${word}" -o "${word}_deskew.jpg"
tesseract "${word}_deskew.jpg" "${word}_ocr" -l deu pdf
rm "${word}_deskew.jpg"
done
shift
done
# Auskommentieren, wenn keine kombinierte PDF benötigt wird.
pdftk *_ocr.pdf cat output combined_$(date +"%Y_%m_%d_%I_%M").pdf
Anschließend ausführbar markieren: chmod +x /usr/local/bin/nemo_ocr
Nun das Script für die Nemo Aktion anlegen:
cd ~/.local/share/nemo/actions
cat << EOF > OCR.nemo_action
[Nemo Action]
Active=true
Name=OCR zu PDF (deu)
Comment=OCR auf Dokument ausführen und PDF erstellen (deu)
Exec=/usr/local/bin/nemo_ocr "%P" "%F"
Icon-Name=pdf
Selection=any
Extensions=any
EscapeSpaces=false
Separator=;
EOF
Diese Action kann entsprechend auf Extensions limitiert werden (Extensions=jpeg;jpg;png;
etwa).
Benötigt selbstverständlich die jeweiligen Pakete:
sudo apt-get install tesseract-ocr tesseract-ocr-deu pdftk
tesseract-ocr-deu
steht dabei für das deutsche Sprachpaket. Mit pdftk
werden PDFs verändert - in dem Fall zusammengefügt.
deskew
findet ihr hier. Einfach entpacken und die deskew
Datei aus dem Bin
Verzeichnis nach, beispielsweise, /usr/local/bin
kopieren und ausführbar markieren.
Mehr zu den Nemo Actions hier.