Files
flywms/aggiornamento-2026-05-16-14-34.md
2026-05-19 08:52:44 +02:00

930 B

Aggiornamento 2026-05-16 14:34

Milestone test Tesseract OCR

Obiettivo

Valutare Tesseract come alternativa piu' leggera a EasyOCR per leggere codici numerici sulle etichette.

Motivazione

EasyOCR si e' rivelato fragile sui crop piccoli/tagliati e molto pesante in RAM/tempo di avvio. Per codici numerici semplici, Tesseract con whitelist 0123456789 potrebbe essere piu' controllabile.

Strategia

  • Verificare se tesseract.exe e' installato.
  • Se manca, installare/abilitare Tesseract e il package Python pytesseract.
  • Aggiungere supporto server a wms_ocr_mode = tesseract.
  • Usare OCR numerico con:
    • preprocess OpenCV;
    • whitelist cifre;
    • --psm 7 o simile;
    • fallback udc non determinato se non legge un codice valido.

Nota

Tesseract va considerato un test, non ancora la soluzione definitiva. Se confonde cifre o produce risultati instabili, dovra' restituire udc non determinato.