flywms/aggiornamento-2026-05-16-14-34.md

# Aggiornamento 2026-05-16 14:34

## Milestone test Tesseract OCR

## Obiettivo

Valutare Tesseract come alternativa piu' leggera a EasyOCR per leggere codici numerici sulle etichette.

## Motivazione

EasyOCR si e' rivelato fragile sui crop piccoli/tagliati e molto pesante in RAM/tempo di avvio. Per codici numerici semplici, Tesseract con whitelist `0123456789` potrebbe essere piu' controllabile.

## Strategia

- Verificare se `tesseract.exe` e' installato.
- Se manca, installare/abilitare Tesseract e il package Python `pytesseract`.
- Aggiungere supporto server a `wms_ocr_mode = tesseract`.
- Usare OCR numerico con:
  - preprocess OpenCV;
  - whitelist cifre;
  - `--psm 7` o simile;
  - fallback `udc non determinato` se non legge un codice valido.

## Nota

Tesseract va considerato un test, non ancora la soluzione definitiva. Se confonde cifre o produce risultati instabili, dovra' restituire `udc non determinato`.