Files
flywms/aggiornamento-2026-05-16-14-34.md
2026-05-19 08:52:44 +02:00

27 lines
930 B
Markdown

# Aggiornamento 2026-05-16 14:34
## Milestone test Tesseract OCR
## Obiettivo
Valutare Tesseract come alternativa piu' leggera a EasyOCR per leggere codici numerici sulle etichette.
## Motivazione
EasyOCR si e' rivelato fragile sui crop piccoli/tagliati e molto pesante in RAM/tempo di avvio. Per codici numerici semplici, Tesseract con whitelist `0123456789` potrebbe essere piu' controllabile.
## Strategia
- Verificare se `tesseract.exe` e' installato.
- Se manca, installare/abilitare Tesseract e il package Python `pytesseract`.
- Aggiungere supporto server a `wms_ocr_mode = tesseract`.
- Usare OCR numerico con:
- preprocess OpenCV;
- whitelist cifre;
- `--psm 7` o simile;
- fallback `udc non determinato` se non legge un codice valido.
## Nota
Tesseract va considerato un test, non ancora la soluzione definitiva. Se confonde cifre o produce risultati instabili, dovra' restituire `udc non determinato`.