27 lines
930 B
Markdown
27 lines
930 B
Markdown
# Aggiornamento 2026-05-16 14:34
|
|
|
|
## Milestone test Tesseract OCR
|
|
|
|
## Obiettivo
|
|
|
|
Valutare Tesseract come alternativa piu' leggera a EasyOCR per leggere codici numerici sulle etichette.
|
|
|
|
## Motivazione
|
|
|
|
EasyOCR si e' rivelato fragile sui crop piccoli/tagliati e molto pesante in RAM/tempo di avvio. Per codici numerici semplici, Tesseract con whitelist `0123456789` potrebbe essere piu' controllabile.
|
|
|
|
## Strategia
|
|
|
|
- Verificare se `tesseract.exe` e' installato.
|
|
- Se manca, installare/abilitare Tesseract e il package Python `pytesseract`.
|
|
- Aggiungere supporto server a `wms_ocr_mode = tesseract`.
|
|
- Usare OCR numerico con:
|
|
- preprocess OpenCV;
|
|
- whitelist cifre;
|
|
- `--psm 7` o simile;
|
|
- fallback `udc non determinato` se non legge un codice valido.
|
|
|
|
## Nota
|
|
|
|
Tesseract va considerato un test, non ancora la soluzione definitiva. Se confonde cifre o produce risultati instabili, dovra' restituire `udc non determinato`.
|