pipeline in linea single thread
This commit is contained in:
26
aggiornamento-2026-05-16-14-34.md
Normal file
26
aggiornamento-2026-05-16-14-34.md
Normal file
@@ -0,0 +1,26 @@
|
||||
# Aggiornamento 2026-05-16 14:34
|
||||
|
||||
## Milestone test Tesseract OCR
|
||||
|
||||
## Obiettivo
|
||||
|
||||
Valutare Tesseract come alternativa piu' leggera a EasyOCR per leggere codici numerici sulle etichette.
|
||||
|
||||
## Motivazione
|
||||
|
||||
EasyOCR si e' rivelato fragile sui crop piccoli/tagliati e molto pesante in RAM/tempo di avvio. Per codici numerici semplici, Tesseract con whitelist `0123456789` potrebbe essere piu' controllabile.
|
||||
|
||||
## Strategia
|
||||
|
||||
- Verificare se `tesseract.exe` e' installato.
|
||||
- Se manca, installare/abilitare Tesseract e il package Python `pytesseract`.
|
||||
- Aggiungere supporto server a `wms_ocr_mode = tesseract`.
|
||||
- Usare OCR numerico con:
|
||||
- preprocess OpenCV;
|
||||
- whitelist cifre;
|
||||
- `--psm 7` o simile;
|
||||
- fallback `udc non determinato` se non legge un codice valido.
|
||||
|
||||
## Nota
|
||||
|
||||
Tesseract va considerato un test, non ancora la soluzione definitiva. Se confonde cifre o produce risultati instabili, dovra' restituire `udc non determinato`.
|
||||
Reference in New Issue
Block a user