1.1 KiB
1.1 KiB
Aggiornamento 2026-05-17 09:39
Preparazione dataset per fine-tuning YOLO OCR
E' stata creata la struttura dataset nel laboratorio:
C:\devel\yolo-ocr\dataset
Cartelle principali:
dataset\images\to_annotate
dataset\images\train
dataset\images\val
dataset\images\test
dataset\labels\to_annotate
dataset\labels\train
dataset\labels\val
dataset\labels\test
dataset\annotations_raw
dataset\manifests
Sono state copiate 28 immagini in:
C:\devel\yolo-ocr\dataset\images\to_annotate
E' stato creato:
C:\devel\yolo-ocr\dataset\data.yaml
C:\devel\yolo-ocr\dataset\README_ANNOTAZIONE.md
Regola di annotazione:
- annotare ogni singola cifra del codice UDC;
- usare classi
0..9; - non annotare l'intera etichetta;
- non annotare testi, righe o loghi;
- non annotare cifre troppo ambigue.
Valutazione quantita' dati:
- le 28 immagini attuali sono poche;
- possono bastare per una demo controllata o per un primo proof-of-concept;
- non bastano per una soluzione robusta da campo;
- per robustezza reale servira' arrivare a centinaia di crop, includendo casi difficili.