# Aggiornamento 2026-05-17 09:39 ## Preparazione dataset per fine-tuning YOLO OCR E' stata creata la struttura dataset nel laboratorio: ```text C:\devel\yolo-ocr\dataset ``` Cartelle principali: ```text dataset\images\to_annotate dataset\images\train dataset\images\val dataset\images\test dataset\labels\to_annotate dataset\labels\train dataset\labels\val dataset\labels\test dataset\annotations_raw dataset\manifests ``` Sono state copiate 28 immagini in: ```text C:\devel\yolo-ocr\dataset\images\to_annotate ``` E' stato creato: ```text C:\devel\yolo-ocr\dataset\data.yaml C:\devel\yolo-ocr\dataset\README_ANNOTAZIONE.md ``` Regola di annotazione: - annotare ogni singola cifra del codice UDC; - usare classi `0..9`; - non annotare l'intera etichetta; - non annotare testi, righe o loghi; - non annotare cifre troppo ambigue. Valutazione quantita' dati: - le 28 immagini attuali sono poche; - possono bastare per una demo controllata o per un primo proof-of-concept; - non bastano per una soluzione robusta da campo; - per robustezza reale servira' arrivare a centinaia di crop, includendo casi difficili.