Files
flywms/aggiornamento-2026-05-17-09-39.md
2026-05-19 08:52:44 +02:00

1.1 KiB

Aggiornamento 2026-05-17 09:39

Preparazione dataset per fine-tuning YOLO OCR

E' stata creata la struttura dataset nel laboratorio:

C:\devel\yolo-ocr\dataset

Cartelle principali:

dataset\images\to_annotate
dataset\images\train
dataset\images\val
dataset\images\test
dataset\labels\to_annotate
dataset\labels\train
dataset\labels\val
dataset\labels\test
dataset\annotations_raw
dataset\manifests

Sono state copiate 28 immagini in:

C:\devel\yolo-ocr\dataset\images\to_annotate

E' stato creato:

C:\devel\yolo-ocr\dataset\data.yaml
C:\devel\yolo-ocr\dataset\README_ANNOTAZIONE.md

Regola di annotazione:

  • annotare ogni singola cifra del codice UDC;
  • usare classi 0..9;
  • non annotare l'intera etichetta;
  • non annotare testi, righe o loghi;
  • non annotare cifre troppo ambigue.

Valutazione quantita' dati:

  • le 28 immagini attuali sono poche;
  • possono bastare per una demo controllata o per un primo proof-of-concept;
  • non bastano per una soluzione robusta da campo;
  • per robustezza reale servira' arrivare a centinaia di crop, includendo casi difficili.