Files
flywms/aggiornamento-2026-05-17-09-39.md
2026-05-19 08:52:44 +02:00

54 lines
1.1 KiB
Markdown

# Aggiornamento 2026-05-17 09:39
## Preparazione dataset per fine-tuning YOLO OCR
E' stata creata la struttura dataset nel laboratorio:
```text
C:\devel\yolo-ocr\dataset
```
Cartelle principali:
```text
dataset\images\to_annotate
dataset\images\train
dataset\images\val
dataset\images\test
dataset\labels\to_annotate
dataset\labels\train
dataset\labels\val
dataset\labels\test
dataset\annotations_raw
dataset\manifests
```
Sono state copiate 28 immagini in:
```text
C:\devel\yolo-ocr\dataset\images\to_annotate
```
E' stato creato:
```text
C:\devel\yolo-ocr\dataset\data.yaml
C:\devel\yolo-ocr\dataset\README_ANNOTAZIONE.md
```
Regola di annotazione:
- annotare ogni singola cifra del codice UDC;
- usare classi `0..9`;
- non annotare l'intera etichetta;
- non annotare testi, righe o loghi;
- non annotare cifre troppo ambigue.
Valutazione quantita' dati:
- le 28 immagini attuali sono poche;
- possono bastare per una demo controllata o per un primo proof-of-concept;
- non bastano per una soluzione robusta da campo;
- per robustezza reale servira' arrivare a centinaia di crop, includendo casi difficili.