54 lines
1.1 KiB
Markdown
54 lines
1.1 KiB
Markdown
# Aggiornamento 2026-05-17 09:39
|
|
|
|
## Preparazione dataset per fine-tuning YOLO OCR
|
|
|
|
E' stata creata la struttura dataset nel laboratorio:
|
|
|
|
```text
|
|
C:\devel\yolo-ocr\dataset
|
|
```
|
|
|
|
Cartelle principali:
|
|
|
|
```text
|
|
dataset\images\to_annotate
|
|
dataset\images\train
|
|
dataset\images\val
|
|
dataset\images\test
|
|
dataset\labels\to_annotate
|
|
dataset\labels\train
|
|
dataset\labels\val
|
|
dataset\labels\test
|
|
dataset\annotations_raw
|
|
dataset\manifests
|
|
```
|
|
|
|
Sono state copiate 28 immagini in:
|
|
|
|
```text
|
|
C:\devel\yolo-ocr\dataset\images\to_annotate
|
|
```
|
|
|
|
E' stato creato:
|
|
|
|
```text
|
|
C:\devel\yolo-ocr\dataset\data.yaml
|
|
C:\devel\yolo-ocr\dataset\README_ANNOTAZIONE.md
|
|
```
|
|
|
|
Regola di annotazione:
|
|
|
|
- annotare ogni singola cifra del codice UDC;
|
|
- usare classi `0..9`;
|
|
- non annotare l'intera etichetta;
|
|
- non annotare testi, righe o loghi;
|
|
- non annotare cifre troppo ambigue.
|
|
|
|
Valutazione quantita' dati:
|
|
|
|
- le 28 immagini attuali sono poche;
|
|
- possono bastare per una demo controllata o per un primo proof-of-concept;
|
|
- non bastano per una soluzione robusta da campo;
|
|
- per robustezza reale servira' arrivare a centinaia di crop, includendo casi difficili.
|
|
|