pipeline in linea single thread
This commit is contained in:
53
aggiornamento-2026-05-17-09-39.md
Normal file
53
aggiornamento-2026-05-17-09-39.md
Normal file
@@ -0,0 +1,53 @@
|
||||
# Aggiornamento 2026-05-17 09:39
|
||||
|
||||
## Preparazione dataset per fine-tuning YOLO OCR
|
||||
|
||||
E' stata creata la struttura dataset nel laboratorio:
|
||||
|
||||
```text
|
||||
C:\devel\yolo-ocr\dataset
|
||||
```
|
||||
|
||||
Cartelle principali:
|
||||
|
||||
```text
|
||||
dataset\images\to_annotate
|
||||
dataset\images\train
|
||||
dataset\images\val
|
||||
dataset\images\test
|
||||
dataset\labels\to_annotate
|
||||
dataset\labels\train
|
||||
dataset\labels\val
|
||||
dataset\labels\test
|
||||
dataset\annotations_raw
|
||||
dataset\manifests
|
||||
```
|
||||
|
||||
Sono state copiate 28 immagini in:
|
||||
|
||||
```text
|
||||
C:\devel\yolo-ocr\dataset\images\to_annotate
|
||||
```
|
||||
|
||||
E' stato creato:
|
||||
|
||||
```text
|
||||
C:\devel\yolo-ocr\dataset\data.yaml
|
||||
C:\devel\yolo-ocr\dataset\README_ANNOTAZIONE.md
|
||||
```
|
||||
|
||||
Regola di annotazione:
|
||||
|
||||
- annotare ogni singola cifra del codice UDC;
|
||||
- usare classi `0..9`;
|
||||
- non annotare l'intera etichetta;
|
||||
- non annotare testi, righe o loghi;
|
||||
- non annotare cifre troppo ambigue.
|
||||
|
||||
Valutazione quantita' dati:
|
||||
|
||||
- le 28 immagini attuali sono poche;
|
||||
- possono bastare per una demo controllata o per un primo proof-of-concept;
|
||||
- non bastano per una soluzione robusta da campo;
|
||||
- per robustezza reale servira' arrivare a centinaia di crop, includendo casi difficili.
|
||||
|
||||
Reference in New Issue
Block a user