Quali sono i componenti chiave di una rete neurale convoluzionale (CNN) e i rispettivi ruoli nelle attività di riconoscimento delle immagini?

by Accademia EITCA / Martedì, Agosto 08 2023 / Pubblicato in Intelligenza Artificiale, Apprendimento approfondito EITC/AI/DLTF con TensorFlow, Reti neurali convoluzionali in TensorFlow, Reti neurali convoluzionali con TensorFlow, Revisione d'esame

Una rete neurale convoluzionale (CNN) è un tipo di modello di apprendimento profondo che è stato ampiamente utilizzato nelle attività di riconoscimento delle immagini. È specificamente progettato per elaborare e analizzare efficacemente i dati visivi, rendendolo un potente strumento nelle applicazioni di visione artificiale. In questa risposta, discuteremo i componenti chiave di una CNN e i loro rispettivi ruoli nelle attività di riconoscimento delle immagini.

1. Strati convoluzionali: gli strati convoluzionali sono gli elementi costitutivi di una CNN. Consistono in una serie di filtri o kernel apprendibili che vengono convoluti con l'immagine di input per produrre mappe delle caratteristiche. Ogni filtro rileva un motivo o una caratteristica specifica nell'immagine, come bordi, angoli o trame. L'operazione di convoluzione implica lo scorrimento del filtro sull'immagine e il calcolo del prodotto scalare tra i pesi del filtro e il patch dell'immagine corrispondente. Questo processo viene ripetuto per ogni posizione nell'immagine, generando una mappa delle caratteristiche che evidenzia la presenza di diverse caratteristiche.

Esempio: consideriamo un filtro 3×3 che rileva i bordi orizzontali. Quando contorto con un'immagine di input, produrrà una mappa delle caratteristiche che enfatizza i bordi orizzontali nell'immagine.

2. Livelli di raggruppamento: i livelli di raggruppamento vengono utilizzati per eseguire il downsampling delle mappe delle caratteristiche generate dai livelli convoluzionali. Riducono le dimensioni spaziali delle mappe caratteristiche conservando le informazioni più importanti. L'operazione di pooling più comunemente utilizzata è il pooling massimo, che seleziona il valore massimo all'interno di una finestra di pooling. Questo aiuta a ridurre la complessità computazionale della rete e la rende più robusta a piccole variazioni spaziali nell'immagine di input.

Esempio: l'applicazione del pool massimo con una finestra di pooling 2 × 2 su una mappa delle caratteristiche selezionerà il valore massimo in ciascuna regione 2 × 2 non sovrapposta, riducendo di fatto le dimensioni spaziali della metà.

3. Funzioni di attivazione: le funzioni di attivazione introducono la non linearità nella CNN, consentendole di apprendere modelli complessi e fare previsioni. La funzione di attivazione più comunemente utilizzata nelle CNN è l'unità lineare rettificata (ReLU), che calcola l'output come il massimo di zero e l'input. ReLU è preferito per la sua semplicità e capacità di alleviare il problema del gradiente di fuga.

Esempio: se l'output di un neurone è negativo, ReLU lo imposta su zero, spegnendo di fatto il neurone. Se l'output è positivo, ReLU lo mantiene invariato.

4. Livelli completamente connessi: i livelli completamente connessi sono responsabili delle previsioni finali basate sulle feature estratte. Prendono le mappe delle caratteristiche appiattite dai livelli precedenti e le passano attraverso una serie di neuroni completamente connessi. Ogni neurone nello strato completamente connesso è connesso a ogni neurone nello strato precedente, consentendogli di apprendere relazioni complesse tra le caratteristiche e fare previsioni accurate.

Esempio: in un'attività di riconoscimento di immagini, il livello completamente connesso potrebbe avere neuroni corrispondenti a classi diverse, come "gatto", "cane" e "auto". L'output del livello completamente connesso può essere interpretato come le probabilità dell'immagine di input appartenente a ciascuna classe.

5. Funzione di perdita: la funzione di perdita misura la discrepanza tra gli output previsti e le etichette di verità di base. Quantifica quanto bene la CNN sta eseguendo il compito da svolgere e fornisce un segnale per l'aggiornamento dei parametri del modello durante l'addestramento. La scelta della funzione di perdita dipende dallo specifico compito di riconoscimento dell'immagine, come l'entropia incrociata binaria per la classificazione binaria o l'entropia incrociata categoriale per la classificazione multiclasse.

Esempio: in un'attività di classificazione binaria, la perdita di entropia incrociata binaria confronta la probabilità prevista della classe positiva con l'etichetta vera (0 o 1) e penalizza le grandi discrepanze tra di esse.

Una rete neurale convoluzionale (CNN) è costituita da livelli convoluzionali, livelli di raggruppamento, funzioni di attivazione, livelli completamente connessi e una funzione di perdita. I livelli convoluzionali estraggono caratteristiche significative dall'immagine di input, mentre i livelli di raggruppamento effettuano il downsampling delle mappe delle caratteristiche. Le funzioni di attivazione introducono la non linearità e gli strati completamente connessi effettuano le previsioni finali. La funzione di perdita misura la discrepanza tra gli output previsti e le etichette di verità di base, guidando il processo di formazione.

Altre domande e risposte recenti riguardanti Reti neurali convoluzionali in TensorFlow:

Altre domande e risposte:

Settore: Intelligenza Artificiale
programma: Apprendimento approfondito EITC/AI/DLTF con TensorFlow (vai al programma di certificazione)
Lezione: Reti neurali convoluzionali in TensorFlow (vai alla lezione correlata)
Argomento: Reti neurali convoluzionali con TensorFlow (vai all'argomento correlato)
Revisione d'esame

Etichettato sotto: Intelligenza Artificiale, CNN, Visione computerizzata, Rete neurale convoluzionale, Deep Learning, Riconoscimento dell'immagine

Accademia EITCA

Quali sono i componenti chiave di una rete neurale convoluzionale (CNN) e i rispettivi ruoli nelle attività di riconoscimento delle immagini?

Altre domande e risposte recenti riguardanti Reti neurali convoluzionali in TensorFlow:

Altre domande e risposte:

EITCA Academy fa parte del framework europeo di certificazione IT

Idoneità per l'Accademia EITCA 80% Sovvenzione EITCI DSJC

Accademia EITCA

ACCEDI AL TUO ACCOUNT TRAMITE IL TUO NOME UTENTE O INDIRIZZO E-MAIL

HAI DIMENTICATO I TUOI DATI?

CREA UN ACCOUNT

Quali sono i componenti chiave di una rete neurale convoluzionale (CNN) e i rispettivi ruoli nelle attività di riconoscimento delle immagini?

Altre domande e risposte recenti riguardanti Reti neurali convoluzionali in TensorFlow:

Altre domande e risposte:

Idoneità per l'Accademia EITCA 80% Sovvenzione EITCI DSJC