×
1 Scegli i certificati EITC/EITCA
2 Impara e sostieni gli esami online
3 Ottieni la certificazione delle tue competenze IT

Conferma le tue capacità e competenze IT nell'ambito del quadro di certificazione IT europeo da qualsiasi parte del mondo completamente online.

Accademia EITCA

Standard di attestazione delle competenze digitali da parte dell'Istituto europeo di certificazione informatica volto a sostenere lo sviluppo della società digitale

ACCEDI AL TUO ACCOUNT

CREA UN ACCOUNT HAI DIMENTICATO LA PASSWORD?

HAI DIMENTICATO LA PASSWORD?

AAH, aspetta, ora ricordo!

CREA UN ACCOUNT

HAI GIÀ UN ACCOUNT?
EUROPEE ACCADEMIA DI CERTIFICAZIONE DELLE TECNOLOGIE INFORMATICHE - ATTESTARE LE TUE COMPETENZE DIGITALI
  • ISCRIVITI
  • ACCEDI
  • INFO

Accademia EITCA

Accademia EITCA

L'Istituto europeo di certificazione delle tecnologie dell'informazione - EITCI ASBL

Fornitore di certificazione

Istituto EITCI ASBL

Bruxelles, Unione Europea

Quadro normativo europeo di certificazione IT (EITC) a supporto della professionalità IT e della società digitale

  • CERTIFICATI
    • ACCADEMIE EITCA
      • CATALOGO ACCADEMIE EITCA<
      • GRAFICA INFORMATICA EITCA/CG
      • EITCA/IS SICUREZZA DELLE INFORMAZIONI
      • INFORMAZIONI AZIENDALI EITCA/BI
      • COMPETENZE CHIAVE EITCA/KC
      • EITCA/EG E-GOVERNMENT
      • SVILUPPO WEB EITCA/WD
      • EITCA/AI ARTIFICIAL INTELLIGENCE
    • CERTIFICATI EITC
      • CATALOGO DEI CERTIFICATI EITC<
      • CERTIFICATI DI GRAFICA INFORMATICA
      • CERTIFICATI DI WEB DESIGN
      • CERTIFICATI DI PROGETTAZIONE 3D
      • CERTIFICATI IT PER L'UFFICIO
      • CERTIFICATO BLOCKCHAIN ​​DI BITCOIN
      • CERTIFICATO WORDPRESS
      • CERTIFICATO PIATTAFORMA CLOUDNUOVA
    • CERTIFICATI EITC
      • CERTIFICATI INTERNET
      • CERTIFICATI DI CRIPTOGRAFIA
      • CERTIFICATI IT COMMERCIALI
      • CERTIFICATI TELEWORK
      • CERTIFICATI DI PROGRAMMAZIONE
      • CERTIFICATO DIGITALE DI RITRATTO
      • CERTIFICATI DI SVILUPPO WEB
      • CERTIFICATI DI APPRENDIMENTO PROFONDONUOVA
    • CERTIFICATI PER
      • AMMINISTRAZIONE PUBBLICA DELL'UE
      • INSEGNANTI ED EDUCATORI
      • PROFESSIONISTI DELLA SICUREZZA IT
      • DESIGNER E ARTISTI GRAFICI
      • Uomini d'affari e dirigenti
      • SVILUPPI DELLA BLOCKCHAIN
      • SVILUPPATORI WEB
      • ESPERTI DI CLOUD AINUOVA
  • FEATURED
  • SUSSIDIO
  • COME FUNZIONA
  •   IT ID
  • CHI SIAMO
  • CONTATTI
  • IL MIO ORDINE
    Il tuo ordine attuale è vuoto.
EITCIINSTITUTE
CERTIFIED

Cos'è una metrica di valutazione?

by Naim Farag / Lunedi, 01 luglio 2024 / Pubblicato in Intelligenza Artificiale, EITC/AI/GCML Google Cloud Machine Learning, Primi passi nel Machine Learning, I 7 passaggi del machine learning

Una metrica di valutazione nel campo dell'intelligenza artificiale (AI) e dell'apprendimento automatico (ML) è una misura quantitativa utilizzata per valutare le prestazioni di un modello di apprendimento automatico. Queste metriche sono importanti in quanto forniscono un metodo standardizzato per valutare l'efficacia, l'efficienza e l'accuratezza del modello nel fare previsioni o classificazioni basate sui dati di input. Le metriche di valutazione sono essenziali in varie fasi della pipeline di machine learning, dalla selezione e messa a punto del modello alla distribuzione e al monitoraggio. Aiutano i data scientist e gli ingegneri a comprendere il rendimento dei loro modelli e a prendere decisioni informate su miglioramenti e aggiustamenti.

Le metriche di valutazione possono essere ampiamente classificate in diversi tipi in base alla natura dell'attività di machine learning, come classificazione, regressione, clustering e classificazione. Ogni tipo di attività ha metriche specifiche più appropriate per valutare le prestazioni dei modelli progettati per risolvere tale attività.

Metriche di classificazione

I compiti di classificazione implicano la previsione di etichette o categorie distinte per determinati input. Le metriche di valutazione comuni per i modelli di classificazione includono:

1. Precisione: il rapporto tra le istanze previste correttamente e le istanze totali. È una metrica semplice e intuitiva ma potrebbe non essere adatta a set di dati sbilanciati.

    \[ \text{Precisione} = \frac{\text{Numero di pronostici corretti}}{\text{Numero totale di pronostici}} \]

2. Precisione: il rapporto tra le previsioni positive vere e il totale dei positivi previsti. La precisione è importante quando il costo dei falsi positivi è elevato.

    \[ \text{Precisione} = \frac{\text{Veri Positivi}}{\text{Veri Positivi + Falsi Positivi}} \]

3. Richiamo (sensibilità o tasso di veri positivi): il rapporto tra le previsioni positive vere e il totale dei positivi effettivi. Il richiamo è importante quando il costo dei falsi negativi è elevato.

    \[ \text{Richiamo} = \frac{\text{Veri Positivi}}{\text{Veri Positivi + Falsi Negativi}} \]

4. Punteggio F1: La media armonica di precisione e richiamo, che fornisce un equilibrio tra i due. È particolarmente utile quando il set di dati è sbilanciato.

    \[ \text{Punteggio F1} = 2 \times \frac{\text{Precisione} \times \text{Richiamo}}{\text{Precisione + Richiamo}} \]

5. ROC-AUC (caratteristica operativa del ricevitore – area sotto curva): una metrica che valuta il compromesso tra tasso di veri positivi e tasso di falsi positivi tra diversi valori di soglia. L'AUC rappresenta la probabilità che un'istanza positiva scelta casualmente sia classificata più in alto di un'istanza negativa scelta casualmente.

    \[ \text{AUC} = \int_{0}^{1} \text{TPR}(FPR) \, d(\text{FPR}) \]

Metriche di regressione

Le attività di regressione implicano la previsione di valori continui. Le metriche di valutazione comuni per i modelli di regressione includono:

1. Errore assoluto medio (MAE): La media delle differenze assolute tra i valori previsti e quelli effettivi. Fornisce una misura semplice dell’accuratezza della previsione.

    \[ \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| \]

2. Errore quadratico medio (MSE): la media delle differenze al quadrato tra i valori previsti e quelli effettivi. Penalizza gli errori più grandi più del MAE.

    \[ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 \]

3. Errore quadratico medio della radice (RMSE): La radice quadrata dell'errore quadratico medio. Fornisce una misura dell'errore nelle stesse unità della variabile target.

    \[ \text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2} \]

4. R-quadrato (coefficiente di determinazione): Una misura statistica che rappresenta la proporzione della varianza nella variabile dipendente che è prevedibile dalle variabili indipendenti.

    \[ R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2} \]

Metriche di clustering

Le attività di clustering implicano il raggruppamento di istanze simili senza etichette predefinite. Le metriche di valutazione comuni per i modelli di clustering includono:

1. Punteggio silhouette: misura quanto un oggetto è simile al proprio cluster rispetto ad altri cluster. Varia da -1 a 1, con valori più alti che indicano un migliore clustering.

    \[ \text{Silhouette Score} = \frac{b - a}{\max(a, b)} \]

where a è la distanza media dagli altri punti nello stesso cluster e b è la distanza media dai punti nel cluster più vicino.

2. Indice Rand aggiustato (ARI): misura la somiglianza tra due cluster di dati, tenendo conto del caso. Varia da -1 a 1, con valori più alti che indicano un migliore accordo.

    \[ \text{ARI} = \frac{\text{RI} - \text{RI prevista}}{\text{RI massima} - \text{RI prevista}} \]

dove RI è l'indice Rand.

3. Indice Davies-Bouldin: misura il rapporto medio di somiglianza di ciascun cluster con il cluster ad esso più simile. Valori più bassi indicano un migliore clustering.

    \[ \text{Indice DB} = \frac{1}{n} \sum_{i=1}^{n} \max_{j \neq i} \left(\frac{s_i + s_j}{d_{ij }}\Giusto) \]

where s_i e s_j sono le dispersioni dei cluster e d_{ij} è la distanza tra i centroidi del cluster.

Metriche di classificazione

Le attività di classificazione implicano l'ordinamento delle istanze in base alla pertinenza o all'importanza. Le metriche di valutazione comuni per i modelli di classificazione includono:

1. Precisione media media (MAP): Misura la precisione media a diversi livelli di soglia, fornendo una misura della qualità a cifra singola tra i livelli di richiamo.

    \[ \text{MAP} = \frac{1}{Q} \sum_{q=1}^{Q} \text{AP}(q) \]

dove AP(q) è la precisione media per la query q.

2. Guadagno cumulativo scontato normalizzato (NDCG): misura l'utilità di un documento in base alla sua posizione nell'elenco dei risultati, con i documenti di livello superiore che contribuiscono maggiormente al punteggio.

    \[ \text{NDCG} = \frac{DCG}{IDCG} \]

dove DCG è il guadagno cumulativo scontato e IDCG è il DCG ideale.

3. Precisione a k (P@k): misura la percentuale di istanze rilevanti nella parte superiore k risultati.

    \[ P@k = \frac{\text{Numero di documenti rilevanti in alto } k}{k} \]

Importanza delle metriche di valutazione

Le metriche di valutazione sono indispensabili per diversi motivi:

1. Selezione del modello: È possibile confrontare diversi modelli utilizzando parametri standardizzati per determinare quale offre le migliori prestazioni in una determinata attività.
2. Sintonia iperparametro: le metriche guidano l'ottimizzazione degli iperparametri per ottimizzare le prestazioni del modello.
3. Monitoraggio delle prestazioni: le metriche aiutano a monitorare le prestazioni dei modelli distribuiti per garantire che continuino a funzionare bene nel tempo.
4. Decisioni aziendali: Le metriche traducono le prestazioni tecniche in risultati rilevanti per il business, aiutando i processi decisionali.

Applicazione di esempio

Consideriamo un problema di classificazione binaria in cui viene utilizzato un modello per prevedere se un'e-mail è spam o meno. Il set di dati contiene 1000 email, di cui 100 etichettate come spam (classe positiva) e 900 come non spam (classe negativa). Il modello fa le seguenti previsioni:

– Veri Positivi (TP): 80 (e-mail di spam identificate correttamente come spam)
– Falsi positivi (FP): 10 (e-mail non spam erroneamente identificate come spam)
– Veri negativi (TN): 880 (e-mail non spam correttamente identificate come non spam)
– Falsi negativi (FN): 30 (e-mail di spam erroneamente identificate come non spam)

Utilizzando questi valori, possiamo calcolare diverse metriche di valutazione:

- Precisione:

    \[ \text{Precisione} = \frac{TP + TN}{TP + TN + FP + FN} = \frac{80 + 880}{80 + 880 + 10 + 30} = 0.96 \]

- Precisione:

    \[ \text{Precisione} = \frac{TP}{TP + FP} = \frac{80}{80 + 10} = 0.89 \]

- Richiamo:

    \[ \text{Richiamo} = \frac{TP}{TP + FN} = \frac{80}{80 + 30} = 0.73 \]

- Punteggio F1:

    \[ \text{Punteggio F1} = 2 \times \frac{\text{Precisione} \times \text{Richiamo}}{\text{Precisione + Richiamo}} = 2 \times \frac{0.89 \times 0.73}{ 0.89 + 0.73} = 0.80 \]

- ROC-AUC: calcolato utilizzando il tasso di veri positivi e il tasso di falsi positivi a varie soglie, ottenendo un valore AUC che fornisce una misura a cifra singola della capacità del modello di distinguere tra classi.

Queste metriche forniscono una comprensione completa delle prestazioni del modello, evidenziandone i punti di forza e le aree di miglioramento. Ad esempio, sebbene la precisione sia elevata, il richiamo indica che il modello non rileva una parte significativa delle e-mail di spam, il che potrebbe essere problematico in uno scenario reale.

Le metriche di valutazione sono fondamentali per il processo iterativo dell'apprendimento automatico, poiché consentono ai professionisti di perfezionare i modelli e ottenere i risultati desiderati in modo efficace.

Altre domande e risposte recenti riguardanti EITC/AI/GCML Google Cloud Machine Learning:

  • Quali sono alcuni algoritmi AI/ML comuni da utilizzare sui dati elaborati?
  • In che modo i modelli Keras sostituiscono gli stimatori TensorFlow?
  • Come configurare uno specifico ambiente Python con Jupyter Notebook?
  • Come utilizzare TensorFlow Serving?
  • Che cos'è Classifier.export_saved_model e come utilizzarlo?
  • Perché la regressione viene spesso utilizzata come predittore?
  • I moltiplicatori di Lagrange e le tecniche di programmazione quadratica sono rilevanti per l'apprendimento automatico?
  • È possibile applicare più di un modello durante il processo di apprendimento automatico?
  • Il Machine Learning può adattare l'algoritmo da utilizzare a seconda dello scenario?
  • Qual è il percorso più semplice per un principiante assoluto senza alcuna formazione di programmazione, per l'addestramento e l'implementazione di modelli di intelligenza artificiale di base su Google AI Platform utilizzando una versione di prova/livello gratuito e una console GUI in modo graduale?

Visualizza altre domande e risposte in EITC/AI/GCML Google Cloud Machine Learning

Altre domande e risposte:

  • Settore: Intelligenza Artificiale
  • programma: EITC/AI/GCML Google Cloud Machine Learning (vai al programma di certificazione)
  • Lezione: Primi passi nel Machine Learning (vai alla lezione correlata)
  • Argomento: I 7 passaggi del machine learning (vai all'argomento correlato)
Etichettato sotto: Intelligenza Artificiale, Classificazione, il clustering, Metriche di valutazione, Posizione, Regressione
Casa » Intelligenza Artificiale/EITC/AI/GCML Google Cloud Machine Learning/Primi passi nel Machine Learning/I 7 passaggi del machine learning » Cos'è una metrica di valutazione?

Centro di certificazione

MENU UTENTE

  • Il Mio Account

CATEGORIA DI CERTIFICATI

  • Certificazione EITC (105)
  • Certificazione EITCA (9)

Che cosa stai cercando?

  • Introduzione
  • Come funziona?
  • Accademie EITCA
  • Sovvenzione EITCI DSJC
  • Catalogo completo dell'EITC
  • Il tuo ordine
  • In Evidenza
  •   IT ID
  • Recensioni EITCA (Publ. media)
  • Chi Siamo
  • Contatti

EITCA Academy fa parte del framework europeo di certificazione IT

Il quadro europeo di certificazione IT è stato istituito nel 2008 come standard europeo e indipendente dai fornitori per la certificazione online ampiamente accessibile delle abilità e delle competenze digitali in molte aree delle specializzazioni digitali professionali. Il quadro EITC è disciplinato dal Istituto europeo di certificazione IT (EITCI), un'autorità di certificazione senza scopo di lucro che sostiene la crescita della società dell'informazione e colma il divario di competenze digitali nell'UE.

Idoneità per l'Accademia EITCA 80% Sovvenzione EITCI DSJC

80% delle tasse EITCA Academy sovvenzionato in iscrizione da

    Ufficio di segreteria dell'Accademia EITCA

    Istituto europeo di certificazione informatica ASBL
    Bruxelles, Belgio, Unione Europea

    Operatore del framework di certificazione EITC/EITCA
    Standard europeo di certificazione IT applicabile
    accesso a contact form oppure chiama +32 25887351

    Segui EITCI su X
    Visita EITCA Academy su Facebook
    Interagisci con EITCA Academy su LinkedIn
    Guarda i video EITCI e EITCA su YouTube

    Finanziato dall'Unione Europea

    Finanziato dalla Fondo europeo di sviluppo regionale (FESR) e le Fondo sociale europeo (FSE) in una serie di progetti dal 2007, attualmente governati dal Istituto europeo di certificazione IT (EITCI) dal 2008

    Politica sulla sicurezza delle informazioni | Politica DSRRM e GDPR | Politica di protezione dei dati | Registro delle attività di trattamento | Politica HSE | Politica anticorruzione | Politica sulla schiavitù moderna

    Traduci automaticamente nella tua lingua

    Termini e condizioni | Politica sulla Riservatezza
    Accademia EITCA
    • Accademia EITCA sui social media
    Accademia EITCA


    © 2008-2025  Istituto Europeo di Certificazione IT
    Bruxelles, Belgio, Unione Europea

    TOP
    Chatta con l'assistenza
    Chatta con l'assistenza
    Domande, dubbi, problemi? Siamo qui per aiutarvi!
    Termina chat
    Connettendo ...
    Hai qualche domanda?
    Hai qualche domanda?
    :
    :
    :
    Invia
    Hai qualche domanda?
    :
    :
    Avvia chat
    La sessione di chat è terminata. Grazie!
    Valuta il supporto che hai ricevuto.
    Buone Piscina