Differenza tra classificazione e regressione

Anonim

Classificazione e regressione

La classificazione e la regressione sono tecniche di apprendimento per creare modelli di previsione dai dati raccolti. Entrambe le tecniche vengono presentate graficamente come alberi di classificazione e regressione, o piuttosto diagrammi di flusso con divisioni di dati dopo ogni passo, o piuttosto "ramo" nell'albero. Questo processo si chiama partizione ricorsiva.

Classificazione è una tecnica utilizzata per arrivare ad uno schema che mostra l'organizzazione dei dati che iniziano con una variabile precursore. Le variabili dipendenti sono ciò che classifica i dati in gruppi. L'albero di classificazione inizia con la variabile indipendente, che si estende in due gruppi come determinata dalle variabili dipendenti esistenti. Si intende chiarire le risposte sotto forma di categorizzazione provocata dalle variabili dipendenti.

Regressione

La regressione è un metodo di previsione basato su un valore di uscita numerico presunto o noto. Questo valore di uscita è il risultato di una serie di partizioni ricorsive, con ogni passo con un valore numerico e un altro gruppo di variabili dipendenti che si estendono ad un'altra coppia come questa. L'albero di regressione inizia con una o più variabili precursori e termina con una variabile di output finale. Le variabili dipendenti sono variabili numeriche continue o discrete.

Qual è la differenza tra classificazione e regressione

La principale differenza tra l'albero di classificazione e l'albero di regressione è la loro variabile dipendente. Per l'albero di classificazione, le variabili dipendenti sono categoriche, mentre l'albero di regressione ha variabili dipendenti numeriche. Quelli della struttura di classificazione hanno anche una quantità impostata di valori non ordinati, mentre quelli dell'albero di regressione hanno valori discreti ma ordinati o valori indiscreti. Un albero di regressione è costruito allo scopo di installare un sistema di regressione a ciascun ramo determinante in modo che il valore di uscita previsto venga visualizzato. D'altra parte, una struttura di classificazione si espande come determinata da una variabile dipendente derivata dal nodo precedente.

Gli alberi di regressione e classificazione sono utili tecniche per mappare il processo che indica un esito studiato, sia nella classificazione che in un singolo valore numerico.

In breve:

• Gli alberi di classificazione hanno variabili dipendenti categoriche e non ordinate.

• Gli alberi di regressione hanno variabili dipendenti che sono valori continui o valori interi ordinati.