Differenza tra regressione lineare e logistica: regressione lineare vs regressione logistica
Lineare vs regressione logistica
Nell'analisi statistica è importante individuare le relazioni tra le variabili interessate allo studio. A volte può essere il solo scopo dell'analisi stessa. Uno strumento forte utilizzato per stabilire l'esistenza di rapporti e identificare la relazione è l'analisi di regressione.
La forma più semplice di analisi di regressione è la regressione lineare, dove la relazione tra le variabili è una relazione lineare. In termini statistici, evidenzia la relazione tra la variabile esplicativa e la variabile di risposta. Ad esempio, utilizzando la regressione possiamo stabilire la relazione tra il prezzo delle materie prime e il consumo in base ai dati raccolti da un campione casuale. L'analisi di regressione produrrà una funzione di regressione del set di dati, che è un modello matematico che meglio si adatta ai dati disponibili. Questo può essere facilmente rappresentato da una trama di dispersione. La regressione grafica è equivalente a trovare la migliore curva di montaggio per il set di dati dato. La funzione della curva è la funzione di regressione. Utilizzando il modello matematico, l'uso di una merce può essere previsto per un determinato prezzo.
Pertanto, l'analisi di regressione è ampiamente utilizzata nella previsione e nella previsione. È anche usato per stabilire le relazioni in dati sperimentali, nei settori della fisica, della chimica e in molte scienze naturali e discipline di ingegneria. Se la relazione o la funzione di regressione è una funzione lineare, allora il processo è conosciuto come una regressione lineare. Nella trama di dispersione, può essere rappresentata come una linea retta. Se la funzione non è una combinazione lineare dei parametri, allora la regressione è non lineare.
La regressione logistica è paragonabile alla regressione multivariata e crea un modello per spiegare l'impatto di più predittori su una variabile di risposta. Tuttavia, nella regressione logistica, la variabile del risultato finale dovrebbe essere categorico (generalmente diviso, cioè un paio di risultati raggiungibili, come la morte o la sopravvivenza, anche se tecniche speciali consentono di modellare informazioni più categorizzate). Una variabile di esito continuo può essere trasformata in una variabile categoriale, da utilizzare per la regressione logistica; comunque, la collisione di variabili continue in questo modo è scoraggiata principalmente perché riduce l'accuratezza.
A differenza della regressione lineare, verso la media, le variabili predittori nella regressione logistica non devono essere costrette a essere collegate linearmente, distribuite comunemente, o per avere una varianza uguale all'interno di ogni cluster.Di conseguenza, la relazione tra i predittori e le variabili di risultato non è probabile che sia una funzione lineare.
Qual è la differenza tra la regressione logistica e quella lineare?
• Nella regressione lineare si assuma una relazione lineare tra la variabile esplicativa e la variabile di risposta e i parametri che soddisfano il modello vengono trovati per analisi, per dare la relazione esatta.
• Viene eseguita una regressione lineare per variabili quantitative e la funzione risultante è una quantità quantitativa.
• Nella regressione logistica i dati utilizzati possono essere categorici o quantitativi, ma il risultato è sempre categorico.