Un modello di regressione è un modello matematico che cerca di determinare la relazione tra una variabile dipendente (Y) rispetto ad altre cosiddette variabili esplicative o indipendenti (X).
Il modello di regressione è solitamente utilizzato nelle scienze sociali per determinare se esiste o meno una relazione causale tra una variabile dipendente (Y) e un insieme di altre variabili esplicative (X). Allo stesso modo, il modello cerca di determinare quale sarà l’impatto sulla variabile Y in caso di cambiamento delle variabili esplicative (X).
Così, per esempio, un economista potrebbe essere interessato a determinare il rapporto tra il reddito dei lavoratori e il loro livello di istruzione. Per fare questo, potrebbe realizzare un modello di regressione in cui la variabile indipendente (Y) è il reddito del lavoratore. Per quanto riguarda le variabili esplicative (X), si dovrebbero includere tutte quelle che potrebbero spiegare il reddito, tra cui naturalmente l’istruzione, l’esperienza, l’istruzione dei genitori, ecc.
Forma del modello di regressione
Il modello di regressione semplice ha la seguente forma:
Y = A + BX + u
Y= variabile dipendente o endogena
X= variabile indipendente o esplicativa
A, B = parametri fissi e sconosciuti
u= termine di errore che cattura tutti gli altri fattori che influenzano Y ma non sono inclusi nel modello. È possibile anche catturare gli errori di stima della variabile dipendente. Non osservabile.
Quindi, l’obiettivo del modello di regressione sarà quello di stimare i valori di A e B da un campione.
Significato delle variabili
Il parametro B dovrebbe riflettere l’impatto di un cambiamento di X sulla variabile Y, quando il resto delle variabili esplicative rimane costante (ceteris paribus).
Il parametro A, tuttavia, non influisce sul rapporto tra Y e X, è solo una normalizzazione in cui il valore medio di u è assunto pari a zero.
Ad esempio, un modello di regressione lineare verrebbe disegnato come segue: