La co-integrazione avviene quando esiste una forte relazione a lungo termine tra le variabili. Il fatto che due variabili siano co-integrate implica che, sebbene crescano nel tempo, lo facciano in modo sincronizzato. Mantengono questo rapporto nel tempo.
Il concetto di cointegrazione nasce dal problema di cercare di sapere se due o più variabili sono, di fatto, correlate. Molte relazioni tra le variabili possono essere spurie, cioè false. Spurio significa che, anche se statisticamente sembra che siano correlati, è puro caso. Di seguito è riportato un grafico che restituisce due variabili (x e x1).
Questo grafico è costruito con due serie generate in modo casuale utilizzando un software di programmazione statistica chiamato R Studio. Poiché le variabili sono state generate in modo casuale, la minima relazione esistente è pura casualità. Tuttavia, quando guardiamo il grafico possiamo pensare che abbiano un rapporto stabile. Quando x cresce, cresce anche x1. Inoltre, quando eseguiamo un modello di regressione lineare che spiega il valore di x secondo quello di x1, otteniamo la linea di regressione presente nel grafico. Questo indica un quadrato R di 0,62. In altre parole, x1 può spiegare il 62% delle variazioni di x.
Il fatto che queste due serie, totalmente casuali e indipendenti l’una dall’altra, possano avere una relazione apparente, apre la porta a un mondo di infinite possibilità in cui molte variabili non correlate possono sembrare avere una relazione. In questo senso, i test di cointegrazione hanno il compito di determinare se questa relazione è vera e ha senso, o se è falsa. Trattandosi di test statistici basati su formule matematiche, non sono infallibili. Tuttavia, si tratta di test molto impegnativi che garantiscono un’altissima probabilità di evitare relazioni spurie.
Fasi per effettuare un test di cointegrazione
Per semplificare la spiegazione ci occuperemo solo di due variabili (x e x1). Queste due variabili possono essere due variabili qualsiasi. Ad esempio, l’inflazione e i tassi d’interesse. O il PIL e il tasso di disoccupazione. Elenchiamo quindi i passi per determinare se una relazione è spuria o meno, attraverso un test di cointegrazione.
1. Stabilire la relazione tra le variabili
Il modo più potente per intuire il rapporto tra due variabili è, in economia, la logica economica. Le statistiche, e più specificamente l’econometria, cercano solo di mettere i numeri. Ma deve essere l’economista o l’econometrico che, attraverso la teoria economica, stabilisce la logica del rapporto.
2. Estrarre i dati e generare il modello
Una volta estratti i dati, i dati sono affidabili e privi di errori di stima, il modello sarà generato. Anche se ci sono più situazioni, possiamo trovarne, per semplicità, due:
- x e x1 sono fermi. È stimato dai quadrati minimi ordinari (MCO)
- Le serie non sono stazionarie ma sono co-integrate.
3. Test di cointegrazione
Il test di cointegrazione più famoso è il test Dickey-Fuller. Il test viene effettuato sulla serie dei residui. Cioè, noi facciamo il modello. Nel nostro caso, cerchiamo di spiegare x in funzione dei valori di x1. La differenza tra i valori reali di x e la stima di x è chiamata residuo. Il test viene effettuato sulla serie di residui. Quindi, se il test può confermare che i residui sono fermi, le variabili saranno co-integrate, altrimenti non lo saranno.
A cosa serve la cointegrazione?
La cointegrazione è utile in economia per realizzare modelli predittivi affidabili. Anche nel caso di trading utilizzando tecniche di arbitraggio statistico come il pairs trading. O per realizzare modelli basati su variabili macroeconomiche che consentano di stimare il valore di un’attività in un determinato momento. Un chiaro esempio dell’utilità della co-integrazione è nel pairs trading. Se non assicuriamo che due attività finanziarie non abbiano un rapporto stabile nel tempo, potremmo perdere molto capitale investito con questa strategia.