Come fare un grafico con la retta di regressione lineare su Python
Per disegnare la regressione lineare tra due variabili di un insieme di dati, utilizzo la funzione regplot() della libreria seaborn di python.
sns.regplot(x="var1", y="var1", data=archivio);
Questa funzione visualizza la dispersione tra le due variabili sul diagramma cartesiano a due dimensioni, poi calcola e aggiunge la retta della regressione lineare.
Un esempio pratico
Carico in memoria le librerie numpy, seaborn e matplotlib.
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
Poi carico in memoria un dataset didattico con la funzione load_dataset() e lo salvo nella variabile tips.
tips=sns.load_dataset("tips")
Il dataset contiene una serie di dati organizzati su più campi.
Ogni colonna è un campo della struttura dei dati.
Prendo in considerazione le variabili "total_bill" e "tip" dell'archivio "tips" nella funzione regplot().
La variabile "total_bill" la assegno all'asse delle ascisse (x) mentre la variabile "tip" all'asse delle ordinate (y).
sns.regplot(x="total_bill", y="tip", data=tips);
A questo punto stampo il grafico con la funzione show() di matplotlib.
plt.show()
Il risultato finale è il diagramma di dispersione delle due variabili con la retta di regressione lineare.
E così via.