티스토리 뷰

lmplot

  • linear model plot
  • 데이터에 적합된 회귀선을 같이 표현할 수 있음
  • 추세선을 사용하여 전체 데이터를 하나의 선으로 나타낼 수 있음
  • 산점도 그래프 + 추세선
  •  옵션
    • col : 지정된 컬럼의 값에 따라 다중 그래프가 자동으로 생성됨
    • hue : 지정된 컬럼의 값에 따라 그래프 색상이 구분됨
    • ci : 신뢰구간 설정값
      • N%의 신뢰구간
      • 추세선을 따라 반투명의 신뢰구간이 생김
      • 설정 안하려면 None/False/0
    • lowess : 회귀선이 아닌 lowess 곡선을 추가할 수 있음
      • 지역적으로 가중치를 부여하여 만드는 데이터의 추세선
      • 전체 데이터를 대표하는 단일한 예측선을 그리는 것이 아니라, 데이터 구간별로 제일 적합한 예측선을 그리는 것

 

lmplot(신뢰구간 O)

 

import seaborn as sns

sns.set(style='darkgrid')
tips = sns.load_dataset('tips')
sns.lmplot(x='total_bill', y='tip', data=tips)

 

 

 

 

 

 

 

lmplot (신뢰구간 X)

 

import seaborn as sns

sns.set(style='darkgrid')
tips = sns.load_dataset('tips')
sns.lmplot(x='total_bill', y='tip', data=tips, ci=None)

 

 

 

 

 

 

 

다중 그래프 (col, hue)

sns.lmplot(x='total_bill', y='tip', hue='day', col='time', data=tips)

 

lowess 추세선 그래프

sns.lmplot(x='total_bill', y='tip', lowess=True, data=tips)

댓글