
전국에는 편의점 점포 수 보다 미용실 점포 수가 더 많다고 한다. 이 말을 듣고 보니, 집 주변 번화가의 건물마다 미용실 하나씩 있는 것 같다. 서울시에 위치한 미용실의 위치와 어떤 체인점이 가장 많은지 알아보면 재밌을 것 같다. 1. 데이터 다운로드 서울 점포 수 데이터는 공공데이터 홈페이지에서 가져왔다. 홈페이지에서 상공인시장진흥공단_상가(상권)정보 을 검색하면 csv로 파일을 받을 수 있다. 영업 중인 전국 상가업소 데이터를 제공합니다. (상호명, 업종코드, 업종명, 지번주소, 도로명주소, 경도, 위도 등) 등록일자 : 2023-10-25 https://www.data.go.kr/ 2. 데이터 전처리 (1) 준비 라이브러리 세팅 및 한글 깨짐 방지 폰트 설정 # 폰트 설치 !apt-get updat..

countplot 카테고리별 데이터 값을 셀 수 있음 별도의 집계 코드를 작성하지 않아도 됨 matplotlib 에서 카운팅 그래프를 그리기 위해선, 카테고리별 집계 코드가 필요함 import seaborn as sns titanic = sns.load_dataset('titanic') sns.countplot(x="class", data=titanic) plt.show() distplot 히스토그램 그릴 때 사용 러그나 커널 밀도와 같이 추정된 확률밀도함수 표시 기능이 있음 hist_kws : 그래프를 꾸밀 수 있음 edgecolor : 바그래프 테두리 색상 facecolor : 바그래프 내부 색상 linewidth : 바그래프 테두리 굵기 x = np.random.randn(200) sns.distp..

lmplot linear model plot 데이터에 적합된 회귀선을 같이 표현할 수 있음 추세선을 사용하여 전체 데이터를 하나의 선으로 나타낼 수 있음 산점도 그래프 + 추세선 옵션 col : 지정된 컬럼의 값에 따라 다중 그래프가 자동으로 생성됨 hue : 지정된 컬럼의 값에 따라 그래프 색상이 구분됨 ci : 신뢰구간 설정값 N%의 신뢰구간 추세선을 따라 반투명의 신뢰구간이 생김 설정 안하려면 None/False/0 lowess : 회귀선이 아닌 lowess 곡선을 추가할 수 있음 지역적으로 가중치를 부여하여 만드는 데이터의 추세선 전체 데이터를 대표하는 단일한 예측선을 그리는 것이 아니라, 데이터 구간별로 제일 적합한 예측선을 그리는 것 lmplot(신뢰구간 O) import seaborn as ..

replot relation plot 라인 그래프와 산점도 그래프를 모두 그릴 수 있는 방법 옵션 hue : 지정된 컬럼값에 따라 그래프 색상이 구분됨 col : 지정된 컬럼값에 따라 다중 그래프가 자동으로 생성됨 ci : 신뢰구간 설정값 N%의 신뢰구간 선그래프일 때에만 유효함 (when kind='line') 선그래프를 따라 반투명의 신뢰구간이 생김 설정 안하려면 None/False/0 kind : 그래프 스타일 line : 선 그래프 scatter : 산점도 그래프 (기본값) palette : 색상 조합 선그래프 그리기 import seaborn as sns sns.set(style='darkgrid') plt.rc('font', size=15) fmri = sns.load_dataset("fmri..
seaborn 특징 matplotlib 의 확장 버전 matplotlib와 비교하여 비교적 간단한 문법 다중 그래프 자동화 생성 기능 자체적으로 제공하는 테마 외에는 유연성이 떨어짐 통계 서포트 기능을 함 다양한 컬러 팔레트 pandas 데이터 프레임과 높은 호환성 matplotlib 그래프와의 높은 호환성 seaborn 기본 옵션 x : x축 라벨 y : y축 라벨 hue : 지정한 컬럼의 값에 따라 그래프의 색상 구분 col : 지정한 컬럼의 값에 따라 다중 그래프 자동 생성

histogram 빈도 분포를 표현하고자할 때, 히스토그램 그래프가 시각적으로 효과적임 plt.hist x : 발생빈도가 있는 값 bins : 가로축 구간의 개수 bins vs. xticks density : yticks 를 퍼센트 비율료 표현 여부 orientiation : vertical or horizontal histtype : 히스토그램 종류 bar (default) barstacked step stepfilled cumulative : 누적 히스토그램 여부 x = [x for x in range(1, 11) if x%2==0] x = x*2 plt.hist(x, edgecolor='black', width=0.5) plt.yticks(np.linspace(0, 2, 3)) plt.show() ..

piechart 카테고리 별 값의 상대적인 비교를 할 경우, pie 차트가 시각적으로 효과적임 plt.pie() x : 카테고리 값 colors : ['색상'] width : '폭' explode : ['돌출 옵션'] labels : 각 카테고리명 autopct : 소수점 표시 ('%0.1f%%' : 소수점 첫째자리까지만 표시) shadow : 파이차트 그림자 표시 여부 # 데이터 생성 labels = ['애플', '삼성', '오포', '샤오미', '기타'] sizes = [16, 21, 16, 14, 33] colors = ['yellowgreen', 'gold', 'lightskyblue', 'lightcoral', 'lightgray'] plt.figure(figsize=(7,7)) plt.pie(..

bar graph x축이나 y축 중 하나의 값이 카테고리형일 경우 bar 형태의 그래프가 효과적임 세로방향 바그래프 : plt.bar(x, y, color=[색상], width=폭) 가로방향 바그래프 : plt.barh(x, y, color=[색상], width=폭) 가로 세로 바그래프 형태를 전환할 때에는 눈금 설정값, 축 라벨 등의 값을 재설정해야함 세로 바그래프 y = [80, 70, 40, 90, 60, 90] xlabel = ['국어', '수학', '영어', '과학', '미술', '체육'] plt.bar(xlabel, y) plt.yticks(np.linspace(0, 100, 5)) plt.ylabel('점수') plt.show() 가로 바그래프 y = [80, 70, 40, 90, 60, 9..
- Total
- Today
- Yesterday
- cleaned_data
- django 게시판
- 데이터베이스 추천
- CellForRowAt 호출안됨
- Realtime Database
- django tag
- 실시간 데이터베이스
- pythonanywhere배포방법
- iOS UITableView 출력안됨
- CellForRowAt Not Called
- iOS 화면 안나옴
- 웹 배포
- 까만 화면
- Django
- iOS 검은 화면
- django 로그인접근
- Firebase 데이터베이스 추천
- django 태그
- UITableViewController Not Working
- django clean
- 장고 태그달기
- 알파벳 카운팅
- iOS 데이터베이스
- ModelForm Form 차이
- 장고 게시판
- python 웹 배포
- 테이블출력안됨
- django 개발일지
- django pythoneverywhere
- pythonanywhere배포
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |