-
[Data Visualization] 데이터 시각화 - matplotlib(3) : histData Science/Data Visualization 2021. 1. 25. 16:41
Dataset
데이터 시각화에 앞서 데이터를 불러오겠습니다.
이번에 사용할 데이터는 tips 데이터 입니다.
tips = sns.load_dataset('tips')
histogram
히스토그램은 구간별 빈도수를 나타낸 그래프입니다.
tips 데이터의 total_bill로 히스토그램을 그려보았습니다.
히스토그램 그래프를 그리면 bins의 defalut가 10이므로, 구간을 동등하게 10개로 나누어줍니다.
plt.hist(tips['total_bill'])
range를 통해서 계급 범위의 최소 최대를 설정해줄 수 있습니다.
히스토그램의 범위는 bins를 통해 입력된 수만큼의 계급으로 동일하게 나눠집니다.
plt.hist(tips['total_bill'], range = (0, 60), # xmin : 0, xmax : 60 bins = 6) # the number of equal-width bins in the range : 6 plt.title('Histogram : Total Bill') plt.show()
단순 빈도수가 아닌 누적된 히스토그램을 그리기 위해서는 cumulative = True를 사용할 수 있습니다.
plt.hist(tips['total_bill'],range = (0, 60), bins = 6, cumulative = True)
히스토그램 타입의 default는 bar이지만, 그 외에 barstacked, step, stepfilled의 타입을 설정해줄 수 있습니다.
이 중 step은 채워지지 않은 라인형태의 히스토그램입니다.
step 타입의 히스토그램에서 라인의 너비는 linewidth로 지정해줄 수 있습니다.
plt.hist(tips['total_bill'], range = (0, 60), bins = 6, histtype = 'step', linewidth = 3, color = '#82589F')
'Data Science > Data Visualization' 카테고리의 다른 글
[Data Visualization] folium으로 지도에 데이터 시각화하기 (0) 2021.07.25 [Data Visualization] 데이터 시각화 - plotly : Interactive scatter plot (0) 2021.07.13 [Data Visualization] 데이터 시각화 - matplotlib(4) : pie (0) 2021.01.27 [Data Visualization] 데이터 시각화 - matplotlib(2) : scatter, bar, barh (0) 2021.01.24 [Data Visualization] 데이터 시각화 - matplotlib(1) (0) 2021.01.18