Data Science/Data Visualization
-
[Data Visualization] folium으로 지도에 데이터 시각화하기Data Science/Data Visualization 2021. 7. 25. 18:54
위도, 경도와 같은 지리 정보를 가지고 있는 데이터는 아래처럼 scatter plot 을 이용하기도 합니다. 하지만 지도 위에 표시해서 위치 정보에 대해서 자세히 알아보고 싶을 때가 있습니다 . 이럴 때 folium을 이용해서 지도 위에 정보를 표시해볼 수 있습니다. folium을 이용해 지도 위에 데이터를 표시하기 위해 위도, 경도 데이터가 필요해서 서울 열린데이터 광장에서 서울시 나눔카 거점리스트 정보 데이터를 다운받아 사용해보았습니다. http://data.seoul.go.kr/dataList/OA-13544/S/1/datasetView.do 서울시 나눔카 거점리스트 정보 서울시 통합 나눔카로서 통합 거점정보 정보를 제공한다. data.seoul.go.kr pandas를 이용해서 데이터를 불러오겠습..
-
[Data Visualization] 데이터 시각화 - plotly : Interactive scatter plotData Science/Data Visualization 2021. 7. 13. 22:32
Interactive Plot은 마우스를 가져다 대면 해당 데이터의 정보를 표시해 주고, 줌인 등 기능을 활용할 수 있는 그래프입니다. 파이썬에서 간단하게 plotly 라이브러리를 이용해서 interactive plot을 그릴 수 있습니다. Plotly Scatter Plot seaborn의 penguins 데이터를 사용해보겠습니다. 먼저 load_dataset으로 데이터를 불러와줍니다. import seaborn as sns df = sns.load_dataset('penguins') df 먼저 간단하게 x와 y의 관계를 나타내는 scatter plot을 그려보겠습니다. 마우스를 가져다 대면 해당 데이터의 x, y 값이 표시되어 데이터에 대해서 상세한 내용을 알 수 있습니다. import plotly...
-
[Data Visualization] 데이터 시각화 - matplotlib(4) : pieData Science/Data Visualization 2021. 1. 27. 20:02
Dataset seaborn의 tips 데이터셋을 사용해줄게요. tips = sns.load_dataset('tips') 파이차트를 그리기 앞서 day를 그룹으로 sum을 구해주었어요 tips_sum = tips.groupby('day').sum().reset_index() pie chart 기본 파이 차트를 그리기 위해서는 plt.pie()를 사용합니다. tip의 요일별 비율을 알아보는 파이차트를 그려보겠습니다. tip = tips_sum['tip'] plt.pie(tip) 기본 파이차트로는 아무 정보를 알 수가 없어 label을 설정해주겠습니다. plt.pie()에 labels 를 넣어주면 그래프에 다음과 같은 레이블을 나타낼 수 있습니다. tip = tips_sum['tip'] day = tips_..
-
[Data Visualization] 데이터 시각화 - matplotlib(3) : histData Science/Data Visualization 2021. 1. 25. 16:41
Dataset 데이터 시각화에 앞서 데이터를 불러오겠습니다. 이번에 사용할 데이터는 tips 데이터 입니다. tips = sns.load_dataset('tips') histogram 히스토그램은 구간별 빈도수를 나타낸 그래프입니다. tips 데이터의 total_bill로 히스토그램을 그려보았습니다. 히스토그램 그래프를 그리면 bins의 defalut가 10이므로, 구간을 동등하게 10개로 나누어줍니다. plt.hist(tips['total_bill']) range를 통해서 계급 범위의 최소 최대를 설정해줄 수 있습니다. 히스토그램의 범위는 bins를 통해 입력된 수만큼의 계급으로 동일하게 나눠집니다. plt.hist(tips['total_bill'], range = (0, 60), # xmin : 0,..
-
[Data Visualization] 데이터 시각화 - matplotlib(2) : scatter, bar, barhData Science/Data Visualization 2021. 1. 24. 23:30
Dataset 시각화에 앞서 시각화에 사용할 데이터를 불러올게요 seaborn의 Iris 데이터를 사용했습니다. iris = sns.load_dataset('iris') Scatter Plot (산점도) matplotlib.pyplot에서 scatterplot을 그려줍니다. plt.scatter('sepal_length', # X 'sepal_width', # Y data = iris) scatterplot의 색을 color로 바꿔주고 alpha로 투명도를 조절합니다. title, xlabel, ylabel을 이용해서 제목과 X축, Y축의 label도 넣어주었습니다. plt.scatter('sepal_length', 'sepal_width', data = iris, color = 'green', # ma..
-
[Data Visualization] 데이터 시각화 - matplotlib(1)Data Science/Data Visualization 2021. 1. 18. 23:41
파이썬에서 시각화를 하는 방법은 여러가지가 있지만 먼저 matplotlib부터 정리를 해보려고 합니다. 기본 그래프 그리기 데이터 시각화를 위한 라이브러리인 matplotlib 불러오고 import matplotlib.pyplot as plt 시각화를 위해서 데이터 프레임을 생성해 줍니다. x = [1, 3, 5, 7] y = [2, 4, 6, 8] df = pd.DataFrame({'x' : x, 'y' : y}) matplotlib의 plot() 함수에 x와 y 값을 넣어주면 다음과 같은 그래프가 그려집니다. plt.plot([1, 3, 5], [2, 4, 6]); 축 레이블 설정 xlabel(), ylabel()을 이용하면 축의 레이블을 설정할 수 있습니다. plt.xlabel('X') plt.yl..