반응형

Python 72

[Python]지도 데이터 시각화 - Folium 기초 실습하기

먼저 Folium은 Python data, leaflet.js 맵입니다. Python에서 데이터를 조작한 다음 leaflet.js를 통해 데이터를 시각화합니다. 라이브러리에는 OpenStreetMap, Mapbox 및 Staten의 여러 타일 세트가 내장되어 있으며, Mapbox 또는 Cloudmade API 키를 사용하여 사용자 지정 타일 셋을 지원합니다. Folium은 이미지, 비디오, GeoJSON 및 TopoJ를 모두 지원합니다. 자세한 내용은 아래 주소 클릭 https://python-visualization.github.io/folium/ - 실습 먼저 실습할 데이터를 만들어줍니다. from pandas import DataFrame #예제 데이터 만들기 ex = {'경도' : [127.061..

[Python]데이터분석 EDA 쉽게 하기 - pandas_profiling

pandas 라이브러리 중 EDA를 한눈에 볼 수 있는 라이브러리 발견 ! 보고서 쓸 때나 데이터 확인할 때 쓰면 아주 좋을 것 같다. pandas_profiling 이란 ? 딱 EDA할 때 보는 거 다 나온다. 이제 파이썬으로 하나하나 다 코드 안짜도 pandas profiling으로 해결 가능 ~ https://pypi.org/project/pandas-profiling/ pandas-profiling Generate profile report for pandas DataFrame pypi.org 살펴보기 전체 데이터 overview도 알려주고 각 변수마다 overview도 알려준다. missing value도 알려주고 Zero 가 몇개인지도 알려줌. 오...완전 좋은데 일단 기능이 좋은건 확실 실습..

[Python]문자열 양 끝 공백 또는 문자 제거 - strip(),lstrip(),rstrip()

문자열 양 끝에 있는 공백을 없애야 하는 경우나 특정 문자를 제거하고 싶을 때 사용 -관련 문서 https://docs.python.org/2/library/stdtypes.html?highlight=str.strip#str.strip 5. Built-in Types — Python 2.7.18 documentation The following sections describe the standard types that are built into the interpreter. Note Historically (until release 2.2), Python’s built-in types have differed from user-defined types because it was not possible t..

[Python]matplotlib, dataframe 한글 폰트 설정 방법

python matplotlib에서 한글 폰트, 마이너스(숫자)가 안보일 때 설정하는 방법 #한글폰트 설정 #mac ver. plt.rc("font",family="AppleGothic") #window ver. plt.rc("font",family="Malgun Gothic") #마이너스 숫자 설정 plt.rc("axes",unicode_minus=False) python dataframe 불러올 때, index가 한글일 경우 설정 방법 df= pd.read_csv("../test.csv",encoding = "cp949") UTF-8보다 cp949로 하는게 더 좋음 !

[Python]Dataframe에서 like 검색-str.startswith() , str.contains()

Python Dataframe에서 str을 사용하면 문자열을 사용하기 쉽습니다. str을 사용해서 dataframe에서 SQL의 like search처럼 사용하는 방법을 알아보았습니다. example 데이터프레임 을 살펴보겠습니다. CA_1부터 TX_2까지 있고 item_id도 종류별로 있습니다. 이때 store_id가 'CA' 인 것만 나타내보겠습니다. example[example['store_id'].str.startswith('CA')] store_id가 CA%인 것이 나왔습니다. 여기서 startswith는 앞 문자만 검색가능해 %CA% 같은 검색은 하지 못합니다. 앞뒤 글자 상관없이 특정 단어가 필요한 것을 찾으려면 contains 함수를 사용하면 됩니다. 이번에는 item_id에서 BB글자가 ..

[ML]선형회귀분석 실습 - 기초버전(2)

기초버전(1)에서는 sklearn.linear_model.LinearRegression() 으로 회귀분석을 실습해봤고 이번에는 stats 모델의 OLS로 회귀분석을 해봅니다. 1. 먼저 필요한 모듈을 import 시켜줍니다. import pandas as pd import matplotlib.pyplot as plt import matplotlib matplotlib.style.use('ggplot') import seaborn as sns import scipy.stats as stats import statsmodels.api as sm from statsmodels.formula.api import ols 2. 그 다음에는 실습에 필요한 데이터를 만들어 줍니다. data = {'x': [13, 19..

[Python]Jupyter Notebook 잘 사용하기

주피터 노트북을 사용하다보면 markdown으로 파일을 주고 받을 때가 많다. 특히 블로그 업로드 할 때 주피터 노트북을 바로 올리다 보니 다시 볼 때 설명이 많으면 좋다. 그래서 적는 주피터 노트북 잘 사용하기 ! In [1]: #tistory 관련 코드(필요없음) from IPython.core.display import display, HTML display(HTML("")) 1. 수식 넣기¶$ 사이에 수식을 넣으면 가능¶참고 사이트 : https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Typesetting%20Equations.html $\begin{eqnarray} x' &=& &x \sin\phi &+& z \cos\phi..

반응형