반응형

나는야 데이터사이언티스트/PYTHON 45

[Python]DataFrame N등분 하기, DataFrame 분할

python DataFrame을 분할하고 싶을때, N 등분하고 싶을 때 방법 numpy의 split이나 array_split을 사용하면 가능! #정확하게 10등분하기 #정확하게 10등분하지 못하는 행의 수는 에러 메세지 출력 # ex)23/10 = 2.3으로 나머지가 3이 남기때문에 정확하게 n 등분하지 못함 sep_df=[df.loc[idx] for idx in np.split(df.index,10)] #비슷한 행의 수로 10등분하기 #정확하게 10등분하지 않아도 비슷한 숫자로 분할 sep_df=np.array_split(df,10) #sep_df[0],sep_df[1],...로 확인 가능

[Python]Python hive JDBC 연결하기

python이랑 hive JDBC 연결하는 방법 hive 말고 다른 DB 서버랑도 연결 가능! https://pypi.org/project/JayDeBeApi/ JayDeBeApi Use JDBC database drivers from Python 2/3 or Jython with a DB-API. pypi.org #pip install 설치 import jaydebeapi as jp import os import pandas as pd path = 'jar 파일 있는 디렉토리' #jar 파일 전체 들고오기 file_list = os.listdir(path) jar_list = [path + file for file in file_list if file.endswith(".jar")] # .jar로 끝나..

[Python] 마지막 날짜 얻기, 마지막 날짜 계산하기

매월 다른 마지막 날짜를 구하기 위한 함수 1. 필요한 라이브러리 from dateutil import rrule from datetime import date from datetime import datetime from datetime import timedelta from dateutil import relativedelta import time 2. 시작 날짜 구하기 나는 여러 월의 마지막 날짜를 한번에 구하기 위해서 시작 날짜를 list로 만들었다 2019.01 ~ 2022.03 기간의 마지막 날짜를 구하기 위해서 시작 날짜를 만들어 줬다 date = list(rrule.rrule(rrule.MONTHLY, dtstart=date(2019,1,1), util=date(2022,3,1))) sta..

[Python] 리스트와 리스트 비교하기, 리스트 안의 원소 있는지 파악하기

이게 참 설명하기 어려운데 리스트에서 다른 리스트 원소가 있는지 파악하고 싶을때 쓰는 방법 my_list = ['abc' , 'bbb' , 'ddd'] matchers = ['abc','def'] 이렇게 두 개의 리스트가 있을 때, my_list 안에 matchers의 리스트에 있는 원소만 골라내고 싶을 때 !!! matching = [s for s in my_list if any(xs in s for xs in matchers)] 이렇게 사용하면 된다 !!!

[Python]model ,scaler 저장 및 불러오기

Model 저장 및 불러오기 model.fit(tr_x, tr_y) #모델 저장 model.save('model.h5') #모델 불러오기 import tensorflow as tf load_model = tf.keras.models.load_model('model') Scaler 저장 및 불러오기 scaler.fit(tr_x) # scaler 저장하기 from pickle import dump dump(scaler,open('./scaler.pkl','wb')) #scaler 불러오기 from pickle import load load_scaler = load(open(./scaler.pkl,'rb'))

반응형