728x90
python이랑 hive JDBC 연결하는 방법
hive 말고 다른 DB 서버랑도 연결 가능!
https://pypi.org/project/JayDeBeApi/
#pip install 설치
import jaydebeapi as jp
import os
import pandas as pd
path = 'jar 파일 있는 디렉토리'
#jar 파일 전체 들고오기
file_list = os.listdir(path)
jar_list = [path + file for file in file_list if file.endswith(".jar")] # .jar로 끝나는 모든 파일 들고오기
con = jp.connect(
"org.apache.hive.jdbc.HiveDriver",
"jdbc:hive2:// 서버",
[id,pw],
jar_list
)
cur = con.cursor()
cur.execute("select * from test")
result = cur.fetchall()
col = [column[0] for column in cur.description]
#dataframe
df = pd.DataFrame(result,columns=col)
반응형
'나는야 데이터사이언티스트 > PYTHON' 카테고리의 다른 글
[Python]DataFrame N등분 하기, DataFrame 분할 (0) | 2024.03.27 |
---|---|
[Python] DataFrame 특정 컬럼만 type 바꾸기 (0) | 2022.10.18 |
[Python] 마지막 날짜 얻기, 마지막 날짜 계산하기 (0) | 2022.09.08 |
[Python]Not a feather file Error (0) | 2022.09.06 |
[Python] 코드 실행 시간 확인하기 (0) | 2022.09.01 |