나는야 데이터사이언티스트/SQL

[Hive] python으로 DB 데이터 불러오기(DataFrame, column...)

우주먼지의하루 2022. 6. 7. 13:39
728x90

요즘 회사에서 Hive 쓰는중
Hive SQL도 다른 SQL과 비슷해서 쓰는데 어려움은 없다

어쨌든 hive 쿼리로 python에서 DB 쓸때 필요해서 기록용 포스팅



from pyhive import hive #hive 라이브러리
import pandas as pd #DataFrame 만들어주기

#연결시키기
conn = hive.Connection(host='ip주소',port='포트',auth='권한?!',username='username',password='password')

#쿼리날리기
cursor = conn.cursor()
cursor.execute('query')

result = cursor.fetchall()

#column 들고오기
col = [column[0] for column in cursor.description]

#dataframe 만들기
df = pd.DataFrame(result,columns=col)



반응형