반응형

나는야 데이터사이언티스트 87

[MySQL]information_schema란 ? (정의 및 테이블 종류)

information_schema란 ? INFORMATION_SCHEMA란 MySQL 서버 내에 존재하는 DB의 메타 정보(테이블, 칼럼, 인덱스 등의 스키마 정보)를 모아둔 DB다. INFORMATION_SCHEMA 데이터베이스 내의 모든 테이블은 읽기 전용이며, 단순히 조회만 가능하다. 즉, 읽기전용(Read-only)으로 사용자가 직접 수정하거나 관여할 수는 없다. 실제로 이 데이터베이스 내의 테이블은 레코드가 있는 것이 아니라, SQL을 이용해 조회할 때마다 메타 정보를 MySQL 서버의 메모리에서 가져와서 보여준다. 이런 이유로 한꺼번에 많은 테이블을 조회할 경우 시간이 많이 걸릴 수도 있다. * 메타 데이터(Metadata) 란 데이터의 데이터로서, 데이터베이스 또는 테이블의 이름, 컬럼의 데..

[MySQL/Oracle]데이터베이스의 모든 테이블 권한 주기

MySQL #a_user 사용자는 study_db 데이터베이스의 모든 table에 대해서 SELECT, INSERT 권한을 가진다. GRANT SELECT, INSERT ON study_db.* TO a_user; #데이터 베이스의 모든 테이블에 대해 모든 권한을 준다. GRANT ALL ON study_db.* TO a_user; #a_user는 모든 데이터 베이스의 모든 테이블에 대해 SELECT 권한을 가진다. GRANT SELECT ON *.* TO a_user; 출처: https://futurists.tistory.com/20 [미래학자] Oracle Select 'grant select,insert,delete, update on' || tname || 'to DB_Name;' From tab..

[MySQL/Oracle]where 절에서 IF문 사용하기

where 절에서 if문 쓸 때, 상황에 따라 다르겠지만 mysql은 if을 사용. oracle은 case when을 사용하는 것이 오류가 잘 안나는 것 같아요 MySQL IF(조건, '참', '거짓') #예시 SELECT * FROM TAXI WHERE IF(PAMENT_SECONDS = 1 , 'CASH', 'OTHER') ORACLE CASE WHEN 조건절 THEN 참일때 값 ELSE 거짓일때 값 END #예시 SELECT * FROM TAXI WHERE (CASE WHEN PAMENT_SECONDS = 1 THEN 'CASH' ELSE 'OTHER' END)

[MySQL/Oracle]오라클로 substring_index 사용하기

오라클로 substring_index 사용하는 방법을 알아보기 전에 MySQL에서 substring_index를 어떻게 사용하는지부터 알아보자. substring_index SUBSTRING_INDEX( 1번째 인수 : 컬럼명 2번째 인수 : 기준문자, 구분 문자 3번째 인수 : 보여질 위치, 위치 기준 음수(-)는 뒷부분 부터, 양수(+)는 앞부분 부터 ) substring_index Example SELECT SUBSTRING_INDEX("www.google.com",'.',1) FROM DUAL; #결과값 : www SELECT SUBSTRING_INDEX("www.google.com",'.',2) FROM DUAL; #결과값 : www.google SELECT SUBSTRING_INDEX("www..

[EXCEL]필터링으로 숨겨진 데이터 개수 세기-SUBTOTAL

SUBTOTAL 함수 정리 사용 방법 -예시 데이터 -숨긴 데이터만 개수 셀 때 =SUBTOTLA(102,B2:B11) -숨긴 데이터 이외에 전체 개수 셀 때 =SUBTOTAL(2,B2:B11) 1. COUNT 범위에서 숫자가 포함된 셀의 개수를 구하는 함수 (숫자 only, 문자 미 포함) 회비를 납부한 사람의 수를 세기 위해, 납부한 회비가 숫자이기 때문에 영역을 지정하고 COUNT함수를 사용해 개수를 구하면 됩니다. 2. COUNTA 범위에서 비어있지 않은 셀의 개수를 구하는 함수 (숫자, 문자 포함) 모임의 회원이 총 몇명인지 세기 위해서는 이름의 수를 확인 하면 됩니다. 이름은 문자이기 때문에 COUNTA함수를 사용합니다.

[MySQL/Oracle]시간, 날짜 데이터 포맷 바꾸기, 더하기

ORACLE 시간, 날짜 데이터 바꾸기 SELECT --날짜 포맷 TO_CHAR(SYSDATE,'DAY'),-- 일요일 (요일 표시) TO_CHAR(SYSDATE,'DY') --일 (요일을 한자리로 표시) TO_CHAR(SYSDATE,'WW'), -- 28 (일년 기준 주를 00 ~ 53 형태로 표시) TO_CHAR(SYSDATE,'DDD'),-- 194(1년기준 일 수) # TO_CHAR(SYSDATE,'W') -- 2 (한달 기준 몇번째 주) TO_CHAR(SYSDATE,'DL'),--2020년 07월 12일 일요일 --시간 포맷 TO_CHAR(SYSDATE,'AM'),--오전 TO_CHAR(SYSDATE,'PM'),--오후 TO_CHAR(SYSDATE,'HH'), -- 9 (시간을 0 ~ 12 형태..

[Python]파이썬 스핑크스 - 파이썬 코드 문서화 하기

스핑크스(Spinhx) 스핑크스(Sphinx)는 파이썬 프로젝트를 문서화하는 도구입니다. 스핑크스는 RST(reStructuredText)와 파이썬의 문서화 문자열을 이용해 매뉴얼과 레퍼런스 문서를 작성하며 문서를 정적 웹페이지, 이북, PDF 등으로 출력합니다. 설치하기 anaconda prompt를 열어서 설치해줍니다 pip install Sphinx 그리고 문서화를 하기 원하는 프로젝트로 이동해서 sphinx-quickstar를 실행합니다. #prompt 내에서 cd를 이용해 문서화 원하는 프로젝트로 이동 sphinx-quickstar y를 입력하면 문서의 내용을 작성한 파일이 들어가는 source 디렉토리와 출력을 지정하는 build디렉토리가 별도로 생성됩니다. n을 입력하면 프로젝트 최상위 디렉..

모델 성능 평가 지표 (회귀 모델, 분류 모델)

모델 성능 평가 모델을 만드는 이유는 일반화를 통해 미래(미실현) 예측을 추정하고자 하는 것이다. 그래서 우리는 train data로 학습시키고, 알고리즘을 계속해서 수정하고, 주어진 가설 공간에서 최고의 성능을 발휘하는 모델을 선택함으로써 예측 성능을 높힌다. 그렇게 여러가지로 만든 모델을 서로 비교해서 좋은 모델을 선택해야하는데 이때 모델 평가 지표를 사용해서 성능을 평가한다. 연속된 값에 대한 평가 지표(회귀 모델)와 분류에 대한 평가 지표를 다르게 사용한다. 회귀 모델 ● MAE(Mean Absolute Error) 모델의 예측값과 실제값의 차이를 모두 더한다는 개념 절대값을 취하기 때문에 가장 직관적으로 알 수 있는 지표이다. MSE 보다 특이치에 robust한다. (robust란 ? 이상치에 ..

[Python]지도 데이터 시각화 - Folium 기초 실습하기

먼저 Folium은 Python data, leaflet.js 맵입니다. Python에서 데이터를 조작한 다음 leaflet.js를 통해 데이터를 시각화합니다. 라이브러리에는 OpenStreetMap, Mapbox 및 Staten의 여러 타일 세트가 내장되어 있으며, Mapbox 또는 Cloudmade API 키를 사용하여 사용자 지정 타일 셋을 지원합니다. Folium은 이미지, 비디오, GeoJSON 및 TopoJ를 모두 지원합니다. 자세한 내용은 아래 주소 클릭 https://python-visualization.github.io/folium/ - 실습 먼저 실습할 데이터를 만들어줍니다. from pandas import DataFrame #예제 데이터 만들기 ex = {'경도' : [127.061..

[Python/pandas]데이터 결측치 처리하기(보간법/보외법) -pandas.DataFrame.interpolate

보간법/보외법 python에서 간단하게 보간,보외할 수 있는 방법이 있다. 보간 보외에 관한 간단한 설명은 아래의 블로그에서 확인 가능. http://blog.naver.com/PostView.nhn?blogId=release&logNo=50094947851 pandas.DataFrame.interpolate DataFrame.interpolate(self, method='linear', axis=0, limit=None, inplace=False, limit_direction='forward', limit_area=None, downcast=None, **kwargs) Parameters : method : str, default ‘linear’ ‘linear’: 선형 방법으로 보간 ‘time’: 시간..

반응형