[Python]Jupyter Notebook Markdown 잘 사용하기 Markdown 글자 크기 # Hello python ## Hello python ### Hello python #### Hello python >결과 진하게, 기울기, 수식 넣기 **python** *Hello* $y=3x$ >결과 리스트 만들기 - python - pandas - numpy - ... 1. python 2. java > hello > 결과 URL 넣기 [우주먼지](https://rk1993.tistory.com/) >결과 나는야 데이터사이언티스트/PYTHON 2021.03.18
베이지안(Bayesian Inference) 쉽게 이해하기 확률의 정의 베이지안 정리가 무엇인지 알아보기 전에 '확률'에 대한 두가지 관점을 먼저 이해해야 한다. 통계학은 크게 빈도주의자(frequentist)와 베이즈주의자(Bayesian)로 나뉜다. 어느 쪽이든 확률을 계산하는 방법은 똑같지만 확률을 해석하는 방법이 다르다. 예를 들어, "동전을 던졌을 때 앞면이 나올 확률이 50%다" 라는 진술은 빈도주의자는 "동전 하나 던지기를 수 천, 수 만 번 하면 그중에 50%는 앞면이 나오고, 50%는 뒷면이 나온다"라고 해석한다. 반면 베이즈주의자는 "동전 하나 던지기의 결과가 앞면이 나올 것이라는 확신은 50%이다"라고 해석한다. 다시말하면, 빈도주의자는 확률을 객관적 확률로 해석하고, 베이즈주의자는 주관적 확률로 해석한다는 것이다. 빈도주의의 관점에서 분명한.. 나는야 데이터사이언티스트/통계 2021.03.04
상관분석(Correlation Analysis) 쉽게 이해하기 상관분석이란 ? 상관분석은 연속형 변수로 측정된 두 변수 간의 선형적 관계를 분석하는 기법이다. 연속형 변수는 산술 평균을 계산할 수 있는 숫자형의 데이터이며, 선형적 관계라 함은 흔히 비례식이 성립되는 관계를 말한다. 예를들어 A 변수가 증가함에 따라 B 변수도 증가되는지 혹은 감소하는지를 분석하는 것이다. 상관분석에는 두 변수 사이의 선형적인 관계 정도를 나타내기 위해 상관계수(correlation coefficient)를 사용한다. 상관분석에는 측정 데이터에 따라 피어슨 상관분석, 스퍼만 상곤분석 등의 여러가지 분석 방법이 있지만, 일반적으로 상관계수라 함은 피어슨 상관계수(Pearson correlation coefficient)를 의미한다. 두 변수간의 관련성은 각 케이스의 값을 좌표위에 점으로.. 나는야 데이터사이언티스트/통계 2021.01.19
[PYTHON] 이미지 불러오기 1. 사용하는 모듈 import numpy as np from PIL import Image import matplotlib.pyplot as plt %matplotlib inline 2. 파일 열기 # 파일 열기 path = './dog.jpg' image_pil = Image.open(path) image = np.array(image_pil) 3. 이미지 정보 확인 image.shape #이미지 range 확인 np.min(image), np.max(image) #이미지 시각화 plt.hist(image.ravel(),256,[0,256]) plt.show() 출력값은 아래의 그림과 같이 나옵니다 4. 이미지 보기 plt.imshow(image) plt.show() #이미지 흑백으로 열기 image.. 나는야 데이터사이언티스트/PYTHON 2021.01.07
[통계]표본 크기 계산 방법 빅데이터라는 개념이 등장하면서 표본의 의미가 사라지고 있지만 아직까지 어떤 분야에서는 표본이 필요한 경우도 있다. 그리고 스몰데이터라는 개념이 등장하면서 이런 개념이 또 필요하지 않을까 생각해서 하는 포스팅 표본 크기가 무엇인가요? 표본 크기는 설문조사에서 받는 완성 응답 수로 일단의 사람들 중 일부(즉, 대상 모집단)만 대표하므로 표본이라고 부르며, 바로 이들의 의견이나 행동양상을 알고자 하는 것입니다. 예를 들어 한 가지 표집 방법으로 대규모 모집단에서 전적으로 우연히 응답자를 선정하는 ‘무작위 표본’을 사용할 수 있습니다. 이러한 정의를 염두에 두고 다음 주제에 대해 자세히 살펴보도록 하죠. 다양한 방법으로 표본의 결과 해석 표본 크기 계산에 사용되는 공식 설문조사에 적절한 표본 크기가 중요한 이유.. 나는야 데이터사이언티스트/통계 2020.11.17
데이터 전처리 필요성 및 방법(Feature Engineering, EDA) 이상값의 원인 데이터 전처리를 말하기 전에 이상값부터 먼저 말하고 싶다. 이상값의 원인? 우리가 이상 값을 발견할 때마다 이를 해결하는 이상적인 방법은 이러한 이상값을 갖는 이유를 찾는 것이다. 그런 다음 처리 방법은 발생 이유에 따라 다르니다. 이상값의 원인은 크게 두 가지 범주로 분류 할 수 있다. 1. 인공(오류) / 비자연적 2. 자연적 다양한 유형의 이상값을 더 자세히 살펴보자. ○ 데이터 입력 오류 : 데이터 수집, 기록 또는 입력 중 발생하는 오류와 같은 인적 오류는 데이터에 이상값을 유발할 수 있다. ex) 연간 수입이 $ 100,000인 고객이 있다. 실수로 데이터 입력시 0을 추가하면, 이제 수입은 $ 1,000,000가 되어 10 배가 된다. 분명히 이것은 다른 모집단과 비교할 때 이.. 나는야 데이터사이언티스트/통계 2020.11.10
[Python]파이썬에서 Oracle DB 연동하는 방법 1. Anaconda Prompt창을 관리자 권한으로 실행 2. cx_Oracle 라이브러리를 설치 cx_Oracle 라이브러리를 설치합니다 -------> python -m pip install cx_Oracle --upgrade 혹시 이미 설치되어 있다면 업그레이드 해주세요 3. Oracle Instant Client Downloads에서 다운로드 라이브러리 설치 후, oracle instant client 도 다운로드 받아야합니다 컴퓨터 사양에 맞게 다운받으세요 ! 참고로 저는 윈도우 64비트였습니다 저는 zip 파일을 받고 C 드라이브 밑에 압축풀었습니다 -----> C:\instantclient_19_8 www.oracle.com/database/technologies/instant-client.. 나는야 데이터사이언티스트/PYTHON 2020.10.27
[Python]sequence item 0: expected str instance, int found python에서 list를 문자열로 만들때 사용하는 "".join(a) 할 때 나타나는 오류 "".join()은 string 타입만 가능하다고 한다 그래서 int 타입의 list는 string으로 바꾸고 해야함 ! python int to string method numbers = [6,10,2] #int to string numbers = list(map(str,numbers)) 나는야 데이터사이언티스트/PYTHON Trouble Shooting 2020.10.20
[Oracle]오라클에서 information_schema 이용하기 MySQL에서는 information_schema로 DB에 관한 다양한 정보들을 알 수 있습니다 Oracle에서도 그런 기능이 있긴 한데 문법이 조금 달라요 --테이블 정보 확인하기 select * from all_tables --컬럼 정보 확인하기 select * from all_tab_columns 그 외에도 select * from all 까지 쓰고 Ctrl + space 누르면 DB 관련 정보 테이블들이 나옵니다. 나는야 데이터사이언티스트/SQL 2020.09.24
[MySQL/Oracle]테이블 & 컬럼 코멘트(comment) 조회 및 추가하기 MySQL Comment * Comment 설정 --테이블 comment 설정 #테이블 생성 시 CREATE TABLE [테이블명] ( [컬럼명] INT, ... ) COMMENT = 'table comment'; #특정 테이블만 설정 ALTER TABLE [테이블명] COMMENT = 'table comment'; --컬럼 comment 설정 #테이블 생성 시 CREATE TABLE [테이블명] ( [컬럼명] INT COMMENT 'column1 comment', ... ); #특정 컬럼만 설정 ALTER TABLE [테이블명] MODIFY [컬럼명] [데이터타입] [제약조건] COMMENT 'column1 comment'; * Comment 조회 --테이블 comment 조회 SELECT TABLE_.. 나는야 데이터사이언티스트/SQL 2020.09.17