뿅뿅뿅/돌아라 회전목마

Cold Data VS Warm Data VS Hot Data 란 ?

우주먼지의하루 2021. 5. 27. 00:02
728x90

Cold Data VS Warm Data VS Hot Data

Cold storage : 자주 사용되지 않는 정형 또는 비정형 데이터를 위한 스토리지
Warm storage : 적당히 자주 사용되는 구조화된 데이터 스토리지
Hot storage : 자주 사용하는 구조화된 데이터를 위한 핫 스토리지

 

  Cold storage Warm storage Hot storage
Location 클라우드 서비스 원격 서버
개인 네트워크
CPU
Defining Characteristic slow speed medium speed very fast access
Example Cloud drives
AWS
Goolge Cloud Storage
Larger
spinning
drives
personal hard drives
SSD
flash drives

Cold Data

Cold Data는 덜 액세스되고 빠르게 액세스 할 필요가없는 데이터를 뜻한다. 몇 개월, 몇 년, 혹은 영원히 필요하지 않을 수 있는 데이터이다. Cold Data의 예로는 예전 프로젝트, 재무, 법률, HR, 비지니스 기록 유지 사항을 위해 기록해 둔 문서로 가치는 있지만 당장은 필요없는 것이다. 

 

Cold Data는 일반적으로 성능이 낮고 비용이 적게 드는 사내 또는 클라우드 스토리지 환경에 저장된다. Cold Data Cloud System의 스토리지 가격은 일반적으로 warm 또는 hot 스토리지보다 저렴하지만 cold 스토리지는 종종 다른 종류의 클라우드 스토리지보다 운영 당 비용이 더 높다.

 

Cold 스토리지에 액세스하는 데 몇 분에서 몇 시간이 걸릴 수 있으므로이 데이터는 촉박 한 기한이 아니라 인내와 계획을 허용하는 프로젝트에 사용하는 것이 좋다. Cold 스토리지는 사람이 저장 장치 라이브러리와 같은 물리적 하드 드라이브 세트를 물리적으로 살펴본 다음 컴퓨터에 연결하여 데이터를 검색해야 할 수도 있다. 이와 같은 컴퓨터에서 완전히 연결이 끊어지면 물리적 저장소가 말 그대로 차갑다고 할 수 있다.

 

Opposite to Hot. We can term  “Cold data” as less frequent update data or data that is never accessed (rarely)

 

The data will be used mostly for ad-hoc reporting. The data is maintained for regulatory reasons and audit purposes.

 

Low concurrency

 

Usually, cold storage will be considered for long terms storage and slow queries are ok in terms of retrieval.

Hot Data

Hot Data는 즉시 액세스해야하는 데이터이다. 저장된 정보가 업무상 중요하고 필요할 때 기다릴 수없는 경우 Hot 스토리지를 이용한다.

 

빠른 데이터 액세스를 위해 데이터는 일반적으로 하이브리드 또는 계층 형 스토리지 환경에 저장된다 . 서비스가 뜨거울수록 최신 드라이브, 가장 빠른 전송 프로토콜을 사용하고 필요에 따라 클라이언트 근처 또는 여러 지역에 위치 할 가능성이 높아진다.

 

데이터 구조와 관계없이 Hot Data 스토리지의 워크로드에는 빠르고 일관된 응답 시간이 필요하다. 이러한 유형의 스토리지를 사용하는 몇 가지 예로는 대화 형 비디오 편집, 웹 콘텐츠, 온라인 거래 등이 있다.

 

 We can term “Hot data” as real-time data and It will have the most recent translational data and used for current reporting purposes. (Interactive workloads)

 

Mission critical data (Transaction Data) used for current reporting purposes.

 

It will always tag frequently accessed data and business will always use this data in constant for the analysis.

 

The only criteria are, It should be highly scalable, queries need to fast and should retrieve data within 1s to 5s (Approx)

 

 

반응형