데이터웨어하우스 뜻? 정보와 창고 2가지 합성어

데이터웨어하우스 뜻과 개념
데이터웨어하우스 뜻과 개념

데이터웨어하우스 뜻과 개념에 대해서 알아봅시다.

데이터웨어하우스 뜻과 개념 설명

데이터웨어하우스(Data Warehouse)는 데이터와 창고를 합친 합성어입니다.

데이터웨어하우스는 경영의 의사결정을 지원하기 위해 데이터분석이 가능한 형태로 변환된 데이터들이 대규모 단위로 저장되어 있는 저장소입니다.

데이터웨어하우스는 기업이 정보의 자산을 효율적이고 체계적으로 관리하고 활용하기 위한 패러다임이기도 합니다. 데이터웨어하우스 뜻은 기업의 의사결정을 위한 대량의 업무 데이터와 해당하는 관리 시스템으로 정의할 수 있습니다. 데이터웨어하우스는 통계를 기반으로 하는 데이터 분석에 적합한 특징을 가지고 있습니다. 데이터웨어하우스에 쌓이는 데이터는 시간에 비례해서 점점 증가하게 됩니다.

데이터웨어하우스에는 각 데이터들을 시간 순서대로 저장하며 한번 저장된 데이터는 다시 변경하거나 삭제하지 않습니다. 따라서 데이터웨어하우스에는 일관되고 체계적인 관리 체계가 필요합니다.

데이터 웨어하우스는 기업 입장에서 전략적인 관점에서 데이터를 기반으로 합리적인 의사결정을 진행 할 수 있도록 하기 위해 데이터를 시간 순서의 시계열적 관점으로 지속적으로 축적하고 기업의 데이터를 전사적으로 통합하여 대량의 다양한 데이터를 기반으로 다양한 주제의 데이터 분석이 진행되고 활용될 수 있도록 하기 위한 데이터 저장과 관리 체계와 관련된 기술적이고 구조적이고 통합적인 데이터 관리 시스템이라고 할 수 있습니다.

데이터 웨어하우스는 데이터베이스보다 더 상위의 개념입니다.

데이터베이스(Database)가 여러 테이블들의 집합이라고 한다면 데이터웨어하우스는 데이터베이스들의 집합입니다. 데이터 웨어하우스는 기업에서 분산 운영되고 있는 다양한 데이터베이스 관리시스템(DBMS)들을 한번 더 통합하여 관리하는 데이터 관리와 활용 체계입니다.

데이터베이스와 DBMS를 기반으로 한 단순 SQL쿼리로는 대규모의 데이터 분석 작업을 처리하는데는 한계가 있기 때문에 데이터웨어하우스를 구축하는 것입니다.

데이터웨어하우스는 관리 하드웨어, 관리 소프트웨어, 배치나 ETL과 같은 데이터를 추출하고 변환하고 정렬하고 적재 할 수 있는 도구, 메타 데이터 관리 시스템, 데이터베이스 마케팅 시스템, 사용자 활용 도구 등으로 구성됩니다.




데이터웨어하우스 뜻과 의미 이해

데이터웨어하우스 뜻(Concept of Data Warehouse)은 기업의 경영진들의 의사결정을 지원하고 데이터 분석을 근거한 비즈니스 기준과 정의 내용을 뒷받침될 수 있도록 데이터 분석을 위한 비즈니스와 관련된 대량의 업무 데이터를 저장하고 관리하는 시스템 체계와 저장소를 의미합니다.

데이터웨어하우스에서는 기업에서 일상적인 기업활동에서 발생하는 각종 데이터들을 일관성 있고 체계적으로 정리된 데이터로 재편성됩니다. 데이터웨어하우스에는 고객, 거래, 영업, 재무, 상품 등 다양한 주제의 데이터들을 시간 순서대로 정리되고 데이터를 삭제하거나 변경하지 않는 특징을 가지고 있습니다.

데이터 재편성은 데이터웨어하우스에서 반드시 필요한 과정입니다. 데이터웨어하우스에는 다양한 부문과 영역들에서 각각 다른 기간과 각기 다른 시스템에서 데이터를 수집하게 됩니다. 따라서 데이터의 서식과 유효숫자와 같은 세부적인 내용들이 서로 일치하지 않을 수 있습니다. 이러한 문제를 해결하기 위해서 일관성 있는 데이터 체계로 만드는 것을 데이터 재편성이라고 합니다.

데이터웨어하우스는 주제 지향적(Subject oriented), 통합적(Integrated), 시계열적(Time varient), 비휘발적(Nonvolatile)인 특징을 가지고 있습니다.

여기서 주제지향적은 기업 경영의 의사결정을 지원하기 위한 데이터 분석을 위한 관점이며 통합적이라는 것은 분산 되어 있는 다양한 주제의 데이터베이스를 통합한다는 관점입니다. 시계열적이라는 것은 최신 데이터만 관리하는 것이 아니라 변경 전 데이터까지 시간 순서대로 차곡차곡 계속 쌓아나가면서 관리한다는 관점입니다. 비휘발적이라는 것은 한번 적재된 데이터는 다시 변경하거나 삭제하지 않는다는 관점을 의미합니다.

데이터 웨어하우스의 생태계에서는 가장 하위의 원천 데이터와 데이터베이스를 기반으로 일반적으로 ETL방식으로 데이터를 데이터웨어하우스 서버에 적재하며 데이터웨어하우스 서버의 데이터를 기반으로 OLAP서버를 통해 데이터를 분석하고 데이터마이닝을 진행하고 데이터와 관련된 통계 분석을 할 수 있는 화면과 같은 Front-end 툴들로 구성되어 있습니다.

데이터웨어하우스 개념과 함께 데이터레이크의 개념도 있습니다.

데이터레이크(Data Lake)는 데이터웨어하우스 보다 더 큰 개념입니다. 데이터레이크도 기업의 데이터를 축적하는 개념으로 호수에서 대량의 물을 저장하는 개념처럼 데이터레이크하우스에서는 대량의 데이터를 호수처럼 그대로 보존합니다. 기업 내부에서 다양한 주제와 다양한 데이터들이 대량의 데이터 형태로 보존되기 때문에 데이터 분석을 진행하기 좋은 환경이 됩니다. 데이터 분석을 하기 위한 주제가 정해진다면 필요한 데이터를 다양하고 많은 데이터들이 저장되어 있는 데이터레이크를 활용할 수 있습니다.

데이터마트(Data Mart)는 특정 팀이나 사업 단위가 해당 영역에 필요한 데이터들만 집중적으로 볼 수 있도록 구성된 데이터 체계입니다.