flex-height
text-black

책상에서 데이터를 분석 중인 여성

데이터 메시란?

데이터 메시는 분산된 아키텍처 프레임워크를 사용하는 데이터 관리에 대한 접근 방식입니다.

default

{}

default

{}

primary

default

{}

secondary

데이터 메시 개요

데이터 메시는 정보를 바라보는 새로운 방식을 나타냅니다. 데이터 자체가 제품, 툴, 목표 달성을 위한 수단이라는 개념에서 탄생했습니다. 기업이 이미 일어난 일을 이해하기 위해 데이터를 수집하고 나중에 분석하는 대상만은 아니라는 얘기죠.

데이터 메시 정의

데이터 메시는 분산형 아키텍처 프레임워크를 활용하는 데이터 관리 접근법입니다. 즉, 특정 데이터 세트에 대한 소유권과 책임을 해당 데이터의 의미를 이해하고 최적의 활용 방법을 아는 전문 지식을 가진 사용자들에게 전사적으로 분산합니다.

데이터 메시 아키텍처는 데이터 레이크웨어하우스와 같은 다양한 소스에서 데이터를 연결하고 추출합니다. 그런 다음 관련 데이터 세트를 전사적 차원에서 적합한 인간 전문가 및 도메인 팀으로 배포합니다. 본질적으로, 중앙 데이터 레이크에 방대하게 뒤섞인 데이터가 분류되어 관리 가능한 단위로 분할되며, 이를 가장 잘 이해하고 활용할 수 있는 주체에게 배분됩니다.

데이터 메시의 기원

데이터 메시는 대규모 복잡 조직에서 데이터 아키텍처 확장 문제에 대응하기 위해 2009년경 등장했습니다. 데이터 메시의 핵심 개념은 데이터 소유권과 아키텍처를 분산화하여 데이터를 제품으로 취급하고 도메인 중심 팀에 책임을 부여하는 것입니다. 데이터 메시는 도메인 주도 설계(DDD), 제품 사고방식, 셀프서비스 인프라의 원칙을 결합하여 조직이 단일화된 병목 현상 없이 데이터 시스템을 확장할 수 있도록 합니다.

중앙 집중식 데이터 관리 모델은 대규모 조직에서 실패하는 경우가 많으며, 그 이유는 다음과 같습니다.

데이터 메시의 이점

레거시 데이터베이스와 제한된 데이터 관리 인프라로 인해 데이터가 하나의 중요 보관소에 보관되어 소수의 데이터 관리자의 재량에 따라 관리되어야 하는 것으로 인식되었습니다. 이제 데이터는 비즈니스를 이끄는 원동력이며, 경쟁이 치열한 시대에 데이터를 활용하고 수익을 창출하는 방법을 가장 잘 아는 해당 분야 전문가에게 자유롭게 제공되어야 합니다.

데이터 메시 아키텍처의 주요 장점은 다음의 3가지 범주로 요약할 수 있습니다.

확장성 및 민첩성

데이터 접근성 향상: 데이터 메시는 조직 내 모든 관련자가 업무에서 최고의 성과를 내기 위해 필요한 데이터에 접근할 수 있도록 보장합니다.

맞춤형 데이터 파이프라인 및 프로세스: 성공을 위해 필요한 고유한 맞춤형 데이터 세트를 관리하는 데 드는 막대한 번거로움으로 인해 가장 우수하고 잠재적으로 수익성이 높은 프로젝트 다수가 보류됩니다. 데이터 메시를 사용하면 팀은 기존의 시간이나 리소스 손실 없이 새로운 프로젝트 모델에 빠르게 액세스하고 테스트할 수 있습니다.

병목 현상 감소: 이는 IT 팀과 데이터 소유자 모두에게 명백한 윈윈이 됩니다. 또한, 불만과 짜증의 원인을 줄임으로써 건강한 비즈니스 개발을 방해하는 사일로를 무너뜨리는 데 도움이 될 수 있습니다.

품질과 신뢰

향상된 분석 역량: 조직이 데이터를 매일 사용해야 할 제품으로 인식할 때, 팀들은 계획과 전략 수립에 데이터 중심 접근법을 채택하기 시작합니다. 이는 오류를 줄이고 비즈니스 개발에 대한 보다 객관적이고 덜 의견 중심적인 접근법으로 이어집니다.

도메인 간 협업 및 재사용

중앙 데이터 관리 팀의 업무 부담 감소: 이는 백로그와 불만을 줄일 뿐만 아니라, 유능한 IT 팀이 더 전문적이고 흥미로우며 수익성 있는 업무에 집중할 수 있는 시간을 확보할 수 있다는 의미이기도 합니다.

데이터 메시는 소유권을 분산하고 데이터를 제품으로 취급함으로써 조직이 더 빠르게 움직이고, 인사이트에 대한 신뢰를 구축하며, 도메인 간 원활하게 확장할 수 있도록 지원합니다.

데이터 메시의 핵심 원칙

데이터 레이크와 데이터 메시를 이야기할 때는 본질적으로 빅데이터에 대해 이야기하는 것입니다. 데이터를 '빅데이터'로 만드는 것은 단순히 그 양이 많다는 것만이 아닙니다. 다른 기준 중에서도 빅데이터는 복잡하고 가변적이며 빠르게 생성되고 구조화되지 않은 것으로 정의됩니다.

선형 데이터베이스는 스프레드시트와 같아서 열과 행이 있고 모든 데이터 구성요소가 꼭 들어맞아야 하는 불변의 범주가 있습니다. 기계, 센서, 산업 소스에서 생성되는 데이터 중 일부는 구조화되어 있어 선형 데이터베이스에 깔끔하게 들어맞습니다. 처리해야 하는 데이터의 양이 아무리 많아도 100% 구조화된 데이터라면 빅데이터 기준에 부합하지 않으며 선형 데이터베이스에 보관할 수 있어 필터링과 추출이 비교적 간단합니다.

그러나 점점 더 많은 최신 빅데이터는 비정형 데이터이며 시각적 구성요소, 개방형 텍스트, 심지어 비디오와 리치 미디어로 구성되어 있습니다. 많은 기업에서 이 중요한 데이터는 수천 테라바이트의 정보로 구성될 수 있으며, 표준 선형 데이터베이스에는 저장할 수 없습니다.

데이터 레이크를 활용하세요. 빅데이터의 양이 증가하기 시작하면서 복잡한 데이터를 중앙 리포지토리에 원시 형태로 저장하고 액세스할 수 있는 공간으로 데이터 레이크가 개발되었습니다. 데이터 레이크는 빅데이터 문제에 대한 훌륭한 해결책이지만, 그럼에도 불구하고 약점이 있습니다. 데이터 레이크에는 특정 분석 기능이 부족하여 검색, 인덱싱, 변환, 쿼리 및 분석 기능을 다른 서비스에 의존해야 합니다.

데이터 레이크가 제기하는 과제를 해결하는 네 가지 데이터 메시 원칙은 다음과 같습니다.

1. 도메인 소유권

데이터 레이크에서 너무 많은 참여자가 데이터를 생성하고 접근할 경우 소유권 정의가 복잡해집니다. 역할과 책임이 명확하게 정의되지 않은 경우, 동일한 데이터 세트가 여러 당사자에 의해 다르게 관리될 수 있으며, 이로 인해 불일치가 발생하여 사용하기 어렵게 됩니다. 마찬가지로, 궁극적으로 데이터를 사용하게 될 사람들이 적극적으로 관리하지 않으면 다른 데이터는 방치될 수 있습니다.

데이터 메시 아키텍처는 소유권을 분산화하여 이 문제를 해결합니다. 데이터 거버넌스가 도메인별로 명확하게 분배되도록 하여 각 팀 또는 도메인 전문가가 생성하고 사용하는 데이터를 관리하도록 보장합니다. 이를 뒷받침하기 위해 데이터 메시는 데이터 모델링, 보안 정책 및 규정 준수를 중앙에서 제어할 수 있도록 페더레이션 거버넌스 구조도 사용합니다. 데이터 메시 소유권은 책임성을 창출하고 데이터 활용성을 향상합니다.

2. 제품으로서의 데이터

데이터 레이크는 데이터의 양이 너무 많아지거나 중앙 데이터 관리자가 데이터를 이해하지 못하는 경우 데이터 품질을 보장하지 못할 수 있습니다. 데이터 메시 아키텍처는 기본적으로 데이터를 가치 있는 제품으로 취급하며, 데이터의 품질과 완전성을 데이터 관리의 최우선 순위에 둡니다. 아마도 각 팀은 수집하는 데이터에서 추론하고자 하는 가장 중요한 기준과 문제를 알고 있을 것입니다. 이러한 기준과 우선순위를 아키텍처에 통합함으로써 데이터 메시는 대규모 데이터 세트가 포함되는 경우에도 깨끗하고 최신의 완전한 데이터를 우선순위에 따라 지속적으로 제공할 수 있도록 도와줍니다. 물론 머신러닝 알고리즘을 적용하면 이러한 기준과 그 결과 데이터 세트는 시간이 지남에 따라 점점 더 정확하고 유용해집니다.

3. 셀프서비스 데이터 플랫폼

데이터 레이크는 중앙 집중식 아키텍처와 전통적으로 어려운 데이터 검색 프로세스 및 프로토콜로 인해 병목 현상을 일으킬 수 있습니다. 이는 일반적으로 대량의 통합 데이터에 대한 제어권이 단일 IT 또는 데이터 관리 팀에 있다는 것을 의미합니다. 그리고 데이터의 양과 검색 수요가 증가함에 따라 이러한 IT 팀은 과도한 업무에 시달리게 됩니다.

또한 데이터 거버넌스 원칙을 준수하고 준수할 수 있도록 데이터를 적절히 검토하고 구조화해야 합니다. 과도한 압박에 직면하면 이러한 규정 준수 단계를 서두르는 경향이 있어 회사에 잠재적인 위험과 손실을 초래할 수 있습니다. 데이터 메시 원칙은 셀프서비스 데이터 플랫폼을 구현함으로써 이 문제를 해결합니다. 또한 엄격한 보안 프로토콜을 채택하면서 데이터에 더 많은 기득권을 가진 승인된 전문 사용자에게 액세스 및 제어를 제공합니다. 이를 통해 병목 현상을 줄이고 데이터 제공을 가속화할 수 있습니다.

4. 통합 거버넌스

분산화가 핵심이지만, 조직은 거버넌스를 포기할 수 없습니다. 데이터 메시는 자율성과 일관성을 균형 있게 조율하는 연합 거버넌스 모델을 사용합니다. 이는 각 도메인이 자체 데이터 제품을 관리하지만, 조직 전반에 걸쳐 보안, 규정 준수, 상호 운용성에 대한 공유 표준을 준수해야 함을 의미합니다. 이러한 데이터 메시 거버넌스의 하이브리드 접근 방식은 신뢰나 규제 준수를 희생하지 않으면서 민첩성을 보장합니다.

데이터 메시에는 도전 과제가 존재하지만, 분산화되고 민주화된 데이터 관리 아키텍처를 통해 기업은 더 스마트하고, 더 민첩하며, 더 정확해졌습니다. 그 비결이 무엇일까요? 필요한 시점과 장소에서 적절한 사람들에게 올바른 데이터가 즉시 제공되도록 보장함으로써 가능합니다. 데이터 메시는 제품으로서의 데이터(data-as-a-product)를 실현하여 장벽을 낮추고 정보의 가치를 우선시하여 팀이 필수 데이터에 방해받지 않고 더 빠르게 액세스할 수 있도록 합니다.

데이터 메시 아키텍처 및 프레임워크

데이터 메시가 어떻게 데이터를 필수적인 비즈니스 관리 툴로 취급하는 분산형 데이터 아키텍처인지에 대해 설명했습니다. 그리고 중요한 것은 독립적인 팀이 자신의 업무 영역과 전문성 내에서 데이터를 처리하는 동시에 중앙에서 결정한 데이터 관리 관행을 준수한다는 점입니다. 이러한 사고방식의 변화가 데이터 메시의 핵심입니다.

데이터 메시 아키텍처의 조감도

데이터 메시에서 도메인은 데이터의 핵심 생산자이자 소비자이며, 각 도메인은 품질과 관련성을 보장하기 위해 데이터를 제품으로 소유합니다. 셀프서비스 플랫폼은 이러한 데이터 제품을 게시, 발견, 소비할 수 있는 인프라와 자동화된 보안 및 규정 준수 기능을 제공합니다. 거버넌스는 연합 모델로 운영되어 상호 운용성과 보안을 위한 글로벌 표준과 지역적 자율성 사이의 균형을 유지하므로, 도메인은 조직 전반에 걸쳐 신뢰와 일관성을 유지하면서 혁신할 수 있습니다.

데이터 메시 아키텍처의 구성 방식을 더 잘 이해하기 위해 세 가지 주요 구성 요소를 살펴보겠습니다.

데이터 소스

이들은 데이터 레이크와 같은 저장소를 나타내며, 여기에 주요 원시 데이터가 공급됩니다. 클라우드 IIoT 네트워크, 고객 피드백 양식 또는 스크래핑된 웹 데이터에서 수집된 것이든, 이는 사용자가 네트워크 전반에서 필요에 따라 참조하고 처리할 원시 입력 데이터입니다. 데이터 레이크 접근법은 이 모든 데이터를 한 곳으로 모으는 반면, 데이터 메시 방법론은 이 원시 데이터의 수집, 스토리지, 처리, 추출에 대한 책임을 여러 책임 도메인에 분산시킵니다.

데이터 메시 인프라

정보는 개별 부서 영역에 고립되지 않고, 확립된 데이터 거버넌스 지침을 준수하면서 조직의 운영 네트워크 전반에 자유롭게 공유될 수 있습니다. 이는 데이터 메시의 두 가지 핵심 요소인 셀프서비스 데이터 플랫폼과 연합 거버넌스의 직접적인 결과입니다. 셀프서비스 데이터 플랫폼은 각 도메인이 데이터를 보편적으로 수집, 변환, 처리 및 제공하기 위해 필요한 툴과 인프라를 제공합니다. 한편, 연합 거버넌스 원칙은 조직 전반에 걸친 표준화를 보장하여 모든 도메인 팀 간의 데이터 상호 운용성을 손쉽게 가능하게 합니다.

데이터 소유자

데이터 메시의 최종 구성 요소인 데이터 소유자는 해당 부서 데이터에 대한 규정 준수, 거버넌스 및 분류 프로토콜 적용을 책임집니다. 예를 들어, HR 파일은 특정 보안 프로토콜을 사용하여 저장해야 하며, 이런 용도로 사용해서는 안 되고, 이런 사람에게만 공개해야 합니다. 물론 각 부서마다 부서나 목적에 따라 고유한 데이터 범주와 유형이 있을 것입니다. 데이터 레이크 시스템에서는 IT 팀이 레이크에 데이터를 무분별하게 저장한 다양한 데이터 소유자들의 모든 프로토콜과 범주를 처리해야 합니다. 반면 데이터 메시 아키텍처는 도메인 소유자에게 이러한 사항에 대한 완전한 권한과 통제권을 부여합니다. 왜냐하면 해당 분야 전문가보다 자신의 데이터를 관리하고 품질 기준을 충족하도록 보장하는 데 더 적합한 사람이 누가 있을까요?

데이터 메시 운영 모델

데이터 메시 운영 모델은 사람, 프로세스, 기술을 통합하여 대규모 분산형 데이터 관리를 가능하게 합니다. 이러한 협업을 통해 단일 중앙 집중식 팀에 의존하지 않고도 조직 전반에 걸쳐 데이터가 원활하게 흐르도록 하여 신뢰성, 민첩성 및 재사용성을 촉진합니다. 데이터 메시는 공유 표준을 시행하고 공통 플랫폼, 일관된 형식 및 검색어, 데이터 제품 게시 및 소비를 위한 거버넌스 규칙을 제공함으로써 상호 운용성과 검색 가능성을 가능하게 합니다. 데이터 카탈로그 및 레지스트리와 같은 데이터 메시 툴을 통해 팀은 조직 전반에 걸쳐 데이터 제품을 신속하게 찾고 안전하게 접근하며 사용할 수 있습니다.

데이터 메시를 현대 도시로 생각해보세요. 각 동네(도메인)는 물, 전기, 폐기물 처리와 같은 자체 유틸리티와 서비스를 관리합니다. 지역별 요구사항을 가장 잘 알고 있기 때문입니다. 도시는 도로와 대중교통(셀프서비스 플랫폼), 안전 기준(거버넌스)과 같은 공유 인프라를 제공하여 동네들이 혼란 없이 연결되고 도시 자원에 접근하며 협력할 수 있도록 합니다. 이렇게 하면 자원이 도시 전체에 자유롭게 흐르고, 모두가 공통 규칙을 따르며, 혁신은 지역적으로 번성하는 동시에 도시 전체가 원활하게 기능합니다.

실무에서의 데이터 메시: 예시 및 사용 사례

데이터 관리 솔루션이 더욱 발전하고 성공하려면 다양한 애플리케이션과 운영에서 사용 가능하고 관련성이 있어야 합니다. 데이터 메시 아키텍처와 사용자 편의성이 개선됨에 따라, 조직이 데이터라는 제품과 툴에 대해 안전하고 분산된 접근 방식을 통해 향상할 수 있는 비즈니스 기능의 범위가 확대되고 있습니다.

일반적인 데이터 메시 비즈니스 사용 사례를 살펴보겠습니다.

영업

영업 팀의 경우, 모든 것은 리드 확보, 육성 및 계약 체결로 귀결됩니다. 영업 팀원들이 책상에 앉아 관리 업무를 하는 시간이 많을수록, 신규 고객과의 관계를 구축하는 데 할애해야 할 시간은 줄어들게 됩니다. 데이터 메시 아키텍처를 사용하면 영업팀 사용자가 데이터 관리 및 검색 전문가가 아니어도 가장 강력하고 관련성 높은 데이터 세트와 조합을 손쉽게 사용할 수 있습니다. 영업 부서에서 분석할 수 있는 모든 올바른 데이터를 확보하면 보다 실행 가능한 인사이트와 전략으로 전환됩니다.

판매 데이터 메시 사례: 지역별 또는 제품별 영업팀이 자체 CRM 및 파이프라인 데이터 도메인을 관리함으로써 중앙 IT 팀의 지원 없이도 정확한 예측과 실시간 대시보드를 구현할 수 있습니다.

공급망 및 물류

현대적인 공급망은 매우 다양한 차질에 취약합니다. 기업이 빠르게 전환하고 위협과 기회 모두에 민첩하게 대응할 수 있을 때 경쟁 우위를 확보할 수 있습니다. 오늘날 글로벌 공급망 데이터는 고객 피드백부터 IIoT 네트워크, 디지털 트윈에 이르기까지 방대하고 빠르게 유입되고 있습니다. 경험 많고 통찰력 있는 공급망 관리자가 이러한 데이터 세트를 실시간으로 직접 선별하고 심층 분석할 수 있을 때, 기업은 강력한 통찰력과 전문성을 확보하게 됩니다.

공급망 데이터 메시 사례: 공급망 최적화에는 재고 수준, 공급업체 성과, 물류 데이터에 대한 실시간 가시성이 필요합니다. 데이터 메시는 조달, 창고 관리, 운송 등 각 영역이 자체 데이터 제품에 대한 소유권을 갖도록 하여 더 빠른 의사결정과 비용 효율적인 운영을 가능하게 합니다.

제조

공급망의 일부인 기업의 제조 운영 역시 급변하는 시장 변화와 변동성 높은 고객 수요에 똑같이 취약합니다. 과거에는 설계 및 R&D 팀이 다른 부서에서 제공한 과거 고객 데이터에 의존해야 했습니다. 오늘날 데이터 메시를 사용하면 초안 테이블 뒤의 사용자, R&D 및 테스트 팀, 제조 현장까지 실시간 데이터에 액세스할 수 있습니다. 실시간 고객 피드백은 제품 개발에 즉각적인 정보를 제공할 수 있으며, IIoT 네트워크와 디지털 시뮬레이션에서 얻은 최신 인텔리전스를 통해 공장을 더 안전하고, 더 빠르고, 더 효율적으로 운영할 수 있습니다.

제조 데이터 메시 사례: 플랜트 현장 팀이 센서 및 기계 성능 데이터를 직접 관리함으로써 분산형 분석을 통해 예측 유지보수를 구현하고 가동 중단 시간을 줄일 수 있습니다.

마케팅

오늘날 고객의 요구와 기대는 미래를 형성하며 전례 없는 속도로 변화하고 성장하고 있습니다. 단일 브랜드는 일반적으로 소셜 미디어, 타겟팅 디지털 광고, 온라인 및 옴니채널 쇼핑 포털에 걸쳐 수많은 소비자 접점을 가지고 있습니다. 현재 시장은 빠른 사용자 지정, 짧은 제품 수명 주기, 엄청난 수준의 선택과 경쟁에 대한 욕구가 점점 더 커지고 있습니다. 이러한 동향을 이해하고 앞서 나가기 위해 현대의 마케팅 담당자들은 다양한 데이터 세트에 실시간으로 동시 접근할 수 있어야 합니다. 과거에는 이를 위해 다른 부서에 데이터를 요청하고 기다려야 했습니다. 하지만 데이터 메시를 설정하면 마케팅 담당자가 원하는 방식으로 데이터를 큐레이팅하고 즉시 액세스할 수 있습니다.

마케팅 데이터 메시 사례: 고객 360도 뷰를 구축하려면 전자메일, 소셜 및 유료 광고와 같은 여러 채널의 데이터를 통합해야 합니다. 데이터 메시를 통해 각 채널은 데이터 제품을 소유하여 개인화된 캠페인과 더 나은 고객 경험을 위해 정확한 실시간 통찰력을 확보할 수 있습니다.

HR

HR 팀은 방대하고 극도로 복잡하며 민감한 데이터를 관리해야 합니다. 그리고 원격 및 하이브리드 근무 환경이 증가하는 추세에 따라 이러한 데이터는 날로 더 복잡해지고 지리적으로 다양해지고 있습니다. HR 팀이 시급히 파악해야 하는 끊임없이 변화하는 규제 준수 및 법적 문제는 말할 것도 없습니다. 채용부터 퇴직까지, HR 리더는 조직 내 가장 광범위하게 분산된 데이터 세트를 검증, 평가, 분석할 수 있어야 합니다. 데이터 메시 아키텍처는 적절한 보안 프로토콜과 엄격한 접근 제한을 가능하게 합니다. 동시에, 권한이 부여된 HR 사용자가 복잡한 내부 프로토콜과 다부서 관료제에 의존하지 않고도 데이터와 정보에 신속하게 접근할 수 있도록 합니다.

HR 데이터 메시 사례: 채용, 급여, 성과 관리 팀은 자체 데이터 영역을 관리하여 규제 준수를 개선하고 전략적 의사결정을 위한 실시간 인력 분석을 가능하게 합니다.

재무

HR과 마찬가지로 재무 및 회계 팀도 매우 중요하고 민감한 데이터를 책임집니다. 최신 ERP 시스템은 인메모리 데이터베이스 기술을 활용하여 실시간 리포트, 분석 및 예측을 맞춤화함으로써 재무 분야에 혁신을 일으키고 있습니다. 하지만 재무팀이 최상의 데이터베이스와 ERP를 사용하더라도 오랜 관행과 경직된 문화, 심화된 사일로, 관료적이고 구식인 프로세스로 인해 여전히 장애물에 직면하는 경우가 많습니다. 데이터 메시 아키텍처는 재무 데이터의 관점과 관리 방식에 근본적인 변화를 가져옵니다. 조직이 팀에게 노후화된 데이터 프로세스를 소유하고 개선할 권한을 부여할 때 발생할 수 있는 정체된 사고방식까지도 뒤흔들 수 있습니다.

재무 데이터 메시 사례: 재무 기획 팀이 수익, 비용, 투자 데이터 영역을 직접 관리함으로써 단일 중앙 팀에 의존하지 않고도 정확한 예측과 민첩한 시나리오 모델링을 보장할 수 있습니다.

데이터 메시는 단순한 유행어가 아니며 진지하게 받아들여야 할 데이터 전략 트렌드임이 분명합니다. 규모와 업종에 관계없이 모든 기업이 데이터를 사용하여 인사이트와 가치를 창출할 수 있는 방법을 모색하며 데이터 메시를 사용하고 있습니다.

데이터 메시 대안

데이터 메시가 데이터 관리에 분산형 접근 방식을 제공하지만, 유일한 선택지는 아닙니다. 데이터 레이크 및 데이터 웨어하우스와 같은 전통적 아키텍처는 여전히 대량의 데이터를 중앙 집중화하고 저장하는 데 널리 사용되며, 종종 정형 및 비정형 데이터 기능을 결합한 데이터 레이크하우스와 함께 사용됩니다. 데이터 패브릭 같은 다른 모델은 다양한 시스템 전반에 걸친 데이터 통합 및 오케스트레이션을 위한 통합 계층 구축에 중점을 둡니다. 각 대안은 확장성, 거버넌스, 접근성을 다르게 다루므로 선택은 조직의 요구와 성숙도에 따라 달라집니다.

데이터 메시의 대안 및 비교 방법을 살펴보겠습니다.

데이터 메시와 데이터 레이크/레이크하우스 비교

데이터 메시
데이터 레이크/데이터 레이크하우스
핵심 개념
통합 거버넌스를 사용하는 분산 아키텍처
원시 또는 반정형 데이터를 위한 중앙 집중식 저장소
집중
소유권, 거버넌스 및 발견 가능성
대규모 데이터의 저장 및 처리
최적 대상
병목 현상과 확장성으로 인해 어려움을 겪는 조직
분석 및 머신러닝 워크로드를 위한 단일 소스가 필요한 기업
선택 시점
데이터 품질, 자율성, 도메인 간 협업이 가장 중요한 경우
비용 효율적인 저장 및 배치 분석이 우선인 경우

데이터 메시와 데이터 웨어하우스 비교

데이터 메시
데이터 웨어하우스
핵심 개념
도메인별로 관리되는 분산형 데이터 제품
분석을 위한 중앙 집중식 정형 저장소
집중
확장성, 민첩성, 분산형 거버넌스
고성능 쿼리 및 BI 보고
최적 대상
다양하고 빠르게 변화하는 데이터 요구사항을 가진 복잡한 조직
주로 정형 데이터와 표준화된 보고를 필요로 하는 기업
선택 시점
유연성, 도메인 소유권 및 상호운용성이 중요한 경우
일관된 과거 기록 보고 및 규제 준수가 최우선 과제인 경우

데이터 메시와 데이터 패브릭 비교

데이터 메시
데이터 패브릭
핵심 개념
분산형, 도메인 주도 데이터 소유권
데이터 접근을 위한 중앙 집중식 통합 계층
집중
확장성과 자율성을 위한 조직 모델
기술 중심의 연결 및 자동화
최적 대상
도메인 구조가 복잡한 대규모 조직
사일로 간 통합 접근이 필요한 기업
선택 시점
민첩성, 도메인 책임, 데이터 제품화가 우선순위인 경우
하이브리드 환경 전반에서 원활한 통합 및 자동화가 주요 목표인 경우

데이터 메시 구현

데이터 메시 구현에는 분산화와 공유 표준 간의 균형을 맞추는 전략적 접근이 필요합니다. 데이터 메시 구현의 핵심 단계는 다음과 같습니다.

  1. 파일럿 도메인 식별: 명확한 비즈니스 가치와 높은 데이터 성숙도를 가진 2~3개 도메인을 선정해 소규모로 시작합니다. 이러한 팀은 초기 도입자로서 데이터 메시 모델을 검증한 후 조직 전체로 확장합니다.
  2. 플랫폼 구축: 데이터 제품의 게시, 검색, 소비를 위한 공통 툴을 제공하는 셀프서비스 데이터 플랫폼을 구축합니다. 여기에는 데이터 카탈로그, API, 자동화된 보안 기능을 포함하여 도메인 팀의 업무 부담을 줄입니다.
  3. 연합 거버넌스 정의: 보안, 규제 준수, 상호 운용성에 대한 글로벌 표준을 강제하면서도 도메인 자율성을 허용하는 거버넌스 정책을 수립합니다. 거버넌스에는 명확한 역할, 데이터 제품 정의, 품질 기대치가 포함되어야 합니다.

피해야 할 안티 패턴

데이터 메시가 자연스러운 조직 패턴을 따르지 않고 잘못 구현될 경우 혼란과 불협화음을 초래할 수 있습니다. 데이터 메시의 안티 패턴이란 유용해 보이지만, 결국 아키텍처의 핵심 원칙을 훼손하는 반복적인 접근법이나 관행을 의미합니다. 피해야 할 안티 패턴은 다음과 같습니다.

데이터 메시를 위한 5가지 선진사례

  1. 소규모로 시작하고 반복: 확장 전에 파일럿 영역을 활용해 프로세스를 개선하세요.
  2. 데이터를 제품으로 취급: 모든 데이터 세트에 대한 소유권, SLA, 사용성 기준을 정의하세요.
  3. 공유 툴에 투자: 도메인 팀이 데이터를 쉽게 게시하고 탐색할 수 있도록 지원하세요.
  4. 초기 단계부터 거버넌스 구축: 자율성과 규제 준수를 시작부터 균형 있게 조정하세요.
  5. 비즈니스 성과에 집중: 데이터 제품을 기술적 목표뿐만 아니라 측정 가능한 가치와 연계하세요.

도메인 소유권, 견고한 플랫폼, 연합 거버넌스를 결합함으로써 조직은 전통적인 중앙 집중식 모델의 병목 현상 없이 민첩성, 신뢰성 및 도메인 간 협업을 향상시킬 수 있습니다.

측정 및 지표

성공을 평가하려면 기술적 성과와 비즈니스 성과를 균형 있게 반영하는 데이터 메시 지표가 필요합니다. 이러한 지표에는 다음이 포함될 수 있습니다.

이러한 지표는 일률적인 벤치마크를 가정하지 않으면서도 데이터 메시가 민첩성, 신뢰성, 확장성을 제공하는지에 대한 방향성 통찰을 제공합니다.

데이터 메시 FAQ

데이터 민주화란?
핵심적으로 데이터 민주화는 사람들이 일상 업무에서 직면하는 데이터 문제를 해결하는 데 있습니다. 데이터 메시는 데이터 소유권을 비즈니스 영역에 분산시켜(데이터를 그 맥락에 가장 가까운 사람들이 관리하도록) 지원하고, 데이터 제품의 게시, 발견 및 사용을 용이하게 하는 셀프서비스 플랫폼을 제공함으로써 이를 뒷받침합니다. 이 블로그에서 데이터 민주화의 정의, 원칙, 직원들이 데이터 관련 질문을 하고 답을 얻는 데 편안함을 느끼도록 돕는 방법에 대한 자세한 내용을 확인할 수 있습니다.
상호운용성이란 무엇인가요?

상호운용성은 시스템이나 제품이 사용자의 특별한 노력 없이 다른 시스템이나 제품과 함께 작동할 수 있는 능력을 의미합니다. 테크타겟(Techtarget)은 상호운용성이 조직이 더 높은 효율성과 정보 및 데이터에 대한 보다 포괄적인 시각을 달성하는 데 도움이 된다고 덧붙입니다. 더 자세한 내용은 이 Open MOOC 강의에서 데이터 상호 운용성의 기본 사항과 데이터의 다양한 유형 및 상호 운용성 계층에 대해 설명합니다.

데이터 맥락에서 상호운용성은 단순한 연결성을 넘어 발견 가능성(카탈로그나 레지스트리를 통해 도메인 간 데이터 제품을 쉽게 찾을 수 있도록 하는 것), 계약(일관된 소비를 보장하기 위한 데이터 스키마, API, SLA에 대한 명확하고 기계가 읽을 수 있는 합의), 공유 표준(도메인 간 마찰 없는 데이터 교환을 위한 공통 거버넌스, 메타데이터, 보안 관행) 등을 포함합니다.

상호운용성의 예로는 고객 도메인이 고객 프로필 데이터 제품을 공개하면 영업 도메인이 이 데이터를 활용해 파이프라인 분석을 강화하는 경우가 있습니다. 상호운용성은 영업 팀이 카탈로그에서 고객 데이터 제품을 발견하고, 스키마 및 품질 보장을 위한 계약을 신뢰하며, 수동 작업 없이 공유 표준을 통해 통합할 수 있도록 보장합니다.

데이터 메시와 데이터 패브릭의 차이점은 무엇인가요?

데이터 메시와 데이터 패브릭은 기업의 데이터 관리 전략 내에서 서로 다른 아키텍처 접근법입니다.

데이터 패브릭은 AI, 머신러닝, 고급 분석을 통합하여 복잡한 메타데이터와 비정형 정보를 더욱 원활하게 관리할 방법을 찾는 기술 중심적 접근법입니다. 반면에 데이터 메시는 데이터 패브릭 내의 모든 기술 발전에 의존하지만, 데이터 관리 프로세스를 데이터에 의존하는 인간 사용자와 통합하고, 사람의 관점에서 데이터 액세스와 유용성을 간소화하고 단순화하는 방법을 찾는 데 더 중점을 둡니다.

데이터 메시와 데이터 패브릭 사이에는 닭과 달걀 같은 관계가 있습니다. 데이터 관리가 필요한 속도로 발전하려면 끊임없이 발전하는 데이터 패브릭 기술이 필요합니다. 그러나 인적 프로세스와 조직 전략의 발전이 수반되지 않으면 사람들은 발전하는 데이터 패브릭 기술을 제대로 활용할 수 없습니다. DOS와 복잡한 인터페이스가 오늘날 우리가 누리는 보다 원활한 컴퓨터 운영 체제로 발전한 것처럼, 데이터 메시와 데이터 패브릭 아키텍처도 이러한 프로세스와 기술이 발전함에 따라 점점 더 원활하게 발전할 것입니다.

데이터 메시는 어떤 문제를 해결하나요?
데이터 메시는 중앙 집중식 데이터 팀이 만드는 병목 현상을 해결하고, 인사이트 도출 시간을 단축하며, 확장성을 가능하게 합니다. 기존 모델은 데이터 소유권과 처리를 단일 팀에 집중시켜 지연을 초래하고 민첩성을 저하합니다. 데이터 메시는 네 가지 원칙을 적용하여 도메인 소유권, 제품으로서의 데이터, 셀프서비스 데이터 플랫폼, 연합 거버넌스 문제를 해결합니다. 데이터 메시 원칙들은 함께 책임을 분산시키고 접근성을 개선하며 의사결정을 가속화합니다.
데이터 메시는 기술인가요 아니면 운영 모델인가요?
데이터 메시는 단일 기술이나 툴이 아닌 운영 모델입니다. 이는 소유권을 비즈니스 도메인에 분산하고 데이터를 제품으로 취급함으로써 팀이 데이터를 다루는 방식을 조직화하는 방법입니다. 데이터 메시 모델은 셀프서비스 인프라, 데이터 카탈로그, 거버넌스 툴과 같은 공유 플랫폼 기능에 의해 지원되며, 이를 통해 팀은 데이터를 효과적으로 게시, 공유 및 거버넌스할 수 있습니다. 기존 기술을 대체하기보다는, 데이터 메시는 중앙 집중식 팀에 병목 현상을 발생시키지 않으면서 조직 전반에 걸쳐 데이터를 확장할 수 있는 프레임워크를 제공합니다.