Czym jest siatka danych?

Siatka danych to podejście do zarządzania danymi, które wykorzystuje rozproszoną strukturę architektoniczną.

Przegląd siatki danych

Siatka danych reprezentuje nowy sposób patrzenia na informacje. Z rosnącej koncepcji wynika, że dane są w rzeczywistości produktem, narzędziem, środkiem do celu – a nie po prostu czymś, co firmy gromadzą i analizują później w kuszącej wstecz próbie zrozumienia rzeczy, które już się wydarzyły.

Definicja siatki danych

Siatka danych to podejście do zarządzania danymi, które wykorzystuje rozproszoną strukturę architektoniczną. Innymi słowy: przenosi odpowiedzialność za określone zbiory danych w całej firmie na użytkowników, którzy posiadają specjalistyczną wiedzę, aby zrozumieć, co oznaczają te dane i jak najlepiej z nich korzystać.

 

Architektura siatki danych łączy i pobiera dane z różnych źródeł, takich jak jeziora danych i magazyny, i dystrybuuje odpowiednie zbiory danych do odpowiednich ekspertów i zespołów ds. domeny w całej firmie. Zasadniczo obszerny przeskok danych w centralnym jeziorze danych jest sortowany i dystrybuowany do możliwych do zarządzania fragmentów do tych, które najlepiej nadają się do ich zrozumienia i wykorzystania.

placeholder

 

 

Zasady dotyczące siatki danych dla wyzwań związanych z jeziorem danych

Kiedy mówimy o jeziorach danych i siatce danych, mówimy zasadniczo o Big Data. To, co sprawia, że dane są „duże”, to nie tylko ich ogromny wolumen. Wśród innych kryteriów Big Data definiuje się również jako złożone, zmienne, szybko generowane i nieustrukturyzowane.


Liniowa baza danych jest jak arkusz kalkulacyjny: zawiera kolumny i wiersze oraz niezmienne kategorie, do których muszą pasować wszystkie komponenty danych. Niektóre dane generowane z maszyn, czujników i źródeł przemysłowych są ustrukturyzowane i pasują do liniowej bazy danych. Bez względu na to, z jakim wolumenem danych masz do czynienia, jeśli jest w 100% skonstruowany, nie spełnia on kryteriów Big Data i może być przechowywany w liniowej bazie danych, dzięki czemu można go stosunkowo łatwo filtrować i wyodrębniać.

 

Ale coraz bardziej nowoczesne Big Data są nieustrukturyzowane i składają się z elementów wizualnych, tekstu otwartego, a nawet wideo i bogatych mediów. Te kluczowe dane mogą zawierać tysiące terabajtów informacji dla wielu firm i po prostu nie mogą być przechowywane w standardowej liniowej bazie danych.

 

Wprowadź jezioro danych. Wraz ze wzrostem wolumenów Big Data, jeziora danych zostały opracowane jako miejsce, w którym można było przechowywać złożone dane i uzyskiwać do nich dostęp z centralnego repozytorium w formacie niesformatowanym. Chociaż jeziora danych stanowią doskonałe rozwiązanie problemu Big Data, mają jednak słabe strony. Laki danych nie mają pewnych funkcji analitycznych, co czyni je zależnymi od innych usług w zakresie pobierania, indeksowania, transformacji, tworzenia zapytań i funkcji analitycznych. Z punktu widzenia zarządzania przedsiębiorstwem jeziora danych stanowią również trzy dodatkowe wyzwania:

 

1. Złożona własność Własność w jeziorach danych jest złożona, aby określić, kiedy zbyt wielu graczy generuje i uzyskuje dostęp do danych. W przypadku braku jasno określonych ról i obowiązków, ten sam zbiór danych może być zarządzany w różny sposób przez różne strony, co powoduje niespójności, które utrudniają ich wykorzystanie. Podobnie, inne dane są zaniedbywane, gdy nie są aktywnie zarządzane przez tych, którzy ostatecznie będą je używać. Architektura siatki danych zapewnia, że nadzór nad danymi jest wyraźnie rozprowadzany według domeny, tak aby każdy zespół lub ekspert ds. domeny zarządzał generowanymi i wykorzystywanymi przez siebie danymi. W tym celu siatki danych wykorzystują również sfederowaną strukturę nadzoru, aby umożliwić centralną kontrolę modelowania danych, polityki bezpieczeństwa i zgodności z przepisami.

 

2. Jakość danych Laki danych mogą nie zapewnić jakości danych, gdy wolumen danych staje się zbyt duży lub gdy sami centralni menedżerowie danych nie rozumieją go. Architektura siatek danych zasadniczo traktuje dane jako wartościowy produkt, który stawia jakość i kompletność danych w czołówce zarządzania danymi. Przypuszczalnie każdy zespół zna najważniejsze kryteria i problemy, które chcą ekstrapolować z danych, które zbiera. Dzięki włączeniu tych kryteriów i priorytetów do architektury siatka danych może pomóc zapewnić ciągłe i priorytetowe dostarczanie czystych, świeżych i kompletnych danych, nawet jeśli zaangażowane są większe zbiory danych. Oczywiście, gdy stosowane są algorytmy uczenia maszynowego, te kryteria i wynikowe zbiory danych stają się z czasem coraz bardziej dokładne i przydatne.

 

3. Wąskie gardła Jeziora danych mogą tworzyć wąskie gardła ze względu na ich scentralizowaną architekturę oraz tradycyjnie trudne procesy i protokoły pozyskiwania danych. Zazwyczaj oznacza to, że kontrola dużej ilości skonsolidowanych danych sprowadza się do jednego zespołu ds. IT lub zarządzania danymi. W miarę wzrostu ilości danych (i zapotrzebowania na ich pobieranie) te zespoły IT są nadmiernie opodatkowane.

 

Ponadto dane muszą zostać poddane przeglądowi i odpowiednio zorganizowane w celu zapewnienia zgodności i przestrzegania zasad nadzoru nad danymi. W obliczu nadmiernej presji może wystąpić tendencja do przechodzenia przez te etapy zgodności, co generuje potencjalne ryzyko i straty dla firmy. Z drugiej strony, architektura siatek danych daje dostęp i kontrolę uprawnionym specjalistom, którzy mają większe zainteresowanie danymi – a wszystko to przy zastosowaniu rygorystycznych, wbudowanych protokołów bezpieczeństwa.

 

 

Zasady dotyczące siatki danych powstały w bezpośredniej odpowiedzi na te rosnące wyzwania związane z jeziorem danych. Zdecentralizowana i zdemokratyzowana architektura zarządzania danymi sprawiła, że firmy stały się mądrzejsze, sprawniejsze i dokładniejsze dzięki zapewnieniu natychmiastowego dostępu do właściwych danych odpowiednim osobom, niezależnie od tego, gdzie i kiedy ich potrzebują. Siatka danych sprawia, że dane jako produkt stają się rzeczywistością, zmniejszając bariery i nadając priorytet wartości informacji, dzięki czemu zespoły mogą uzyskać szybszy, niezakłócony dostęp do niezbędnych danych.

Wyjaśnienie architektury siatki danych

Omówiliśmy, jak siatka danych jest zdecentralizowaną formą architektury danych, która traktuje dane jako niezbędne narzędzie do zarządzania firmą. Co ważne, niezależne zespoły są odpowiedzialne za przetwarzanie danych w swoich dziedzinach pracy i specjalistycznej wiedzy, przy jednoczesnym zapewnieniu zgodności z centralnie określonymi praktykami zarządzania danymi. Ta zmiana sposobu myślenia jest podstawą siatki danych.

 

Aby lepiej zrozumieć, w jaki sposób jest to realizowane, możemy zobaczyć architekturę siatki danych jako posiadającą trzy główne komponenty:

 

1. Źródła danych reprezentują repozytorium (jak jezioro danych), do którego wprowadzane są pierwotne dane niesformatowane. Niezależnie od tego, czy są one gromadzone z sieci Cloud IIoT, formularzy informacji zwrotnych od klientów czy zezłomowanych danych internetowych, są to surowe dane wejściowe, do których będą odnoszone i przetwarzane w razie potrzeby przez użytkowników w całej sieci. Podczas gdy podejście oparte na jeziorze danych doprowadziłoby do przemieszczenia wszystkich tych danych w jedno centralne miejsce, metodyka siatki danych zamiast tego rozdziela odpowiedzialność za przyjmowanie, przechowywanie, przetwarzanie i ekstrakcję tych surowych danych w ramach szeregu odpowiedzialnych domen.

 

2. Infrastruktura siatki danych oznacza, że informacje te nie są izolowane wyłącznie w poszczególnych domenach departamentów, ale mogą być również udostępniane dowolnie w całej sieci operacyjnej organizacji, zachowując jednocześnie zgodność z ustalonymi wytycznymi dotyczącymi nadzoru nad danymi. Jest to bezpośredni wynik dwóch kluczowych filarów sieci danych: samoobsługowej platformy danych i sfederowanego zarządzania. Platforma danych samoobsługowych zapewnia oprzyrządowanie i infrastrukturę potrzebną przez każdą domenę do powszechnego pozyskiwania, przekształcania, przetwarzania i dostarczania swoich danych. Tymczasem sfederowane zasady zarządzania zapewniają standaryzację w całej organizacji, co pozwala na bezproblemową interoperacyjność danych między wszystkimi zespołami domenowymi.

 

3. Właściciele danych są końcowym składnikiem sieci danych i są odpowiedzialni za stosowanie protokołów zgodności, nadzoru i kategoryzacji danych swoich działów. Na przykład pliki HR muszą być przechowywane za pomocą określonych protokołów bezpieczeństwa, nie mogą być używane do tego lub w tym celu, muszą być udostępniane tylko takiemu i takiej osobie. Oczywiście każdy dział będzie dysponował kategoriami i rodzajami danych unikalnymi dla swojego działu lub celów. W systemie Data Lake zespoły IT muszą zmagać się ze wszystkimi tymi różnymi protokołami i kategoriami dla wszystkich właścicieli danych, którzy zrzucili rzeczy do jeziora. Podczas gdy architektura siatek danych daje właścicielom domen pełne uprawnienia i kontrolę nad tymi kwestiami, ponieważ znowu, którzy lepiej niż eksperci w danej dziedzinie zarządzają własnymi danymi i zapewniają, że spełniają one normy jakości.

placeholder

Siatka danych w praktyce: kto z niej korzysta i dlaczego

Aby rozwiązania do zarządzania danymi mogły się rozwijać i odnosić większe sukcesy, muszą być użyteczne i istotne dla szerokiej gamy aplikacji i operacji. Wraz z poprawą architektury siatek danych i przyjazności dla użytkownika obserwujemy zwiększony zakres funkcji biznesowych, które można ulepszyć dzięki bezpiecznemu i rozproszonemu podejściu do danych jako produktu i narzędzia.

 

Oto kilka typowych przypadków użycia biznesowego:

  • Sprzedaż: w przypadku zespołów sprzedażowych wszystko sprowadza się do pozyskiwania, pielęgnowania i zamykania potencjalnych szans. Im więcej czasu członkowie zespołu ds. sprzedaży spędzają w biurach na wykonywanie zadań administracyjnych, tym mniej czasu muszą budować relacje z nowymi klientami. Dzięki architekturze siatek danych użytkownicy zespołu ds. sprzedaży nie muszą być ekspertami w dziedzinie zarządzania danymi i pozyskiwania danych, aby mieć na wyciągnięcie ręki najpotężniejsze i najbardziej odpowiednie zestawy danych i kombinacje. Gdy działy sprzedaży mają wszystkie właściwe dane do analizy, przekładają się one na bardziej praktyczne analizy i strategie.

  • Łańcuch dostaw i logistyka: Nowoczesne łańcuchy dostaw są podatne na olbrzymi zakres zakłóceń. Przewaga konkurencyjna pojawia się, gdy firmy mogą szybko się rozwijać i reagować zarówno na zagrożenia, jak i szanse z jednakową elastycznością. Dzisiejsze dane o globalnym łańcuchu dostaw są gęste i szybkie – od informacji zwrotnych od klientów, po sieci IIoT i cyfrowe bliźniaki. Gdy doświadczeni i doświadczeni menedżerowie łańcucha dostaw sami są w stanie opracowywać i analizować każdy z tych zbiorów danych w czasie rzeczywistym, firmy zyskują potężne źródło informacji i wyczucia.

  • Produkcja: W ramach łańcucha dostaw operacje produkcyjne firmy są w równym stopniu podatne na gwałtowne zmiany na rynku i zmienne wymagania klientów. W przeszłości zespoły projektowe i badawczo-rozwojowe musiałyby polegać na historycznych danych o klientach, przekazywanych im z innych działów. Dziś siatka danych zapewnia dostęp do danych na żywo użytkownikom stojącym za tabelą redakcyjną, w zespołach badawczo-rozwojowych i testowych oraz na całej drodze do hali produkcyjnej. Informacje zwrotne od klientów w czasie rzeczywistym mogą błyskawicznie informować o rozwoju produktu, a najnowsze dane z sieci IIoT i symulacji cyfrowych mogą pomóc fabrykom działać bezpieczniej, szybciej i wydajniej.

  • Marketing: Obecnie wymagania i oczekiwania klientów kształtują przyszłość, zmieniają się i rosną w niespotykanym dotąd tempie. Pojedyncza marka ma zazwyczaj wiele punktów kontaktowych dla konsumentów w mediach społecznościowych, ukierunkowane reklamy cyfrowe oraz portale zakupów online i omnikanałowych. Obecny rynek widzi rosnące pragnienie szybkiego dostosowywania, krótsze cykle życia produktów oraz olbrzymi poziom wyboru i konkurencji. Aby zrozumieć i wykorzystać te trendy, współcześni marketingowcy muszą mieć dostęp w czasie rzeczywistym i jednocześnie do szerokiej gamy zestawów danych. W przeszłości oznaczało to żądanie (i oczekiwanie) tych danych od innych działów. Dzięki konfiguracji siatki danych marketerzy mogą jednak przechowywać i uzyskiwać dostęp do tych danych w danym momencie, na własnych warunkach.

  • Zarządzanie kadrami: zespoły HR muszą zarządzać dużą ilością niezwykle złożonych i wrażliwych danych. Wraz z rosnącą tendencją do pracy zdalnej i hybrydowej dane stają się z dnia na dzień coraz bardziej skomplikowane i zróżnicowane geograficznie. Nie wspominając o ciągle zmieniającym się zbiorze kwestii zgodności z przepisami i kwestii prawnych , które zespoły HR muszą pilnie nadążać za tym. Od zatrudnienia do przejścia na emeryturę liderzy HR muszą być w stanie weryfikować, oceniać i analizować niektóre z najbardziej zróżnicowanych zbiorów danych w każdej organizacji. Architektura siatek danych pozwala na odpowiednie protokoły bezpieczeństwa i ściśle ograniczony dostęp – przy jednoczesnym umożliwieniu uprawnionym użytkownikom HR dostępu do danych i informacji szybko i bez zależności od złożonych protokołów wewnętrznych i wielooddziałowej biurokracji.

  • Finanse: Podobnie jak w przypadku HR, działy finansów i księgowości są również odpowiedzialne za niezwykle istotne i wrażliwe dane. Nowoczesne systemy ERP rewolucjonizują finanse, wykorzystując technologię baz danych in-memory do dostosowywania aktualnych raportów, analiz i prognoz. Jednak nawet gdy zespoły finansowe korzystają z najlepszych baz danych i systemów ERP, często napotykają przeszkody, ponieważ są nękani długimi i sztywnymi kulturami, ciężkimi silosami i biurokratycznymi, staroszkolnymi procesami. Architektura siatek danych wprowadza zasadniczą zmianę w sposobie przeglądania danych finansowych i zarządzania nimi, a nawet może wstrząsnąć stagnacyjnym myśleniem, które może mieć miejsce, gdy zespoły mają możliwość posiadania i korygowania własnych, starzejących się procesów przetwarzania danych.

Oczywiste jest, że siatka danych to nie tylko kolejne słowo i jest to trend w zakresie strategii danych, który należy traktować poważnie. Firmy różnej wielkości i branżowe wykorzystują siatkę danych, szukając sposobów na wykorzystanie danych do tworzenia analiz i wartości.

Korzyści z siatki danych

W przeszłości dotychczasowe bazy danych i ograniczone infrastruktury zarządzania danymi przyczyniały się do tego, że dane mają być przechowywane w jednym skarbcu i prowadzone według uznania kilku menedżerów danych. Teraz dane są paliwem, które napędza Twój biznes i powinny być swobodnie przekazywane tym specjalistom, którzy najlepiej wiedzą, jak sprawić, aby działało i osiągać zyski w konkurencyjnych czasach.

 

Główne zalety architektury siatki danych można podsumować jako:

  • Większa dostępność danych. Siatka danych zapewnia, że wszystkie właściwe osoby w całej organizacji mogą uzyskać dostęp do potrzebnych danych – aby być absolutnie najlepszymi w swojej pracy.

  • Ulepszone możliwości analityczne. Kiedy dane są traktowane jako produkt, który ma być używany każdego dnia, zespoły zaczynają stosować podejście do planowania i strategii w pierwszej kolejności danych. Prowadzi to do zmniejszenia liczby błędów i bardziej obiektywnego, mniej opartego na opinii podejścia do rozwoju biznesu.

  • Konfigurowalne potoky danych i procesy. Wiele z najlepszych i potencjalnie najbardziej dochodowych projektów zostaje odłożonych na półkę z powodu ogromnego kłopotu, jakim jest ukrywanie unikalnych i spersonalizowanych zestawów danych potrzebnych do osiągnięcia sukcesu. Dzięki siatce danych zespoły mogą szybko uzyskać dostęp i przetestować nowe modele projektów bez tradycyjnej utraty czasu i zasobów.

  • Wąskie gardła można zmniejszyć. Jest to oczywista wygrana/wygrana zarówno dla zespołów IT, jak i właścicieli danych. Ponadto, ograniczając źródło frustracji i irytacji, przedsiębiorstwa mogą pomóc w likwidacji silosów, które stoją na drodze do zdrowego rozwoju biznesu.

  • Zmniejszenie obciążenia centralnych zespołów ds. zarządzania danymi. Oznacza to nie tylko zmniejszenie zaległości i frustracji, ale także uwolnienie niezliczonej ilości godzin dla Twoich utalentowanych zespołów IT, aby poświęcić się bardziej wyspecjalizowanym, interesującym i dochodowym działaniom.

Często zadawane pytania (FAQ) dotyczące siatki danych

Demokratyzacja danych opiera się na rozwiązywaniu problemów związanych z danymi, z którymi borykają się ludzie w codziennej pracy. Więcej szczegółów na temat definicji, zasad i tego, jak pomóc pracownikom czuć się komfortowo w zadawaniu pytań związanych z danymi i uzyskaniu odpowiedzi, są wymienione na tym blogu.

Interoperacyjność jest zdefiniowana jako zdolność systemu lub produktu do współpracy z innymi systemami lub produktami bez specjalnego wysiłku ze strony użytkownika. Techtarget dodaje, że pomaga organizacjom osiągnąć wyższą wydajność i bardziej całościowy wgląd w informacje i dane. Aby uzyskać bardziej szczegółowe informacje, niniejsza lekcja Open MOOC zawiera podstawy interoperacyjności danych, a także różne rodzaje i warstwy interoperacyjności danych.

 

Siatka danych i tkanina danych to różne podejścia architektoniczne w ramach strategii zarządzania danymi firmy.

 

Tkanina danych to podejście technocentryczne, które ma na celu znalezienie coraz bardziej spójnych sposobów zarządzania złożonymi metadanymi i nieustrukturyzowanymi informacjami poprzez łączenie sztucznej inteligencji, uczenia maszynowego i zaawansowanych analiz. Z drugiej strony siatka danych, choć zależna od rozwoju technologicznego w strukturze danych, jest bardziej skoncentrowana na integracji procesów zarządzania danymi z użytkownikami, którzy od nich zależą, a także na znalezieniu sposobów na usprawnienie i uproszczenie dostępu do danych i przydatności z perspektywy ludzi.

 

Pomiędzy siatką danych a tkanką danych istnieje coś w rodzaju relacji między kurczakiem a jajkiem: do rozwoju zarządzania danymi z szybkością niezbędną potrzebne są stale rozwijające się technologie tkanin danych. Jednak bez towarzyszącej im ewolucji procesów ludzkich i strategii organizacyjnych, ludzie nie będą w stanie odpowiednio wykorzystać zaawansowanych technologii tkanek danych. Tak jak DOS i złożone interfejsy ustąpiły miejsca bardziej płynnym komputerowym systemom operacyjnym, z których obecnie korzystamy, architektury siatek danych i tkanin danych mają się rozwijać w miarę postępu tych procesów i technologii.

placeholder

Rozwiązania dla analizy i danych SAP

Identyfikuj, analizuj i przekształcaj najważniejsze dane w całej firmie.

placeholder

Pomysłów nie znajdziesz nigdzie indziej

Zarejestruj się, aby otrzymać dawkę rozwiązań Business Intelligence dostarczanych bezpośrednio na Twoją skrzynkę odbiorczą.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel