Mi az az adattó?

Az adattó egy központi adattár, amely segít az adatsilóval kapcsolatos problémák kezelésében. 

Adattó áttekintése

Lényegében egy adattó információtároló. Az adattavakat gyakran összetévesztik az adattárházakkal, de mindkettő eltérő üzleti igényeket elégít ki, és eltérő architektúrával rendelkezik. Különösen a felhőalapú adattavak képezik a modern adatkezelési stratégia alapvető elemét, mivel a közösségi adatok, a dolgok internete (IoT) gépi adatainak elterjedése és a tranzakciós adatok felgyorsulnak. Az adattípusok tárolásának, átalakításának és elemzésének képessége új üzleti lehetőségeket és digitális átalakulást tesz lehetővé – és itt rejlik az adattó szerepe.

90

%

A pénzügyi intézmények közül a Big Data kezdeményezések határozzák meg a jövőbeli sikereket

64.2

zettabájt digitális adat jött létre 2020-ban

17.6

B $USD

az adattópiac becsült értéke 2026-ra

Adattó definíciója

Az adattó egy központi adattár, amely segít az adatsilóval kapcsolatos problémák kezelésében. Fontos, hogy egy adattó hatalmas mennyiségű nyers adatot tárol natív – vagy eredeti – formátumban. Ez a formátum lehet strukturált, strukturálatlan vagy félig strukturált. Az adattavak, különösen a felhőben lévők, alacsony költségűek, könnyen méretezhetők, és gyakran használatosak az alkalmazott gépi tanulási elemzésekkel.

Adattó kontra adattárház

Az adattóhoz képest az adattárház adatkezelési funkciókat biztosít, és előre meghatározott üzleti kérdésekre vagy használati esetekre már feldolgozott és szűrt adatokat tárol.

Adattárház diagramja egy adattóhoz viszonyítva.

Az adattárházak és tavak gyakran kiegészítik egymást. Például, ha egy adattóban tárolt nyers adatokra van szükség egy üzleti kérdés megválaszolásához, akkor ki lehet nyerni, meg lehet tisztítani, átalakítani és fel lehet használni egy adattárházban további elemzésre.

 

Az „adattó” egy új és fejlődő koncepció, amely egy hagyományos adattó mellett ad hozzá adatkezelési képességeket. Lényegében ez egy adattó és egy adattárház kombinációja.

 

Az adatok típusa és a fent említett folyamat különbségei mellett néhány részlet az adattó és egy adattárház-megoldás összehasonlítására szolgál.

Adattó
Adattárház
Adatok
Bármilyen adattípus bármely forrásból
Relációs vagy strukturált
Séma
Séma-on-read (elemzés időpontja)
Séma íráshoz (előre definiált)
Raktározási költségek
Alacsonyabb költség – petabájtskála
Magasabb költségek – terabájtskála
Adatminőség
Kitöltött vagy nem gondozott adatok
Kitöltött adatok
felhasználó
Adattudósok, adatfejlesztők (például Python használatával) és üzleti elemzők (SQL használatával a kezelt adatokhoz)
SQL-et használó üzleti elemzők
Analitika
Gépi tanulás, prediktív analitika, adatfelderítés/profilkészítés
Sarzsbeszámolók, BI, vizualizációk

Végső soron az adatok mennyisége, az adatbázis teljesítménye és a tárolás árazása fontos szerepet játszik a megfelelő tárolási megoldás kiválasztásában.

A data lake megoldás kulcsfontosságú elemei

  • Adatmozgás: Az adattavak lehetővé teszik bármely adattípus importálását több forrásból annak natív formátumában. Ez lehetővé teszi a vállalkozások számára, hogy szükség szerint méretezzék az adatok méretét anélkül, hogy adatstruktúrákat, sémákat és átalakításokat kellene meghatározniuk, ami általánosköltség-megtakarítást eredményezhet.

  • Biztonságos tárolás és katalógusadatok: Az adattó strukturált, félig strukturált és strukturálatlan adatokat tárol különböző forrásokból, például CRM-ből vagy ERP-szoftverből, IoT-eszközökből, közösségi médiából származó üzleti adatokból, vagy akár régi rendszerekből származó történeti adatokat. Az adattavak lehetővé teszik a kötegelt és streamelt adatok rögzítését az irányítás, a biztonság és a vezérlés alkalmazása közben. Az adatok lekérdezhetők közvetlenül vagy egy adattárházba a megfelelő eszközökkel.

  • Elemzések és gépi tanulás: Az adattavak szerepalapú hozzáférést biztosítanak az információkhoz az elemzések és a gépi tanulás elemzésének futtatásához anélkül, hogy az adatokat külön elemzési adatbázisba kellene áthelyezni. Az adattavak lehetővé teszik a történeti adatok valós idejű adatokkal való kombinálását a gépi tanulási vagy prediktív elemzési modellek finomítása érdekében, hogy jobb és/vagy új eredményeket biztosítsanak.

Hogyan működnek az adattavak

Egy modern adattó három fő jellemzővel rendelkezik:

  1. Egy leszállási zóna a nyers adatokhoz
  2. Rendelkezésre bocsátási zóna, ahol az adatok átalakítására elemzési céllal kerül sor
  3. Adatböngészési zóna, ahol az analitikák, alkalmazások és gépi tanulási modellek töltik fel az adatokat

Az adattóból különféle forrásokból – például elemzésekből vagy más üzleti alkalmazásokból – vagy további elemzésre szolgáló gépi tanulási eszközökbe jut az információ.

 

Adattó használati eset

Íme két példa az adattóhasználati esetre a kiskereskedelemben.

 

A hosszú távú értékesítési adatok egy adattóban kerülnek tárolásra olyan strukturálatlan adatok mellett, mint a weboldal clickstream adatai, az időjárás, a hírek és a mikro-/makrogazdasági adatok. Ezen adatok együttes tárolása és hozzáférhetősége megkönnyíti az adattudós számára, hogy ezeket a különböző információforrásokat olyan modellben egyesítse, amely előre jelzi egy adott termék vagy termékcsoport iránti keresletet. Ezt az információt azután a kiskereskedelmi ERP-rendszer bemeneteiként használják a termelési tervek növeléséhez vagy csökkentéséhez.

 

Ezzel párhuzamosan egy marketingszakértő hozzáférhet ugyanehhez az adattóhoz, és megnézheti a weboldal és a közösségi média hír-, makrogazdasági és értékesítéstörténeti adatokkal kapcsolatos hangulatelemzését, hogy meghatározza, mely termékekre összpontosítson, és hogyan maximalizálhatja az értékesítést, a profitot és/vagy az alkalmazást.

Az adattavak típusai

Az adattavak a helyszínen, a felhőben, a kettő hibridjében, valamint több felhőalapú hiperskálázón, például az Amazon Web Services (AWS), a Microsoft Azure vagy a Google Cloud keresztül tartózkodhatnak.

 

Messze a legnépszerűbb adattó a felhőalapú adattó. A felhőalapú adattó biztosítja az összes szokásos adattó funkciót, de egy teljesen felügyelt felhőszolgáltatásban.

  • Helyszíni adattó: A helyszíni adattóval házon belüli informatikai mérnöki erőforrások kezelik a hardvereket, szoftvereket és folyamatokat. Ez a megközelítés magasabb tőkekiadási (CAPEX) kötelezettségvállalással rendelkezik, és az adatok általában elhallgattatnak.

  • Felhőalapú adattó: A felhőalapú adattóban az on-premise infrastruktúra kiszervezésre kerül. Magasabb operatív kiadási kötelezettségvállalás (OPEX) létezik, de ez a kiépítési megközelítés lehetővé teszi a vállalkozások számára, hogy több más előnnyel együtt nagyobb méreteket érjenek el (lásd alább).

  • Hibrid adattó: Egyes esetekben egyes vállalatok úgy döntenek, hogy egyszerre tartják karban az on-premise és a felhő adattavakat. Ez a helyzet meglehetősen ritka, és többnyire az on-premise rendszerből a felhőbe történő migráció során tapasztalható.

  • Többfelhős adattó: Egy többfelhős adattónál két vagy több felhő ajánlat kombinálódik; például egy vállalat az AWS és az Azure segítségével is kezelheti és karbantarthatja a felhőbeli adattavakat. Ehhez nagyobb szakértelemre van szükség ahhoz, hogy ezek az eltérő platformok egymással kommunikáljanak.

A felhőalapú adattó hat legfontosabb előnye

Miért válasszon felhőbeli adattavat? Az adatok nagy értékű üzleti eszközzé alakítása elősegíti a digitális átalakulást. Ezt az alapot a felhő erősségei és az adattó kombinációja adja. A felhőalapú adattó lehetővé teszi a vállalatok számára, hogy elemzéseket alkalmazzanak a történeti adatokra és az új adatforrásokra, például naplófájlokra, clickstreamekre, közösségi médiára, internetkapcsolattal rendelkező eszközökre stb., a végrehajtható elemzések érdekében.

 

Íme néhány a legfontosabb előnyök, amelyeket elvárhat:

  1. Költséghatékonyság: A felhőtárhely szolgáltatók számos tárolási és árképzési lehetőséget kínálnak.
  2. Automatikus méretezés: A felhőszolgáltatásokat úgy tervezték, hogy skálázási funkciókat biztosítsanak, lehetővé téve a vállalkozások számára, hogy igény szerint kiszámítsák és kihasználják a tárolási kapacitást.
  3. Központi adattár: A felhőalapú adattó egyesíti az információkat, és egyetlen adatforrásként szolgál, irányított adathozzáféréssel, amely lehetővé teszi a csapatok folyamatainak hatékonyságát.
  4. Adatbiztonság: A felhőalapú tárhelyszolgáltatók egy megosztott felelősségi modellen keresztül garantálják az adatok biztonságát.
  5. Eszközök: A felhőtárhely-szolgáltatók és más szállítók ETL eszközöket biztosítanak az adatok feltérképezésére, adatkatalógus összeállítására, valamint adatok előkészítésére, adatátalakításra és adatbetöltésre az adatok lekérdezhetőségének lehetővé tétele érdekében.
  6. Továbbfejlesztett elemzések az új elemzésekhez és jobb üzleti eredményekhez: A felhőalapú adattó új módokon kombinálhatja az adatokat. Például a CRM-adatok és a közösségimédia-elemzések új ügyfélbetekintést nyújthatnak az elvándorlás okába, vagy megmutathatják, hogy mely promóciók növelik a hűséget. A működési hatékonyság az IoT-adatok elemzésével is javítható.

Data lake gyakran feltett kérdések

Fedezze fel az alábbi adattavakkal kapcsolatos GYIK-jeinket, és tekintse át az adatkezelési szójegyzékünket, hogy még több meghatározást kapjunk.

Az „adattó” kifejezés a folyékony, nagyobb adattároló fogalmát tükrözte – szemben a silózottabb, jól definiált és strukturált adatpiaccal.

 

Több mint egy évtizeddel ezelőtt, ahogy az adatforrások növekedtek, az adattavak megváltoztak, hogy kezeljék a meghatározatlan adatok petabájtjainak későbbi elemzés céljából történő tárolásának szükségességét. A korai adattavak a Hadoop fájlrendszeren (HDFS) és az on-premise adatközpontokon alapuló árucikk-hardveren alapultak. Az elosztott architektúrával járó kihívások, valamint az egyéni adattranszformáció és -elemzés igénye azonban hozzájárult a Hadoop-alapú rendszerek optimálistól elmaradó teljesítményéhez.

 

A felhőalapú számítástechnika és az adattárolási technológiák képezik a modern adatverem és a felhőalapú adattavak fő alapját.

Az adattárház (DW) egy digitális tárolórendszer, amely nagy mennyiségű strukturált és formázott adatot kapcsol össze és harmonizál számos különböző forrásból. Ezzel szemben egy adattó eredeti formájában tárolja az adatokat – és nem strukturált vagy formázott.

Az adatkezelés az adatok gyűjtésének, szervezésének és elérésének folyamata a termelékenység, a hatékonyság és a döntéshozatal támogatása érdekében.

Az adattóház a hagyományos adattó képességein felül adatkezelési és raktárkapacitást is biztosít. Ez egy új és fejlődő terület, amely gyorsan változik.

A Multicloud több felhőalapú számítástechnikai és tárolási szolgáltatás használata egyetlen heterogén architektúrában. Ez a felhőbeli eszközök, szoftverek és alkalmazások több felhőalapú hoszting környezetben történő terjesztésére vonatkozik.

A fájltárolás a mappákban lévő fájlok hierarchiájaként rendszerezi és reprezentálja az adatokat; az adatokat tetszőlegesen rendezett, egyenletesen méretezett kötetekbe tiltja; az objektumtároló pedig az adatokat kezeli és összekapcsolja a kapcsolódó metaadatokkal. Az objektumtároló rendszerek nagy mennyiségű strukturálatlan adat megőrzését teszik lehetővé.

placeholder

Első lépések a data lake megoldásokkal

Fedezze fel az adattó lehetőségeit az SAP HANA Cloudon belül.

placeholder

Ötletek, amiket sehol máshol nem találsz

Iratkozzon fel egy adag üzleti intelligenciára, amelyet közvetlenül postafiókjába szállít.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel