Mi az az adattó?
Az adattó egy központi adattár, amely segít az adatsilóval kapcsolatos problémák kezelésében.
Adattó áttekintése
Lényegében egy adattó információtároló. Az adattavakat gyakran összetévesztik az adattárházakkal, de mindkettő eltérő üzleti igényeket elégít ki, és eltérő architektúrával rendelkezik. Különösen a felhőalapú adattavak képezik a modern adatkezelési stratégia alapvető elemét, mivel a közösségi adatok, a dolgok internete (IoT) gépi adatainak elterjedése és a tranzakciós adatok felgyorsulnak. Az adattípusok tárolásának, átalakításának és elemzésének képessége új üzleti lehetőségeket és digitális átalakulást tesz lehetővé – és itt rejlik az adattó szerepe.
90
%
A pénzügyi intézmények közül a Big Data kezdeményezések határozzák meg a jövőbeli sikereket
64.2
zettabájt digitális adat jött létre 2020-ban
17.6
B $USD
az adattópiac becsült értéke 2026-ra
Adattó definíciója
Az adattó egy központi adattár, amely segít az adatsilóval kapcsolatos problémák kezelésében. Fontos, hogy egy adattó hatalmas mennyiségű nyers adatot tárol natív – vagy eredeti – formátumban. Ez a formátum lehet strukturált, strukturálatlan vagy félig strukturált. Az adattavak, különösen a felhőben lévők, alacsony költségűek, könnyen méretezhetők, és gyakran használatosak az alkalmazott gépi tanulási elemzésekkel.
Adattó kontra adattárház
Az adattóhoz képest az adattárház adatkezelési funkciókat biztosít, és előre meghatározott üzleti kérdésekre vagy használati esetekre már feldolgozott és szűrt adatokat tárol.
Adattárház diagramja egy adattóhoz viszonyítva.
Az adattárházak és tavak gyakran kiegészítik egymást. Például, ha egy adattóban tárolt nyers adatokra van szükség egy üzleti kérdés megválaszolásához, akkor ki lehet nyerni, meg lehet tisztítani, átalakítani és fel lehet használni egy adattárházban további elemzésre.
Az „adattó” egy új és fejlődő koncepció, amely egy hagyományos adattó mellett ad hozzá adatkezelési képességeket. Lényegében ez egy adattó és egy adattárház kombinációja.
Az adatok típusa és a fent említett folyamat különbségei mellett néhány részlet az adattó és egy adattárház-megoldás összehasonlítására szolgál.
Végső soron az adatok mennyisége, az adatbázis teljesítménye és a tárolás árazása fontos szerepet játszik a megfelelő tárolási megoldás kiválasztásában.
A data lake megoldás kulcsfontosságú elemei
Adatmozgás: Az adattavak lehetővé teszik bármely adattípus importálását több forrásból annak natív formátumában. Ez lehetővé teszi a vállalkozások számára, hogy szükség szerint méretezzék az adatok méretét anélkül, hogy adatstruktúrákat, sémákat és átalakításokat kellene meghatározniuk, ami általánosköltség-megtakarítást eredményezhet.
Biztonságos tárolás és katalógusadatok: Az adattó strukturált, félig strukturált és strukturálatlan adatokat tárol különböző forrásokból, például CRM-ből vagy ERP-szoftverből, IoT-eszközökből, közösségi médiából származó üzleti adatokból, vagy akár régi rendszerekből származó történeti adatokat. Az adattavak lehetővé teszik a kötegelt és streamelt adatok rögzítését az irányítás, a biztonság és a vezérlés alkalmazása közben. Az adatok lekérdezhetők közvetlenül vagy egy adattárházba a megfelelő eszközökkel.
Elemzések és gépi tanulás: Az adattavak szerepalapú hozzáférést biztosítanak az információkhoz az elemzések és a gépi tanulás elemzésének futtatásához anélkül, hogy az adatokat külön elemzési adatbázisba kellene áthelyezni. Az adattavak lehetővé teszik a történeti adatok valós idejű adatokkal való kombinálását a gépi tanulási vagy prediktív elemzési modellek finomítása érdekében, hogy jobb és/vagy új eredményeket biztosítsanak.
Hogyan működnek az adattavak
Egy modern adattó három fő jellemzővel rendelkezik:
- Egy leszállási zóna a nyers adatokhoz
- Rendelkezésre bocsátási zóna, ahol az adatok átalakítására elemzési céllal kerül sor
- Adatböngészési zóna, ahol az analitikák, alkalmazások és gépi tanulási modellek töltik fel az adatokat
Az adattóból különféle forrásokból – például elemzésekből vagy más üzleti alkalmazásokból – vagy további elemzésre szolgáló gépi tanulási eszközökbe jut az információ.
Adattó használati eset
Íme két példa az adattóhasználati esetre a kiskereskedelemben.
A hosszú távú értékesítési adatok egy adattóban kerülnek tárolásra olyan strukturálatlan adatok mellett, mint a weboldal clickstream adatai, az időjárás, a hírek és a mikro-/makrogazdasági adatok. Ezen adatok együttes tárolása és hozzáférhetősége megkönnyíti az adattudós számára, hogy ezeket a különböző információforrásokat olyan modellben egyesítse, amely előre jelzi egy adott termék vagy termékcsoport iránti keresletet. Ezt az információt azután a kiskereskedelmi ERP-rendszer bemeneteiként használják a termelési tervek növeléséhez vagy csökkentéséhez.
Ezzel párhuzamosan egy marketingszakértő hozzáférhet ugyanehhez az adattóhoz, és megnézheti a weboldal és a közösségi média hír-, makrogazdasági és értékesítéstörténeti adatokkal kapcsolatos hangulatelemzését, hogy meghatározza, mely termékekre összpontosítson, és hogyan maximalizálhatja az értékesítést, a profitot és/vagy az alkalmazást.
Az adattavak típusai
Az adattavak a helyszínen, a felhőben, a kettő hibridjében, valamint több felhőalapú hiperskálázón, például az Amazon Web Services (AWS), a Microsoft Azure vagy a Google Cloud keresztül tartózkodhatnak.
Messze a legnépszerűbb adattó a felhőalapú adattó. A felhőalapú adattó biztosítja az összes szokásos adattó funkciót, de egy teljesen felügyelt felhőszolgáltatásban.
Helyszíni adattó: A helyszíni adattóval házon belüli informatikai mérnöki erőforrások kezelik a hardvereket, szoftvereket és folyamatokat. Ez a megközelítés magasabb tőkekiadási (CAPEX) kötelezettségvállalással rendelkezik, és az adatok általában elhallgattatnak.
Felhőalapú adattó: A felhőalapú adattóban az on-premise infrastruktúra kiszervezésre kerül. Magasabb operatív kiadási kötelezettségvállalás (OPEX) létezik, de ez a kiépítési megközelítés lehetővé teszi a vállalkozások számára, hogy több más előnnyel együtt nagyobb méreteket érjenek el (lásd alább).
Hibrid adattó: Egyes esetekben egyes vállalatok úgy döntenek, hogy egyszerre tartják karban az on-premise és a felhő adattavakat. Ez a helyzet meglehetősen ritka, és többnyire az on-premise rendszerből a felhőbe történő migráció során tapasztalható.
Többfelhős adattó: Egy többfelhős adattónál két vagy több felhő ajánlat kombinálódik; például egy vállalat az AWS és az Azure segítségével is kezelheti és karbantarthatja a felhőbeli adattavakat. Ehhez nagyobb szakértelemre van szükség ahhoz, hogy ezek az eltérő platformok egymással kommunikáljanak.
A felhőalapú adattó hat legfontosabb előnye
Miért válasszon felhőbeli adattavat? Az adatok nagy értékű üzleti eszközzé alakítása elősegíti a digitális átalakulást. Ezt az alapot a felhő erősségei és az adattó kombinációja adja. A felhőalapú adattó lehetővé teszi a vállalatok számára, hogy elemzéseket alkalmazzanak a történeti adatokra és az új adatforrásokra, például naplófájlokra, clickstreamekre, közösségi médiára, internetkapcsolattal rendelkező eszközökre stb., a végrehajtható elemzések érdekében.
Íme néhány a legfontosabb előnyök, amelyeket elvárhat:
- Költséghatékonyság: A felhőtárhely szolgáltatók számos tárolási és árképzési lehetőséget kínálnak.
- Automatikus méretezés: A felhőszolgáltatásokat úgy tervezték, hogy skálázási funkciókat biztosítsanak, lehetővé téve a vállalkozások számára, hogy igény szerint kiszámítsák és kihasználják a tárolási kapacitást.
- Központi adattár: A felhőalapú adattó egyesíti az információkat, és egyetlen adatforrásként szolgál, irányított adathozzáféréssel, amely lehetővé teszi a csapatok folyamatainak hatékonyságát.
- Adatbiztonság: A felhőalapú tárhelyszolgáltatók egy megosztott felelősségi modellen keresztül garantálják az adatok biztonságát.
- Eszközök: A felhőtárhely-szolgáltatók és más szállítók ETL eszközöket biztosítanak az adatok feltérképezésére, adatkatalógus összeállítására, valamint adatok előkészítésére, adatátalakításra és adatbetöltésre az adatok lekérdezhetőségének lehetővé tétele érdekében.
- Továbbfejlesztett elemzések az új elemzésekhez és jobb üzleti eredményekhez: A felhőalapú adattó új módokon kombinálhatja az adatokat. Például a CRM-adatok és a közösségimédia-elemzések új ügyfélbetekintést nyújthatnak az elvándorlás okába, vagy megmutathatják, hogy mely promóciók növelik a hűséget. A működési hatékonyság az IoT-adatok elemzésével is javítható.
Data lake gyakran feltett kérdések
Fedezze fel az alábbi adattavakkal kapcsolatos GYIK-jeinket, és tekintse át az adatkezelési szójegyzékünket, hogy még több meghatározást kapjunk.
Első lépések a data lake megoldásokkal
Fedezze fel az adattó lehetőségeit az SAP HANA Cloudon belül.
Ötletek, amiket sehol máshol nem találsz
Iratkozzon fel egy adag üzleti intelligenciára, amelyet közvetlenül postafiókjába szállít.