flex-height
text-black

Sunucu odasında dolaşan adam

Veri gölü nedir?

Veri gölü, veri silosu sorunlarını ele almaya yardımcı olan merkezi veri havuzudur.

default

{}

default

{}

primary

default

{}

secondary

Veri gölü nedir: tanım ve amaç

Veri gölü, yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış verileri yerel biçimlerinde depolayan merkezi bir havuzdur. Verilerin saklanmadan önce düzenlenmesi gereken diğer depolama sistemlerinin aksine (örneğin, veri ambarları), bir veri gölü ham verileri olduğu gibi kabul eder ve gelişmiş analitik, yapay zeka (AI) ve makine öğrenmesi (ML) kullanım durumları için gerekli olana kadar orijinal yapısını ve biçimini korur.

Veri gölünün temel amacı , veri silolarını ayırmak ve organizasyonun veri varlıkları için tek bir kaynak oluşturmaktır. Birden fazla kaynaktan gelen verileri tek ve erişilebilir bir konuma konsolide etmeyi içerir: veri bilimciler, analistler ve makine öğrenmesi mühendislerinin hepsi farklı sistemlerde sıkışmış kalabilecek bilgilerle ilgili olarak keşfedebilir, deneyebilir ve veri çekebilir. Bir veri gölünde depolanabilecek veri kaynaklarına örnek olarak şunlar verilebilir:

Veri gölünün amacı, her türden veriyi depolamak ve analiz etmek için esnek ve ölçeklenebilir bir çözüm sunmaktır. Bu, şema okuma yaklaşımıyla (vs. şema, veri ambarlarında kullanıldığı gibi).

Şema okuma ne anlama geliyor?

Şema okuma, verilerin yapısı ve anlamının (şemanın) depolandığı zamandan ziyade erişildiğinde uygulandığı anlamına gelir. Bu, esnekliği koruyarak organizasyonların gelecekte nasıl kullanılacağını tam olarak bilmeden veri depolamasına olanak sağlar. Bu nedenle veri gölleri keşfedici analitikler, veri madenciliği, öğrenen makineler ve verilerdeki beklenmeyen örnekleri keşfetmek için idealdir.

Data lake mimarisi ve bileşenleri

Data lake mimarisi çok katmanlıdır ve verileri son kullanıcılara ve uygulamalara dahil etmek, depolamak, işlemek ve sunmak için birlikte çalışan birkaç temel bileşenden oluşur. Veri gölünün bu temel bileşenleri şunlardır:

Depolama katmanı

Depolama katmanı, genellikle büyük veri hacimleri için uygun maliyetli, ölçeklenebilir depolama sağlayan nesne depolama sistemleri üzerine kurulmuş bir veri gölü mimarisinin temelidir. Bu katman, verilerin CSV dosyaları, JSON belgeleri, Parquet dosyaları, resimler, videolar veya başka bir biçimde olması fark etmeksizin yerel biçiminde tutar.

Veri alımı

Veri alımı katmanı, çeşitli kaynaklardan göle veri getirme sürecini işler. Buna dönemsel veri yüklemeleri için toplu alım ve gerçek zamanlı veri akışları için akış alımı dahildir. Veri alımı araçları, veri bütünlüğünü sağlarken ve veri kaynağını izlerken çeşitli veri türlerini ve kaynaklarını işlemelidir.

Veri kataloğu ve meta veri yönetimi

Kataloglama ve meta veri yönetimi bileşeni; konumu, anlamı ve diğer verilerle ilişkileri dahil olmak üzere gölde mevcut olan verilere ilişkin organize bir envanter sağlar. Bunu bir kütüphane veya arşiv katalog yöneticisi gibi düşünün. Güçlü bir veri kataloğu, kullanıcıların havuzun tamamına manüel olarak göz atmaları gerekmeden ilgili veri kümelerini keşfetmesine olanak sağlayan, aranabilir bir dizin görevi görür.

İşleme katmanı

İşleme katmanı; veri dönüştürme, temizleme, zenginleştirme ve analiz işlemlerini etkinleştirir. Bu katman toplu işleme, akış işleme ve etkileşimli sorgular için motorlar içerir ve kullanıcıların belirli kullanım durumları için hazırlanmasına veya ad-hoc analizi gerçekleştirmesine olanak sağlar.

Erişim katmanı

Erişim katmanı, farklı kullanıcı türleri için arayüzler ve araçlar sağlar: veri bilimciler, dizüstü bilgisayar kullanan veri bilimciler, SQL sorguları çalıştıran analistler veya API'ler aracılığıyla veri kullanan uygulamalar. Bu katman ayrıca güvenlik politikalarını zorlar, kimlerin hangi verilere ve hangi şartlarda erişebileceğini yönetir.

Veri gölleri türleri: bulut, şirket içi, hibrit, çoklu bulut

Kuruluşun bunları dağıttığı konfigürasyona bağlı olarak farklı veri gölleri türleri vardır. Her konfigürasyon belirli avantajlar ve takaslar sunar.

Bulut veri gölleri

Bulut veri gölleri tamamen bulut platformlarında barındırılır. Neredeyse sınırsız ölçeklenebilirlik, kullandıkça öde fiyatlandırması ve bulut tabanlı analitikler ve yapay zeka hizmetleriyle kolay entegrasyon sunabilirler. Bulut veri gölleri, önceden altyapı yatırımı ihtiyacını ortadan kaldırarak kuruluşların depolama ve kaynakları bağımsız olarak hesaplamasına olanak sağlar. Özellikle büyüyen organizasyonlar ve operasyonel yükü azaltmak isteyenler için oldukça uygundur ve son teknoloji analitik özelliklerine erişimi korurlar.

Şirket içi veri gölleri

Şirket içi veri gölleri, bir kuruluşun kendi veri merkezlerinde dağıtılır ve altyapı, güvenlik ve veri egemenliği üzerinde tam kontrol sağlar. Bazen çok özel düzenleme ve güvenlik gereksinimlerine sahip organizasyonlar tarafından kullanılsa da şirket içi veri gölleri, herhangi bir dönüşüm projesi için önemli sermaye yatırımları, sürekli bakım ve önemli ölçüde çaba gerektirme eğilimindedir. Genellikle bir takastır: Kontrolün granülaritesini artırmak, ölçeklenebilirlik ve maliyet verimliliği pahasına gelir.

Hibrit veri gölleri

Hibrit veri gölleri, bulut ve şirket içi depolamayı birleştirerek organizasyonların ölçeklenebilirlik ve gelişmiş analitikler için bulut kaynaklarını kullanmaya devam ederken şirket içi bazı verileri tutmasına olanak sağlar. Bu yaklaşım esneklik sunmakla birlikte veri senkronizasyonu, yönetişim ve ortamlar arasında tutarlı bir deneyim yönetme konusunda karmaşıklığı ortaya koyar.

Çok bulutlu veri gölleri

Çoklu bulut veri gölleri birden fazla bulut sağlayıcısına yayılarak kuruluşların satıcı kilitlenmesinden kaçınmasına, her sağlayıcının en iyi hizmetlerini kullanarak maliyetleri optimize etmesine ve fazlalıkla iş sürekliliğini sağlamasına yardımcı olur. Bununla birlikte, çoklu bulut mimarileri, veri birlikte çalışabilirliği, tutarlı güvenlik politikaları ve bulut sağlayıcıları arasında veri aktarımı maliyetlerini yönetme konusunda dikkatli planlama gerektirir. Ayrıca değişikliklerin veya yeniliklerin tanıtımını daha karmaşık bir sürece dönüştürebilirler.

Veri gölü ve veri ambarı karşılaştırması

Bu veri depolama yaklaşımları arasındaki farkları anlamak, kuruluşunuzun hedefleri için doğru çözümleri seçmek için gereklidir. Veri göllerini, veri ambarlarını ve veri göllerini bazı temel ölçütlerde karşılaştıralım:

Özellik
Veri gölü
Veri Ambarı
Veri merkezi
Şema
Şema okundu
Yazma sırasında şema
İsteğe bağlı yapı ile esnek
Veri türleri
Yapılandırılmış, yarı yapılandırılmış, yapılandırılmamış
Öncelikli olarak yapılandırılmış (ara sıra, yarı yapılandırılmış)
Tablo yönetimli tüm türler
Tipik depo masrafları
Düşük depolama maliyeti
Daha yüksek depolama maliyeti
Orta maliyet
Birincil kullanıcılar
Veri bilimciler ve mühendisler, ML mühendisleri, analistler
İş analistleri, yöneticiler, veri bilimciler
Tüm kullanıcı türleri
Kullanım senaryoları
Keşif, ML, gelişmiş analitik, yapay zeka, ileri işlemeye kadar ölçeklenebilir depolama
Sorgular ve özel algoritmalar için optimize edilmiştir
Birleştirilmiş analitikler ve raporlama
Performans
İşleme motoruna bağlı değişken
Sorgular için optimize edildi
Yerleşik yönetim ile yüksek performans
Veri kalitesi
Çeşitli kalite ham verileri
Temizlenen ve doğrulanan veriler
Kaliteyi biraz esneklikle zorlayın

Uygulamada neye benziyor?

Veri gölleri, büyük hacimli ham verileri ekonomik olarak depolamada ve keşifçi analitikleri ve öğrenen makineleri destekler. Çeşitli veri türleriyle çalışmak için esnekliğe ihtiyacınız olduğunda ve verilerin nasıl kullanılacağını önceden bilmediklerinde idealdir. Daha sonra veri depolarına çekilen verileri de depolayabilirler.

Veri depoları, sorgu performansı için optimize edilmiş yapılandırılmış şemalarla iş zekası ve raporlama için amaç doğrultusunda oluşturulur. Bunlar, veri kalitesi ve tutarlılığının kısmi olduğu (örneğin , tahmine dayalı analitiklerde kullanılmak üzere), iyi tanımlanmış raporlama ve modelleme ihtiyaçları için en uygundur. Uygulamada veri göllerinde biriken veriler, veri boru hatlarının nasıl yapılandırıldığına bağlı olarak işlenebilir ve akışlanabilir ya da düzenli olarak veri depolarına çekilebilir.

Veri gölleri, veri göllerinin esnekliğini veri depolarının yönetim özellikleri ve performansı ile birleştiren daha yeni bir mimariyi temsil eder. Organizasyonların aynı platformda hem keşfedici analitikleri hem de iş raporlamasını çalıştırarak veri çoğaltmasını ve karmaşıklığı azaltmasını sağlarlar.

Veri göllerinin avantajları

Veri göllerinin avantajları, onları organizasyonlar için ikna edici bir seçim ve modern veri mimarisinin temel taşıdır. Veri gölü mimarisinin avantajları şunlardır:

Esneklik: Veri gölleri herhangi bir veri türünü herhangi bir biçimde kabul ederek verileri depolama öncesinde dönüştürme ihtiyacını ortadan kaldırır veya bazı veriler eksik kalır. Bu, kapsamlı ön planlama veya nasıl kullanacağınızı bilmenize gerek kalmadan verileri hemen toplamaya başlayabileceğiniz anlamına gelir. Şema okuma yaklaşımı, farklı ekiplerin aynı verileri çeşitli şekillerde kullanmasına ve yorumlamasına olanak sağlayarak inovasyonu ve keşfi teşvik eder.

Ölçeklenebilirlik: Veri gölleriyle, özellikle bulut tabanlı uygulamalarla, mimari değişiklikler veya göçler gerektirmeden gigabaytlardan petabaytlara kadar depolama büyüyebilir. Kurumlar veri ihtiyaçları büyüdükçe küçük başlayabilir ve genişleyebilirler.

Maliyet verimliliği: Veri göllerinin depolama avantajlarından biri, tipik olarak aynı depolama miktarı için geleneksel veri depolarından önemli ölçüde daha düşük maliyetli olmalarıdır, bu da geçmiş verileri tutmak ve bütçe kısıtlamalarını aşmadan yeni veri kaynaklarını keşfetmeyi ekonomik olarak mümkün kılar.

Gelişmiş analitik desteği: Veri gölleri veri bilimcilerinin ve makine öğrenmesi mühendislerinin model oluşturma ve eğitim, veri madenciliği ve diğer gelişmiş görevler için ham verilere erişmesine olanak sağlar. Depolarda işlenen verilerin aksine ham veri alımı, doğru tahminler ve öngörüler için kritik öneme sahip olduğunu kanıtlayabilecek nüansları ve ayrıntıları korur. Veri gölleri, akış verilerini alarak kuruluşların yeni bilgiler üzerinde hareket etmesine olanak sağlayarak gerçek zamanlı analitikleri de destekler.

Veri demokratikleşmesi: Veri gölü mimarisinin bir diğer avantajı, tüm organizasyonel veriler tek ve erişilebilir bir konumda depolandığında, kurum genelinde daha fazla kişinin verileri keşfedebilmesi ve kullanabilmesi, siloları parçalaması ve her düzeyde veri odaklı karar alma sürecini teşvik etmesidir.

Ortak veri gölü zorlukları

Veri gölleri müthiş faydalar sunarken, aynı zamanda organizasyonların potansiyellerini tam olarak gerçekleştirmek için ele almaları gereken zorlukları da ortaya koyuyor. Yaygın veri gölü zorlukları arasında şunlar yer alır:

Karmaşık veri gölü yönetimi

Çok miktarda çeşitli veriler depolanırken veri yönetişimi daha karmaşık hale gelir. Uygun yönetim çerçeveleri olmadan veri gölleri "data swamps" -herhangi bir organizasyon olmadan verilerin döküldüğü depolara dönüşebilir, bu da bulmayı, anlamayı veya güvenmeyi zorlaştırabilir. Açık sahiplik kurmak, veri kaynağını belgelemek ve meta verileri yönetmek esastır ancak sürekli çaba ve disiplin gerektirir.

Veri güvenliği kaygıları

Güvenlik ve erişim kontrolü dikkatli bir şekilde dikkat gerektirir. Veri gölleri, organizasyon genelindeki hassas bilgiler içerir ve denetim izlerini korurken sağlam güvenlik ilkeleri ve araçları talep ederken yalnızca yetkili kullanıcıların belirli veri kümelerine erişebilmesini sağlar. Şifreleme, kimlik doğrulama, ayrıntılı erişim denetimleri ve veri maskeleme, veri gölü ortamlarının güvenliğini sağlamada ve veri gölü yönetimi sorunlarından kaçınmada önemli roller oynar.

Verinin kalitesi değişmedi

Veri göllerinde veri kalitesi otomatik olarak sağlanmaz. Ham veriler olduğu gibi saklandığından hatalar, çift kayıtlar veya tutarsızlıklar içerebilir. Organizasyonlar, analitikler için kullanılmadan önce bu verileri doğrulamak, temizlemek ve zenginleştirmek için süreçlere ihtiyaç duyar. Veri kalitesine dikkat etmeden, analitik ve göl verileri üzerine kurulu ML modelleri güvenilmez sonuçlar verebilir.

Veri gölü yönetimi sorunları

Karmaşıklık ve uzmanlık gereksinimleri hafife alınmamalıdır. Veri gölünü etkili bir şekilde yönetmek için dağıtılmış sistemlerde, veri mühendisliğinde, meta veri yönetiminde ve çeşitli işleme çerçevelerinde beceriler gerekir. Kuruluşların veri gölü altyapısını oluşturmak ve sürdürmek için eğitime yatırım yapması, özel yetenekleri işe alması veya uzman bir hizmet sağlayıcıyla iş birliği yapması gerekebilir.

Uzun sorgu zamanları

Performans optimizasyonu, özellikle büyük veri kümelerindeki etkileşimli sorgular için aldatıcı olabilir. Önceden optimize edilmiş şemalara sahip depoların aksine, veri gölleri kabul edilebilir sorgu performansı elde etmek için düşünsel veri organizasyonu, bölümleme stratejileri ve dosya biçimi seçimi gerektirir. Basitçe belirtmek gerekirse, veri gölleri akıl almaz derecede geniş hacimli veriler içerebilir, böylece ihtiyacınız olan şeyi bulmak zaman alabilir.

Veri gölleri örnekleri ve pratik kullanım örnekleri

Veri gölü kullanımının gerçek dünya örnekleri, organizasyonların iş zorluklarını ele almak ve rekabet avantajı elde etmek için veri göllerini nasıl kullandığını göstermektedir. Ortak veri gölü kullanım durumlarından birkaçını analiz ederek kıralım.

Veri gölleri kullanım senaryosu: Öngörülü bakım için IoT analitiği

Bir üretim şirketi, her gün terabayt zaman serisi verileri üreterek birden fazla tesiste binlerce makineden sensör verisi toplar. Bu veriler bir veri gölüne aktarılarak bakım kayıtları, üretim çizelgeleri ve tedarikçi bilgileri ile birleştirilir. Makine öğrenmesi modelleri, ekipman arızalarını ortaya çıkmadan önce tahmin etmek için geçmiş örnekleri analiz ederek kesinti süresini azaltır ve onarım masraflarında milyonlarca tasarruf sağlar. Veri gölünün, birden fazla kaynaktan yüksek hızlı akış verilerini işleyebilmesi bu kullanım durumunu sağlar.

Veri gölleri kullanım durumu: Kişiselleştirilmiş pazarlama için müşteri 360

Bir perakende kuruluşu; çevrimiçi tarama davranışı, satın alma geçmişi, mobil uygulama etkileşimleri, müşteri hizmeti çağrıları ve sohbetleri, sosyal medya etkileşimi ve mağaza ziyaretlerindeki müşteri verilerini bir veri gölünde konsolide eder. Her bir müşterinin bu kapsamlı görünümünü analiz ederek ayrıntılı segmentler oluşturabilir ve pazarlama kampanyaları, ürün önerileri ve müşteri deneyimlerini kişiselleştirebilir. Bu, kampanya etkinliğini artırabilir ve müşteri memnuniyetini önemli ölçüde artırabilir. Bu veri gölü örneğinde, hem yapılandırılmış işlem verilerini hem de yapılandırılmamış etkileşim günlüklerini depolamaya yönelik esneklik ve kapasite bu bütünsel müşteri görünümünü etkinleştirir.

Veri gölleri kullanım durumu: Finansal hizmetler risk modellemesi

Bir finansal kuruluş; ticaret verilerini, pazar akışlarını, haber makalelerini, sosyal medya duygularını ve düzenleyici dosyaları toplamak için veri gölü kullanır. Veri bilimciler hem geleneksel finansal metrikleri hem de ek veri kaynaklarını dikkate alan gelişmiş risk modelleri kurar. Gölün şema okuma yaklaşımı, mevcut sistemleri bozmadan çeşitli veri kaynaklarını ve modelleme tekniklerini keşfetmelerine olanak sağlayarak daha doğru risk değerlendirmeleri elde etmelerine yardımcı olur.

Veri gölü en iyi uygulamaları

Veri gölleri için aşağıdaki en iyi uygulamaları uygulamak, kuruluşların ortak tehlikelerden kaçınırken veri göllerinin değerini en üst düzeye çıkarmasına yardımcı olabilir:

  1. Meta veri yönetimini ilk günden önceliklendirin. Hangi verilerin mevcut olduğunu, nereden geldiğini, ne anlama geldiğini ve diğer veri kümeleriyle nasıl ilişkili olduğunu belgeleyen kapsamlı bir veri kataloğu oluşturun. İyi meta veriler, veri gölünü ezici bir veri dökümünden ziyade aranabilir, anlaşılabilir bir kaynağa dönüştürür; bu, veri gölü yönetiminin temel bir parçasıdır.
  2. Veri gölü yönetimini sağlayın. Veri sahipliğini tanımlayan, kalite standartları belirleyen ve veri alımı, sınıflandırma ve yaşam döngüsü yönetimi için net süreçler oluşturan güçlü veri yönetişimi çerçeveleri uygulayın. Yönetişim, sonradan düşünülen bir düşünce olmamalıdır. Verilerinize olan güvenin korunmasına ve düzenleyici gereksinimlere uyulmasına yardımcı olmak için en başından itibaren veri gölü mimarinizi oluşturun.
  3. Verilerinizi koruyun. İstenmeyen ve aktarımda şifreleme, ayrıntılı erişim denetimleri, denetim günlüğü çıkarma ve gerektiğinde veri maskeleme uygulayarak güvenlik ve uyumluluk için tasarım. Erişim modellerini ve izinleri, en az ayrıcalık ilkesiyle uyumlu hale getirdiklerinden emin olmak için düzenli olarak gözden geçirin.
  4. Performansı optimize edin. Verileri mantıksal olarak (tarihe, bölgeye veya diğer ilgili boyutlara göre) bölümleyerek, analitik iş yükleri için verimli dosya biçimleri seçerek ve kullanım dışı verileri arşivlemek veya silmek için yaşam döngüsü ilkelerini uygulayarak depolamayı optimum şekilde organize edin. Bu seçimler hem maliyeti hem de sorgu performansını önemli ölçüde etkiler.
  5. Veriye dayalı bir kültürü teşvik edin. Self servis analitiği mümkün kılan eğitim ve araçlar sağlarken verileri keşfedilebilir ve erişilebilir hale getirin. Ekibinizin doğru uzmanlığı yoksa iş paydaşları ile teknoloji arasındaki boşluğu kapatabilecek ve optimum veri gölü yönetimi sağlayabilecek ek yetenekleri işe almayı değerlendirin. Teknik altyapı ancak insanların daha iyi kararlar almak için gerçekten kullanmaları durumunda değerlidir.

Veri göllerinin geleceği

Veri göllerinin evrimi, organizasyonların hem esneklik hem de yönetim talep etmesiyle devam eder ve göllerin ve depoların en iyi yönlerini birleştiren veri gölleri mimarilerinin ortaya çıkmasına yol açar. Bu yakınsama, kuruluşların farklı amaçlar için ayrı sistemleri korumak yerine, çeşitli yaklaşımları destekleyen birleşik platformlara ihtiyaç duydukları büyüyen bir anlayışı yansıtır.

Yapay zeka ve makine öğrenmesi, veri gölü stratejilerinin giderek daha merkezi hale geliyor. Modern veri gölleri sadece depolama repository'leri değildir; yapay zekâ modellerinin tarihsel veriler üzerinde eğittiği, akış verilerini kullanarak tahminler yaptığı ve geri bildirim döngüleri aracılığıyla sürekli iyileştirdiği merkezi platformlardır. Yapay zeka platformları ve otomatik ML özellikleri ile entegrasyon istisnadan ziyade standart haline geliyor.

Kurumlar yeni veriler üzerinde hareket etmenin değerini fark ettikçe gerçek zamanlı ve akış analitikleri öne çıkmaya devam ediyor. Sonuç olarak veri gölleri, saniyenin altında veri işlemeyi ve sorgulamayı destekleyecek şekilde gelişiyor ve tarihsel analiz ile gerçek zamanlı işlemler arasındaki çizgiyi bulanıklaştırıyor.

Son olarak, veri gizliliği düzenlemeleri tüm dünyada genişledikçe ve değiştikçe, veri gölleri otomatik veri sınıflandırması, izin yönetimi ve sonradan eklenmek yerine platformda yerleşik basitleştirilmiş uyumluluk raporlaması gibi özelliklerle veri gizliliğini ve korumasını tasarımla destekleyecek şekilde değişmelidir.

Veri göllerinin geleceği esneklik, erişilebilirlik ve otomasyonda yatar: kuruluşların artan veri hacimlerini yönetmesini ve güvenliği, kaliteyi ve yönetişimi sürdürmesini kolaylaştıran özellikler. Veri gölleri, devam eden yatırım ve dikkat gerektiren stratejik bir varlık olarak değerlendirilmelidir.

SSS

Neden quot;data lake"?
"data lake&quot terimi; doğal bir metafor kullanır - birçok akış tek bir göle aktıkça birden fazla kaynaktan gelen veriler merkezi bir havuza akar. Suyu filtrelenip arıtılmak yerine orijinal durumunda depolayan doğal bir göl gibi, veri gölü de verileri dönüşüm veya yapı gerektirmeden yerel biçiminde depolar. Metafor, gölün “doğal” durumunda büyük hacimli çeşitli verileri tutma ve çeşitli amaçlar için çizilme yeteneğini vurgular, tıpkı bir gölden gelen su birçok kullanıma hizmet eder. Karşılaştırıldığında, bir depoda filtrelenmiş, şişelenmiş ve etiketlenmiş, muhtemelen şişe büyüklüğü veya pH dengesine göre düzenlenmiş su bulunurdu.
Veri ambarı nedir ve veri gölünden nasıl farklıdır?
Veri ambarı yapılandırılmış bir havuzdur ancak veri gölü, yapılandırılmış veya yapılandırılmamış olsun tüm veri türlerinin alınmasına ve saklanmasına olanak sağlayan bir depolama yaklaşımıdır. Veri gölleri ve veri ambarları arasındaki temel fark onların yaklaşımındadır: veri ambarlarında şema yazma (depolamadan önce veriler yapılandırılmalıdır) kullanılırken, veri gölleri okuma sırasında şema kullanır (verilere erişildiğinde yapı uygulanır). Depolar bilinen raporlama ihtiyaçları ve sorguları için optimize edilirken göller ham verilerle ilgili keşif analizini ve makine öğrenmesini destekler. Belirli iş sorularını hızlı bir şekilde yanıtlamak için depoları uzman olarak düşünün, göller ise esneklik, kapasite ve sorulacak yeni sorular keşfetmek için inşa edilir.
Veri gölünde veri yönetimi nedir?
Veri gölündeki veri yönetimi birçok kritik aktiviteyi kapsar. Katalog oluşturma ve meta veri yönetimi, kullanıcıların kullanılabilir veri kümelerini bulup anlayabilmesini sağlar. Yönetişim; veri sahipliği, kalite standartları ve erişim denetimleri için politikalar oluşturur. Erişim yönetimi ve kaynak izleme, kimin hangi verilere ve bunların nasıl dönüştürüldüğünü veya kullanıldığını gösterir. Yaşam döngüsü ve saklama politikaları, verilerin ne kadar süre saklanacağını ve ne zaman arşivlenmesi veya silinmesi gerektiğini belirler. Etkili veri gölü yönetimi, veri göllerinin düzensiz hale gelmesini önler; veri bataklıkları ve sorgulama; ve veri gölü yönetimi sorunlarını azaltır.
Veri evi nedir?
Data lakehouse, veri göllerinin esnekliğini ve maliyet etkinliğini veri depolarının yapısı ve performansı ile birleştiren modern bir mimaridir. Laklaklar, kuruluşların ham verileri yerel biçiminde (göl gibi) saklarken tablo benzeri yapıları, şema uygulamasını ve optimize edilmiş sorgu performansını (depo gibi) de desteklemesine olanak sağlar. Bu birleşik yaklaşım, ayrı göl ve depo sistemleri arasında veri çoğaltma ihtiyacını ortadan kaldırır, mimariyi basitleştirir ve aynı platformda hem keşfedici analitikleri hem de iş raporlamasını desteklerken maliyetleri azaltır.
Veri gölleri için çoklu bulut nedir?
Çoklu bulut veri gölü iki veya daha fazla bulut sağlayıcısını kapsar. Kuruluşlar, satıcı kilitlenmesinden kaçınmak, her sağlayıcının en iyi hizmetlerinden yararlanarak maliyetleri optimize etmek, fazlalıkla iş sürekliliğini sağlamak ve farklı bölgelerdeki veri ikamet gereksinimlerini karşılamak için çoklu bulut stratejilerini benimser. Bununla birlikte, çoklu bulut mimarileri, verilerle birlikte çalışabilirlik, tutarlı güvenlik politikaları sağlama ve bulutlar arasında veri aktarımı maliyetlerini yönetme konusunda zorluklar sunar.
Veri gölünde nesne depolama nedir?
Nesne depolama, bir veri gölünde verileri tutan temel depolama katmanıdır. Verileri hiyerarşik klasörlerde düzenleyen dosya sistemlerinin aksine nesne depolama, verileri her biri benzersiz tanıtıcılara, meta verilere ve verilerin kendisine sahip münferit nesneler olarak depolar. Nesne depolama, yüksek oranda ölçeklenebilir ve uygun maliyetli olup büyük hacimli verilerin yerel biçimlerde saklanması için idealdir.