flex-height
text-black
מילון מונחים של ניהול נתונים
חקור טווח של הגדרות ומונחים הקשורים לנתונים במילון המונחים של ניהול הנתונים שלנו.
מהו בסיס נתונים?
בסיס נתונים הוא מתקן לארגון, אחסון, ניהול, הגנה ובקרה של גישה לנתונים. בסיסי נתונים מתוכננים על פי מספר סכמות (סכימה) שונות, אשר רבות מהן פוגעות במודל היחסי לנוחות הגישה על ידי תוכניות ושאילתות נתונים. סוגים נפוצים של בסיסי נתונים כוללים מערכות לניהול בסיסי נתונים יחסיים (RDBMS), בסיסי נתונים בזיכרון פנימי, בסיסי נתונים מונחי-עצמים (OODBMS), בסיסי נתונים של NoSQL ובסיסי נתונים של NewSQL - כל אחד עם יתרונות משלהם.
מהו ניהול נתונים?
ניהול נתונים מתייחס לכל הפונקציות הנחוצות לאיסוף, בקרה, הגנה, טיפול ואספקה של נתונים. מערכות ניהול נתונים כוללות בסיסי נתונים, מחסני נתונים ומשווקי נתונים; כלים לאיסוף נתונים, אחסון ואחזור; ותשתיות לסיוע בבדיקת תקינות, איכות ושילוב עם יישומים וכלים אנליטיים. עסקים זקוקים לאסטרטגיית נתונים כדי לבסס אחריות עבור נתונים שמקורם או שהוא אנדמי לתחומי אחריות מסוימים.
מהו ניהול בסיס נתונים?
ניהול בסיסי נתונים מתייחס לתהליכים ולנהלים הנדרשים לאחסון, טיפול, טיפול, טיפול ושמירה על נתונים. בארגונים רבים, האחריות לביסוס ופיקוח על הליכים כאלה היא האחריות העיקרית של מנהל בסיס נתונים (DBA) או עמדה דומה. רוב הארגונים מסתמכים על מערכת ניהול בסיסי נתונים מסחריים (DBMS) ככלי העיקרי לניהול בסיס הנתונים שלהם.
מהי מערכת ניהול בסיס נתונים (DBMS)?
מערכת ניהול בסיסי נתונים (DBMS) היא ערכת כלי התוכנה שמספקת מבנה אחסון ומתקן לניהול נתונים עבור ניהול בסיס נתונים. מערכת ניהול בסיס הנתונים עשויה להיות חלק אינטגרלי ממערכת מורשית לתכנון משאבים ארגוניים (ERP), רכישה נפרדת נדרשת, חלק מתוכנת המערכת (מערכת הפעלה), או מוצר תוכנה בעל רישיון נפרד. ללא קשר למקור, חשוב שיישומים ייבנו או ישולבו לחלוטין עם מערכת ניהול בסיס הנתונים, מכיוון שהם תלויים הדדית עבור פונקציונליות יעילה של שני היישומים ושל מערכת ניהול בסיס הנתונים. מערכת ניהול בסיס הנתונים היא בעצם ערכת כלים לניהול בסיסי נתונים.
מהו בסיס נתונים של SQL?
בסיס נתונים של SQL הוא בסיס נתונים יחסי שמאחסן נתונים בטבלאות ובשורות. פריטי נתונים (שורות) מקושרים על בסיס פריטי נתונים משותפים כדי לאפשר יעילות, להימנע מיתירות ולהקל על אחזור קל וגמיש. השם SQL נגזר משפת שאילתה מובנית, ערכת הכלים ופרוטוקול שאילתות בשפה טבעית שמשתמשים יכולים ללמוד ולהחיל לכל בסיס נתונים תואם עבור אחסון נתונים, טיפול ואחזור.
מהו בסיס נתונים של NoSQL?
בסיסי נתונים של NoSQL פותחו לצורך טיפול בנתונים לא מובנים שבהם SQL לא יכול לתמוך בגלל חוסר במבנה. NoSQL משתמש בטכניקות יצירתיות כדי להתגבר על מגבלה זו כולל סכמות דינמיות וטכניקות עיבוד מקדים שונות. הסוגים הנפוצים ביותר של בסיסי נתונים עבור נתונים לא מובנים הם ערך מפתח, מסמך, עמודה ובסיסי נתונים של גרפים וכוללים לעתים קרובות דברים כמו וידאו, גרפיקה, טקסט חופשי ופלט חיישן גולמי.
מהי מערכת לניהול בסיס נתונים יחסי (RDBMS)?
מערכת לניהול בסיס נתונים יחסי היא מערכת לניהול בסיסי נתונים (DBMS) המבוססת על מודל הנתונים היחסי. התכנים של RDBMS מאוחסנים בטבלאות, המורכבות משורות ועמודות, כאשר כל טבלה מייצגת אובייקט או ישות ספציפיים, בבסיס הנתונים שניתן לקשר לאובייקט אחר. RDBMS מכיל בדרך כלל טבלאות מרובות וכולל פונקציות נוספות המחזקות את הדיוק, העקביות, השלמות והאבטחה של הנתונים, כמו גם ממשק SQL לגישה לנתונים ביחס זה לזה באמצעות שאילתות מורכבות.
מהי מערכת ניהול בסיס נתונים מרכזית?
CDBMS הוא מונח שנטבע על ידי Gartner המתאר בעיקר מודל פריסת ענן עבור RDBMS לעיל.
מהם נתונים מובנים?
נתונים מובנים מעוצבים באופן הכרחי לשורות ועמודות וממופים לשדות מוגדרים מראש. בדרך כלל מאוחסנים בגיליונות אלקטרוניים של Excel או בבסיסי נתונים יחסיים, דוגמאות כוללות תנועות פיננסיות, מידע דמוגרפי ויומני מכונה. עד לאחרונה, נתונים מובנים היו סוג הנתונים הניתן לשימוש היחיד עבור עסקים.
מהם נתונים לא מובנים?
נתונים לא מובנים אינם מאורגנים בשורות ובעמודות - מה שמקשה יותר על אחסון, ניתוח וחיפוש. דוגמאות כוללות נתונים גולמיים של 'אינטרנט של דברים' (IoT), קובצי וידאו ואודיו, הערות במדיה חברתית ותעתיקי מוקד שירות. נתונים לא מובנים מאוחסנים בדרך כלל באגמי נתונים, בסיסי נתונים של NoSQL או מחסני נתונים מודרניים.
מהם נתונים מובנים למחצה?
לנתונים מובנים למחצה יש תכונות ארגוניות מסוימות, כגון תגים סמנטיים או מטה-נתונים, אך הם אינם תואמים לשורות ולעמודות של גיליון אלקטרוני או בסיס נתונים יחסי. דוגמה טובה לנתונים מובנים למחצה היא דואר אלקטרוני - הכולל כמה נתונים מובנים, כמו כתובות השולח והמקבל, אך גם נתונים לא מובנים, כמו ההודעה עצמה.
מהו מיפוי נתונים?
מיפוי נתונים הוא תהליך של התאמת שדות בין מבני נתונים שונים או בסיסי נתונים שונים. זהו שלב הכרחי אם יש לשלב בסיסי נתונים, אם נתונים מועברים ממערכת או מבסיס נתונים אחד לאחר, או אם יש להשתמש במקורות נתונים שונים בתוך יישום יחיד או כלי אנליטי—כפי שקורה לעתים קרובות באחסון נתונים. מיפוי נתונים יזהה מידע ייחודי, מתנגש וכפול כך שניתן יהיה לפתח סט כללים להבאת כל הנתונים לסכמה או לפורמט מתואם.
מהו מידול נתונים?
ביצירת מבנה בסיס נתונים חדש או חלופי, המעצב מתחיל בדיאגרמה של האופן שבו נתונים יזרמו לבסיס הנתונים ומחוץ לו. דיאגרמה של תזרימי הנתונים נקראת עיצוב נתונים. מדיאגרמת זרימה זו, מהנדסי תוכנה יכולים להגדיר את מאפייני הפורמטים, המבנים ופונקציות הטיפול בבסיס הנתונים כדי לתמוך ביעילות בדרישות תזרים הנתונים.
מהו אחסון נתונים?
מחסן נתונים מספק מתקן אחסון מקיף יחיד עבור נתונים ממקורות רבים ושונים - הן פנימיים והן חיצוניים. מטרתו העיקרית היא לספק את הנתונים עבור בינה עסקית (BI), דיווח וכלי ניתוח. מחסני נתונים מודרניים יכולים לאחסן ולנהל את כל סוגי הנתונים, מובנים ולא מובנים, ובדרך כלל נפרסים בענן לצורך יכולת הרחבה וקלות שימוש גדולים יותר.
מהו אגם נתונים?
אגם נתונים הוא מאגר עצום של נתונים המאוחסנים בפורמט הגולמי או הטבעי שלו. אגמי נתונים משמשים בדרך כלל לאחסון Big Data, כולל נתונים מובנים, לא מובנים ומובנים למחצה.
מה זה Big Data?
Big Data הוא מונח המתאר סטי נתונים גדולים במיוחד של נתונים מובנים, לא מובנים ומובנים למחצה. Big Data מאופיין לעיתים קרובות על ידי חמשת ה-Vs: נפח המידע הנאסף, מגוון סוגי הנתונים, המהירות שבה הנתונים נוצרים, אמיתות הנתונים והערך שלהם. באמצעות מערכות ניהול Big Data וכלי ניתוח, חברות יכולות לכרות Big Data לתובנות עמוקות שמדריכות קבלת החלטות ופעולות.
מה זה נתונים קטנים?
בניגוד לביג דאטה, שהוא מנופח ומורכב מאוד, נתונים קטנים הם קלים להבנה של בני אדם. ערכות נתונים קטנות יכולות לכלול כל דבר מסקרי שיווק ועד גיליונות אלקטרוניים יומיומיים - ואף יכולים להיות "קטנים" כפוסט או דואר אלקטרוני יחיד במדיה חברתית. יותר ויותר, חברות משתמשות בנתונים קטנים, בנוסף ל-Big Data, כדי להכשיר את אלגוריתמים של בינה מלאכותית ולמידת מכונה שלהם, לתובנות עמוקות עוד יותר.
מהם נתונים עבים?
נתונים עבים הם מידע איכותי המספק תובנה לגבי חייהם הרגשיים היומיומיים של הצרכנים. היא כוללת תצפיות, רגשות ותגובות - דברים שקשה לכמת בדרך כלל. כאשר משולבים עם ביג דאטה, עולה תמונה מקיפה מאוד על העדפות ודרישות של צרכן.
מהו שילוב נתונים?
שילוב נתונים הוא תרגול קליטה, טרנספורמציה, שילוב ואספקת נתונים, היכן ומתי הם נחוצים. שילוב זה מתבצע בארגון ומעבר לו - בין שותפים וכן מקורות נתונים ומקרי שימוש של צד שלישי - כדי לעמוד בדרישות צריכת הנתונים של כל היישומים והתהליכים העסקיים. הטכניקות כוללות תנועת נתונים באצווה/בצובר, שליפה, טרנספורמציה, טעינה (ETL), לכידת נתוני שינוי, שכפול נתונים, וירטואליזציה של נתונים, שילוב נתוני זרימה, ניהול נתונים ועוד.
מהי וירטואליזציה של נתונים?
וירטואליזציה של נתונים מספקת לחברות תצוגה מאוחדת של כל הנתונים הארגוניים - בין מערכות ופורמטים שונים - בשכבת נתונים וירטואלית. במקום לשכפל נתונים, וירטואליזציה של נתונים עוזבת את הנתונים במערכות המקור שלה ופשוט חושפת ייצוג וירטואלי שלה למשתמשים ויישומים בזמן אמת. וירטואליזציה של נתונים היא גישה מודרנית לשילוב נתונים המאפשרת למשתמשים לגלות נתונים ולתמרן אותם ללא קשר למיקום הפיזי, הפורמט או הפרוטוקול שלו.
מהו מארג נתונים?
מארג נתונים הוא שילוב מותאם אישית של ארכיטקטורה וטכנולוגיה. הוא משתמש בשילוב נתונים דינמי ובניהול כדי לחבר מיקומים, מקורות וסוגי נתונים שונים. עם המבנים והתזרימים הנכונים כפי שהוגדרו בפלטפורמת אריג הנתונים, חברות יכולות לגשת במהירות ולשתף נתונים ללא קשר למקום שבו היא נוצרה או לאופן יצירתה.
מהי רשת נתונים?
רשת נתונים היא גישה לניהול נתונים המשתמשת במסגרת ארכיטקטונית מבוזרת. במילים אחרות: הוא מפזר בעלות ואחריות על סטים ספציפיים של נתונים ברחבי העסק, לאותם משתמשים בעלי מומחיות המומחה להבין מה המשמעות של הנתונים האלה וכיצד לעשות בהם שימוש מיטבי.
מהו צבר נתונים?
צבר נתונים מתאר סט של תהליכים אוטומטיים הניתנים לחזרה עבור חיפוש, ניקוי, טרנספורמציה וניתוח כל סוג של נתונים במקור שלו. מכיוון שהנתונים מנותחים ליד המקום שבו הם נוצרים, משתמשים עסקיים יכולים לנתח ולשתף במהירות את המידע שהם צריכים בעלות נמוכה יותר לארגון. צינורות נתונים ניתנים לשיפור גם על-ידי טכנולוגיות כגון למידת מכונה כדי להפוך אותם למהירים ויעילים יותר.
מהם איי נתונים מלאים?
סילו נתונים הוא מונח סלנג למצב שבו מחלקות בודדות או תחומים פונקציונליים בארגון אינם חולקים נתונים ומידע עם מחלקות אחרות. בידוד זה מונע מאמצים מתואמים כלפי מטרות החברה ומביא לביצועים גרועים (ושירות לקוחות ירוד), עלויות גבוהות וחוסר יכולת כללית להגיב לביקושי השוק ולשינויים. קשה להתאים נתונים כפולים ומיותרים, מה שמונע עוד כל ניסיון לתאם פעילויות ולנהל ביעילות את העסק.
מהו מחיקת נתונים?
מחיקת נתונים היא תהליך של לקיחת נתונים גולמיים והפיכתם לפורמט שתואם לבסיסי נתונים ויישומים שנוצרו. התהליך עשוי לכלול בנייה, ניקוי, העשרה ואימות נתונים לפי הצורך כדי להפוך נתונים גולמיים לשימושיים.
מהו אבטחת נתונים?
אבטחת מידע היא פעולה של הפיכת נתונים לבטוחים ומאובטחים - בטוחה מגישה או חשיפה לא מורשית, אסון או כשל מערכת, ובמקביל, נגישה בקלות למשתמשים ויישומים לגיטימיים. שיטות וכלים כוללים הצפנת נתונים, ניהול מפתח, יתירות ופרקטיקות גיבוי ובקרות גישה. אבטחת נתונים היא דרישה לארגונים בכל הגדלים והסוגים להגן על הלקוח ועל נתונים ארגוניים מול האיום ההולך וגדל של פרצות נתונים וסיכוני פרטיות. יתירות וגיבויים חשובים להמשכיות עסקית ולהתאוששות מאסון.
מהי פרטיות נתונים?
פרטיות נתונים מתייחסת למדיניות ולנהגים לטיפול בנתונים באופן שמגן עליהם מגישה או חשיפה לא מורשים. מדיניות ופרקטיקות של פרטיות נתונים מכסים את האופן שבו המידע נאסף ומאוחסן בהתאם לאסטרטגיית הנתונים של הארגון, האופן שבו הוא עשוי להיות משותף או לא משותף עם גורמי צד שלישי וכיצד לעמוד בהגבלות רגולטוריות. פרטיות נתונים היא חשיבות עסקית העונה על ציפיות הלקוחות תוך הגנה על שלמות ובטיחות המידע המאוחסן.
מהי איכות נתונים?
איכות נתונים היא מונח ערפילי המתאר את מידת התאמתם ומהימנותם של נתונים. המשמעות של נתונים טובים ואיכותיים היא שהנתונים מדויקים (מייצגים באמת את מה שהוא מתאר), אמינים (עקביים, ניתנים לביקורת, מנוהלים כראוי ומוגנים) ומלאים עד כדי כך שמשתמשים ויישומים דורשים. איכות נתונים יכולה להיות מובטחת רק על-ידי אסטרטגיית נתונים מתוכננת ומבוצעת כראוי המתבצעת עם כלים ומערכות חוזק תעשייתי יחד עם נהלים ומדיניות ניהול נתונים שבאים באופן גס.
מהו אימות נתונים?
בדיקת תקינות נתונים היא תהליך של קביעת האיכות, הדיוק והתוקף של נתונים לפני הייבוא או השימוש בהם. בדיקת תקינות יכולה להיות מורכבת מסדרה של פעילויות ותהליכים לאימות הנתונים ובדרך כלל פריטי נתונים "ניקוי", כולל הסרה של כפילויות, תיקון שגיאות ברורות או פריטים חסרים ושינויי עיצוב אפשריים (טיוב נתונים). אימות נתונים מבטיח שהמידע הדרוש לך לקבלת החלטות חשובות מדויק ואמין.
מהו טיוב נתונים?
ניקוי נתונים הוא התהליך של הסרה או תיקון של שגיאות מסט נתונים, טבלה או בסיס נתונים. שגיאות אלה יכולות לכלול מידע פגום, לא מדויק, לא רלוונטי או לא שלם. תהליך זה, שנקרא גם קרצוף נתונים, מוצא נתונים כפולים וחוסר עקביות אחרים, כמו טיפוסים וסטים מספריים שלא מסתכמים. ניקוי נתונים עשוי להסיר מידע שגוי או לתקן שגיאות ברורות, כגון שדות ריקים או קודים חסרים.
מהי שלמות נתונים?
שלמות הנתונים מתייחסת לאמיתות הנתונים לאורך הטווח הארוך. לאחר שהנתונים הוזנו או יובאו, מאומתים, מותאמים ומאוחסנים, שלמות הנתונים היא הצהרה שאיכות הנתונים מתוחזקת ומשתמשים יכולים להישאר בטוחים שהנתונים שנכנסו לא ישתנו. הנתונים שאוחזרו זהים לנתונים שאוחסנו במקור. לפעמים משמשת כמילה נרדפת לאיכות נתונים, שלמות נתונים עוסקת יותר במהימנות ויכולת תלות.
מהו פיקוח על נתונים?
פיקוח על נתונים הוא סט של קווי מדיניות ונוהלי עבודה להבטחת ניהול נתונים תקין בכל הארגון. הוא מבסס את תשתית ה-IT ומציין שמות ליחידים (או לתפקידים) שיש להם סמכות ואחריות לטיפול ושמירה על סוגים ספציפיים של נתונים. פיקוח נתונים אפקטיבי מבטיח שהנתונים זמינים, אמינים, מאובטחים ותואמים - ושלא נעשה בהם שימוש לרעה.
מהי אחריות על נתונים?
אחריות על נתונים היא יישום נהלים ומדיניות פיקוח על נתונים עבור ביסוס דיוק נתונים, מהימנות, שלמות ואבטחה. יחידים שמוקצים עם אחריות אחריות על נתונים מנהלים ומפקחים על ההליכים והכלים המשמשים לטיפול, אחסון והגנה על נתונים.
מהי ארכיטקטורת נתונים?
ארכיטקטורת נתונים היא העיצוב הכולל של המבנה, המדיניות והכללים שמגדירים את נתוני הארגון ואת אופן השימוש והניהול שלהם. ארכיטקטורת נתונים כוללת את הפרטים על אופן יישום אסטרטגיית הנתונים בתמיכה בצרכים עסקיים ובמטרות עסקיות - ומשמשת כבסיס לפיתוח בסיסי נתונים, נהלים, אמצעי הגנה, אבטחה וממשל נתונים.
מהו ניהול נתוני אב?
ניהול נתוני אב (MDM) הוא הפרקטיקה של יצירת מקור סימוכין אחד יחיד, "אב" עבור כל הנתונים העסקיים החשובים. היא כוללת מדיניות והליכים להגדרה, ניהול ובקרה (או פיקוח) הטיפול בנתוני האב. ניהול נתוני אב מרוכז מבטל התנגשות ובלבול שנובע מבסיסי נתונים מפוזרים עם מידע כפול ונתונים לא מתואמים שעשויים להיות מיושנים, פגומים או עקורים בזמן - מעודכנים במקום אחד אך לא במקום אחר. בעלת גרסה אחת לשרת את כל הארגון פירושה שכל חלקי הארגון עובדים עם אותן הגדרות, תקנים והנחות.
מהם כלי ניתוח?
המונח כלי ניתוח מתייחס לניתוח שיטתי של נתונים. יישומי כלי ניתוח וערכות כלים מכילים אלגוריתמים מתמטיים ומנועים חישוביים שיכולים לתמרן סטי נתונים גדולים כדי לחשוף דפוסים, מגמות, קשרים ובינה אחרת שמאפשרים למשתמשים לשאול שאלות ולקבל תובנות שימושיות לגבי העסק, התפעול והשווקים שלהם. ערכות כלים מודרניות רבות של כלי ניתוח נועדו לשימוש על-ידי אנשים שאינם טכניים, מה שמאפשר להם לבצע ניתוחים אלה בסיוע מינימלי של מדעני נתונים או מומחי IT.
מהם כלי ניתוח משודרגים?
כלי ניתוח מורחבים הם כלי ניתוח ש"משודרגים" עם טכנולוגיות בינה מלאכותית, כולל למידת מכונה ועיבוד שפה טבעית (NLP). לא רק כלי ניתוח משודרגים יכולים לעזור למשתמשים לחשוף תובנות מעמיקות יותר, מהר יותר - הם יכולים לבצע אוטומציה של שלבים מסובכים רבים בתהליך ולאפשר אפילו למשתמשים שאינם טכניים לבצע שאילתות על נתונים בדרך טבעית ושיחה.
מהי כריית נתונים?
כריית נתונים היא הפעולה של שליפת מידע שימושי מסטים גדולים של נתונים. כריית נתונים נעשית לעתים קרובות על-ידי משתמשים עסקיים המשתמשים בכלי ניתוח כדי לחשוף דפוסים, מגמות, חריגות, קשרים, יחסי תלות ובינה שימושית אחרת. לכריית נתונים יש מגוון רחב של יישומים, החל מאיתור הונאות ודאגות אבטחת סייבר וכלה בשיפור תחזיות ומציאת הזדמנויות לשיפור ביצועים.
מהו יצירת פרופיל נתונים?
יצירת פרופיל נתונים היא הנוהג לאסוף סטטיסטיקה ותכונות על סט נתונים, כגון הדיוק, השלמות והתוקף שלו. יצירת פרופיל נתונים היא אחת הטכניקות המשמשות במאמצי אימות נתונים וניקוי נתונים, מכיוון שהיא יכולה לסייע באיתור בעיות באיכות נתונים כמו יתירות, ערכים חסרים וחוסר עקביות.