1 mai 2021 11:57

Depozitarea datelor

Ce este depozitarea datelor?

Depozitarea datelor este stocarea electronică a unei cantități mari de informații de către o companie sau organizație. Depozitarea datelor este o componentă vitală a inteligenței de afaceri care utilizează tehnici analitice privind datele de afaceri.

Conceptul de depozitare a datelor a fost introdus în 1988 de cercetătorii IBM Barry Devlin și Paul Murphy. Necesitatea stocării datelor a evoluat pe măsură ce sistemele informatice au devenit mai complexe și au gestionat cantități tot mai mari de date. O carte esențială despre depozitarea datelor este „Construirea depozitului de date” de WH Inmon, care a fost publicată pentru prima dată în 1990 și a fost retipărită de mai multe ori de atunci.

Cum funcționează depozitarea datelor

Depozitarea datelor este utilizată pentru a oferi o perspectivă mai mare asupra performanței unei companii prin compararea datelor consolidate din mai multe surse eterogene. Un depozit de date este conceput pentru a rula interogări și analize privind datele istorice derivate din surse tranzacționale.

Odată ce datele au fost încorporate în depozit, acestea nu se modifică și nu pot fi modificate, deoarece un depozit de date rulează analize asupra evenimentelor care au avut loc deja, concentrându-se pe modificările datelor de-a lungul timpului. Datele depozitate trebuie stocate într-un mod sigur, fiabil, ușor de recuperat și ușor de gestionat.

Există câțiva pași care sunt luați pentru a crea un depozit de date. Primul pas este extragerea datelor, care presupune colectarea unor cantități mari de date din mai multe puncte sursă. După ce datele au fost compilate, acestea trec prin curățarea datelor, procesul de pieptănare a datelor pentru erori și corectarea sau excluderea oricăror erori găsite.

Datele curățate sunt apoi convertite dintr-un format de bază de date într-un format de depozit. Odată stocate în depozit, datele trec prin sortare, consolidare, rezumare etc., astfel încât să fie mai coordonate și mai ușor de utilizat. În timp, mai multe date sunt adăugate în depozit pe măsură ce sursele de date multiple sunt actualizate.

Chei de luat masa

  • Depozitarea datelor este stocarea electronică a unei cantități mari de informații de către o companie sau organizație.
  • Un depozit de date este conceput pentru a rula interogări și analize privind datele istorice derivate din surse tranzacționale în scopuri de business intelligence și data mining.
  • Depozitarea datelor este utilizată pentru a oferi o perspectivă mai mare asupra performanței unei companii prin compararea datelor consolidate din mai multe surse eterogene.

Considerații speciale: Data Mining

Întreprinderile ar putea depozita date pentru a fi utilizate în explorare și exploatarea datelor, în căutarea unor tipare de informații care să le ajute să-și îmbunătățească procesele de afaceri. Un sistem bun de depozitare a datelor poate face, de asemenea, mai ușor accesul reciproc al datelor de către diferite departamente din cadrul unei companii.

De exemplu, un depozit de date ar putea permite unei companii să evalueze cu ușurință datele echipei de vânzări și să ajute la luarea deciziilor cu privire la modul de îmbunătățire a vânzărilor sau la eficientizarea departamentului. Compania ar putea alege să se concentreze asupra obiceiurilor de cheltuieli ale clienților săi pentru a-și poziționa mai bine produsele și a crește vânzările.

Cu depozitarea datelor, compania poate colecta date istorice despre cheltuielile clienților săi din trecut – să zicem, 20 de ani – și să realizeze analize asupra acestor date. Informațiile rezultate ar putea oferi informații despre preferințele consumatorilor săi; momentul zilei, lunii sau anului cu vânzări mai mari; sau cel mai mare client cheltuit pentru anul respectiv.

Stocarea și gestionarea eficientă a datelor sunt, de asemenea, ceea ce face posibilă procesele, cum ar fi inițierea rezervărilor de călătorie și utilizarea bancomatelor automate.

Procesul de extragere a datelor se împarte în cinci pași:

  1. Organizațiile colectează date și le încarcă în depozitele lor de date.
  2. Apoi stochează și gestionează datele, fie pe servere interne, fie în cloud.
  3. Analiștii de afaceri, echipele de management și profesioniștii în tehnologia informației accesează datele și determină modul în care doresc să le organizeze.
  4. Aplicația software sortează apoi datele pe baza rezultatelor utilizatorului
  5. Utilizatorul final prezintă în cele din urmă datele într-un format ușor de partajat, cum ar fi un grafic sau un tabel.

Depozitarea datelor vs. baze de date

Un depozit de date nu este neapărat același concept ca o bază de date standard. O bază de date este un sistem tranzacțional care este setat să monitorizeze și să actualizeze date în timp real pentru a avea disponibile doar cele mai recente date. Un depozit de date este programat pentru a agrega date structurate pe o perioadă de timp. De exemplu, o bază de date ar putea avea doar cea mai recentă adresă a unui client, în timp ce un depozit de date ar putea avea toate adresele în care clientul a locuit în ultimii 10 ani.