Știința datelor
Ce este știința datelor?
Știința datelor oferă informații semnificative bazate pe cantități mari de date complexe sau date mari. Știința datelor sau știința bazată pe date combină diferite domenii de lucru în statistici și calcul pentru a interpreta datele în scopuri decizionale.
Înțelegerea științei datelor
Datele sunt extrase din diferite sectoare, canale și platforme, inclusiv telefoane mobile, rețele sociale, site-uri de comerț electronic, sondaje de asistență medicală și căutări pe internet. Creșterea cantității de date disponibile a deschis ușa către un nou domeniu de studiu bazat pe date mari – seturile masive de date care contribuie la crearea unor instrumente operaționale mai bune în toate sectoarele.
Accesul în continuă creștere la date este posibil datorită progreselor tehnologice și tehnicilor de colectare. Persoanele care cumpără modele și comportament pot fi monitorizate și predicții făcute pe baza informațiilor colectate.
Cu toate acestea, datele din ce în ce mai mari sunt nestructurate și necesită analize pentru luarea eficientă a deciziilor. Acest proces este complex și consumă mult timp pentru companii – prin urmare, apariția științei datelor.
Știința datelor sau știința bazată pe date folosește big data și învățarea automată pentru a interpreta datele în scopuri decizionale.
O scurtă istorie a științei datelor
Termenul știință a datelor a existat în cea mai bună parte a ultimilor 30 de ani și a fost folosit inițial ca substitut pentru „informatică” în 1960. Aproximativ 15 ani mai târziu, termenul a fost folosit pentru a defini studiul metodelor de prelucrare a datelor utilizate în diferite aplicații. În 2001, știința datelor a fost introdusă ca disciplină independentă. Harvard Business Review a publicat un articol în 2012 în care descria rolul cercetătorului în date drept „cea mai sexy meserie din secolul 21”.
Chei de luat masa
- Progresele în tehnologie, Internet, rețelele sociale și utilizarea tehnologiei au sporit accesul la big data.
- Știința datelor folosește tehnici precum învățarea automată și inteligența artificială pentru a extrage informații semnificative și pentru a prezice modele și comportamente viitoare.
- Domeniul științei datelor crește pe măsură ce tehnologia avansează și tehnicile de colectare și analiză a datelor mari devin mai sofisticate.
Cum se aplică știința datelor
Știința datelor încorporează instrumente din mai multe discipline pentru a culege un set de date, prelucra și obține informații din setul de date, extrage date semnificative din set și le interpretează în scopul luării deciziilor. Domeniile disciplinare care alcătuiesc domeniul științei datelor includ mineritul, statisticile, învățarea automată, analiza și programarea.
Exploatarea datelor aplică algoritmi setului de date complexe pentru a dezvălui modele care sunt apoi utilizate pentru a extrage date utile și relevante din set. Măsurile statistice sau analiza predictivă utilizează aceste date extrase pentru a evalua evenimentele care sunt susceptibile să se întâmple în viitor pe baza a ceea ce arată datele întâmplate în trecut.
Învățarea automată este un instrument de inteligență artificială care procesează cantități masive de date pe care un om nu le-ar putea prelucra într-o viață. Învățarea automată perfecționează modelul de decizie prezentat în analiza predictivă prin potrivirea probabilității ca un eveniment să se întâmple cu ceea ce sa întâmplat de fapt la un moment prezis.
Utilizând analize, analistul de date colectează și procesează datele structurate din etapa de învățare automată folosind algoritmi. Analistul interpretează, convertește și rezumă datele într-un limbaj coeziv pe care echipa de luare a deciziilor îl poate înțelege. Știința datelor este aplicată practic în toate contextele și, pe măsură ce rolul cercetătorului în date evoluează, domeniul se va extinde pentru a cuprinde arhitectura datelor, ingineria datelor și administrarea datelor.
Fapt rapid
Potrivit IBM, se preconizează că cererea pentru oamenii de știință de date va crește cu 28% până în 2020.
Data Scientist a definit
Un om de știință al datelor colectează, analizează și interpretează volume mari de date, în multe cazuri, pentru a îmbunătăți operațiunile unei companii. Profesioniștii din domeniul cercetării datelor dezvoltă modele statistice care analizează datele și detectează modele, tendințe și relații în seturile de date. Aceste informații pot fi utilizate pentru a prezice comportamentul consumatorului sau pentru a identifica riscurile de afaceri și operaționale. Omul de știință al datelor este adesea un povestitor care prezintă informații despre factorii de decizie într-un mod care este ușor de înțeles și aplicabil rezolvării problemelor.
Data Science Today
Companiile aplică big data și știința datelor activităților de zi cu zi pentru a aduce valoare consumatorilor. Instituțiile bancare valorifică big data pentru a-și îmbunătăți succesele de detectare a fraudei. Firmele de administrare a activelor folosesc date mari pentru a prezice probabilitatea ca prețul unui titlu să crească în sus sau în jos la un moment dat.
Companii precum Netflix exploatează date mari pentru a determina ce produse să livreze utilizatorilor săi. Netflix folosește, de asemenea, algoritmi pentru a crea recomandări personalizate pentru utilizatori pe baza istoricului de vizionare. Știința datelor evoluează într-un ritm rapid, iar aplicațiile sale vor continua să schimbe viețile în viitor.