Differenza tra Data mining e Data Warehousing

Data Mining e Data Warehousing sono entrambe tecniche molto potenti e popolari per l'analisi dei dati. Gli utenti che sono inclini a statistiche utilizzano Data Mining. Essi utilizzano modelli statistici per cercare modelli nascosti nei dati. I data mining sono interessati a trovare rapporti utili tra diversi elementi di dati, che in ultima analisi sono redditizi per le imprese. D'altra parte, esperti di dati che possono analizzare le dimensioni del business direttamente tendono ad utilizzare i magazzini dei dati.

La data mining è anche conosciuta come Knowledge Discovery in data (KDD). Come detto sopra, è un campo di informatica, che si occupa dell'estrazione di informazioni precedentemente sconosciute e interessanti da dati grezzi. A causa della crescita esponenziale dei dati, specialmente in settori come l'attività commerciale, la data mining è diventata strumento molto importante per convertire questa grande quantità di dati in business intelligence, in quanto l'estrazione manuale dei modelli è diventata apparentemente impossibile negli ultimi decenni. Ad esempio, è attualmente utilizzato per varie applicazioni come analisi di rete sociale, rilevamento delle frodi e marketing. La data mining si occupa generalmente di quattro attività: clustering, classificazione, regressione e associazione. Il clustering sta identificando gruppi simili da dati non strutturati. La classificazione è regole di apprendimento che possono essere applicate a nuovi dati e includono tipicamente i passaggi seguenti: preprocessing dei dati, progettazione di modelli, selezione di apprendimento / funzione e valutazione / convalida. La regressione è trovare funzioni con errore minimo per modellare i dati. E l'associazione sta cercando rapporti tra variabili. La data mining è di solito utilizzata per rispondere a domande come quali sono i principali prodotti che potrebbero aiutare a ottenere un profitto elevato l'anno prossimo in Wal-Mart?

Come accennato in precedenza, il data warehousing è utilizzato anche per l'analisi dei dati, ma da diversi gruppi di utenti e un obiettivo leggermente diverso in mente. Ad esempio, quando si tratta del settore retail, gli utenti del data warehousing sono più interessati a quali tipi di acquisti sono popolari tra i clienti, per cui i risultati dell'analisi possono aiutare il cliente migliorando l'esperienza dei clienti. Ma i Data Miners affermano innanzitutto un'ipotesi come i clienti che acquistano un determinato tipo di prodotto e analizzano i dati per testare l'ipotesi. Il deposito dei dati potrebbe essere effettuato da un importante rivenditore che inizialmente acquista i suoi negozi con le stesse dimensioni di prodotti per scoprire che i negozi di New York vendono inventari di dimensioni inferiori più velocemente che nei negozi di Chicago. Così, guardando questo risultato, il rivenditore può acquistare il negozio di New York con taglie più piccole rispetto ai negozi di Chicago.

Quindi, come si può chiaramente vedere, questi due tipi di analisi sembrano essere della stessa natura a occhio nudo. Entrambi fanno preoccupazione per aumentare i profitti basati sui dati storici. Ma naturalmente, ci sono differenze fondamentali. In termini semplici, Data Mining e Data Warehousing sono dedicati all'arredamento di diversi tipi di analisi, ma sicuramente per diversi tipi di utenti. In altre parole, Data Mining cerca le correlazioni, per facilitare un'ipotesi statistica. Ma, Data Warehousing risponde a una domanda relativamente più ampia e si taglia e dadi dati da lì in poi per riconoscere i modi di miglioramento in futuro.