Differenza tra data mining e OLAP

Anonim

Data Mining vs OLAP

Entrambi i dati mining e OLAP sono due delle tecnologie comuni di Business Intelligence (BI). Business intelligence si riferisce a metodi basati su computer per identificare ed estrarre informazioni utili dai dati aziendali. La data mining è il campo dell'informatica che si occupa di estrarre modelli interessanti da grandi set di dati. Combina molti metodi dall'intelligenza artificiale, dalle statistiche e dalla gestione del database. OLAP (elaborazione analitica on-line) come suggerisce il nome è una compilazione di modi per interrogare database multidimensionali.

La data mining è anche conosciuta come Knowledge Discovery in data (KDD). Come detto sopra, è un campo di informatica, che si occupa dell'estrazione di informazioni precedentemente sconosciute e interessanti da dati grezzi. A causa della crescita esponenziale dei dati, specialmente in settori come l'attività commerciale, la data mining è diventata strumento molto importante per convertire questa grande quantità di dati in business intelligence, in quanto l'estrazione manuale dei modelli è diventata apparentemente impossibile negli ultimi decenni. Ad esempio, è attualmente utilizzato per varie applicazioni come analisi di rete sociale, rilevamento delle frodi e marketing. La data mining si occupa generalmente di quattro attività: clustering, classificazione, regressione e associazione. Il clustering sta identificando gruppi simili da dati non strutturati. La classificazione è regole di apprendimento che possono essere applicate a nuovi dati e includono tipicamente i seguenti passaggi: preprocessing dei dati, progettazione di modelli, selezione / selezione delle funzioni e valutazione / convalida. La regressione è trovare funzioni con errore minimo per modellare i dati. E l'associazione sta cercando rapporti tra variabili. La data mining è di solito utilizzata per rispondere a domande come quali sono i principali prodotti che potrebbero aiutare a ottenere un profitto elevato l'anno prossimo a Wal-Mart.

OLAP è una classe di sistemi che forniscono risposte a query multidimensionali. Tipicamente OLAP è utilizzato per marketing, budgeting, previsione e applicazioni simili. È evidente che le banche dati utilizzate per OLAP sono configurate per domande complesse e ad hoc, con una rapida esecuzione in mente. Tipicamente una matrice viene utilizzata per visualizzare l'output di un OLAP. Le righe e le colonne sono formate dalle dimensioni della query. Spesso utilizzano metodi di aggregazione su più tabelle per ottenere i riassunti. Ad esempio, può essere utilizzato per scoprire le vendite di quest'anno a Wal-Mart rispetto all'anno scorso? Qual è la previsione sulle vendite nel prossimo trimestre? Cosa si può dire sulla tendenza osservando la variazione percentuale?

Anche se è ovvio che Data mining e OLAP sono simili perché operano sui dati per ottenere l'intelligenza, la differenza principale deriva da come operano sui dati.Gli strumenti OLAP forniscono analisi dati multidimensionali e forniscono sintesi dei dati, ma in contrasto, la data mining si concentra sui rapporti, i modelli e le influenze nell'insieme dei dati. Si tratta di un accordo OLAP con l'aggregazione, che si basa sul funzionamento dei dati tramite l'aggiunta, ma la data mining corrisponde alla "divisione". Un'altra notevole differenza è che, mentre gli strumenti di data mining modella i dati di modello e le regole restituibili, OLAP condurrà tecniche di confronto e contrasto lungo la dimensione aziendale in tempo reale.