Cos'è il data mining? Nozioni di base e le sue tecniche.

Sommario:

Cos'è il data mining? Nozioni di base e le sue tecniche.
Cos'è il data mining? Nozioni di base e le sue tecniche.

Video: Cos'è il data mining? Nozioni di base e le sue tecniche.

Video: Cos'è il data mining? Nozioni di base e le sue tecniche.
Video: Windows 7/8/10 - Correzione dell'errore "Non si dispone dell'autorizzazione per accedere" - YouTube 2024, Maggio
Anonim

La fondazione della quarta rivoluzione industriale dipenderà in gran parte Dati e Connettività. Servizi di analisi in grado di sviluppare o creare soluzioni di data mining giocherà un ruolo chiave in questo senso. Potrebbe aiutare ad analizzare e prevedere i risultati del comportamento di acquisto dei clienti per il targeting dei potenziali acquirenti. I dati diventeranno una nuova risorsa naturale e il processo di estrazione di informazioni rilevanti da questi dati non ordinati assumerà un'importanza immensa. Come tale, corretta comprensione del termine - Estrazione dei dati, i suoi processi e applicazioni potrebbero aiutarci a sviluppare un approccio olistico su questa parola d'ordine.

Nozioni di base sul data mining e le sue tecniche

Image
Image

Data mining, noto anche come Scoperta della conoscenza nei dati (KDD) riguarda la ricerca di grandi quantità di dati per scoprire modelli e tendenze che vanno oltre la semplice analisi. Questo, tuttavia, non è una soluzione a singolo passaggio ma un processo a più fasi e completato in varie fasi. Questi includono:

1] Raccolta e preparazione dei dati

Inizia con la raccolta dei dati e la sua corretta organizzazione. Ciò aiuta a migliorare significativamente le possibilità di trovare le informazioni che possono essere scoperte attraverso il data mining

2] Costruzione e valutazione del modello

Il secondo passo nel processo di data mining è l'applicazione di varie tecniche di modellazione. Questi sono usati per calibrare i parametri a valori ottimali. Le tecniche impiegate dipendono in gran parte dalle capacità analitiche necessarie per affrontare una gamma di esigenze organizzative e per giungere a una decisione.

Esaminiamo alcune tecniche di data mining in breve. Si è riscontrato che la maggior parte delle organizzazioni combina due o più tecniche di data mining per formare un processo appropriato che soddisfi i loro requisiti aziendali.

Leggere: Che cosa sono i Big Data?

Tecniche di data mining

  1. Associazione - L'associazione è una delle tecniche di data mining ampiamente conosciute. Sotto questo, un modello viene decifrato in base a una relazione tra gli elementi nella stessa transazione. Quindi, è anche noto come tecnica di relazione. I grandi rivenditori di marca si affidano a questa tecnica per ricercare le abitudini / preferenze di acquisto del cliente. Ad esempio, quando si monitorano le abitudini di acquisto delle persone, i rivenditori potrebbero identificare che un cliente acquista sempre panna quando acquista cioccolatini e quindi suggerisce che la prossima volta che acquisteranno cioccolatini potrebbero anche voler comprare la crema.
  2. Classificazione - Questa tecnica di data mining differisce da quanto sopra in un modo che si basa sull'apprendimento automatico e utilizza tecniche matematiche come la programmazione lineare, gli alberi decisionali, la rete neurale. In classifica, le aziende cercano di creare un software in grado di imparare a classificare gli elementi di dati in gruppi. Ad esempio, una società può definire una classificazione nell'applicazione che "dati tutti i record dei dipendenti che hanno offerto di dimettersi dall'azienda, prevedere il numero di persone che potrebbero dimettersi dall'azienda in futuro." In tale scenario, il la compagnia può classificare i registri dei dipendenti in due gruppi che sono "lasciare" e "stare". Può quindi utilizzare il suo software di data mining per classificare i dipendenti in gruppi separati creati in precedenza.
  3. Clustering - Oggetti diversi con caratteristiche simili sono raggruppati in un unico cluster tramite l'automazione. Molti di questi cluster vengono creati come classi e gli oggetti (con caratteristiche simili) vengono collocati di conseguenza. Per capirlo meglio, consideriamo un esempio di gestione dei libri nella biblioteca. In una biblioteca, la vasta collezione di libri è completamente catalogata. Gli oggetti dello stesso tipo sono elencati insieme. Questo ci rende più facile trovare un libro di nostro interesse. Allo stesso modo, usando la tecnica di clustering, possiamo tenere libri che hanno alcuni tipi di similarità in un cluster e assegnargli un nome adatto. Quindi, se un lettore sta cercando di afferrare un libro rilevante per il suo interesse, deve solo andare su quello scaffale invece di cercare l'intera libreria. Pertanto, la tecnica di clustering definisce le classi e inserisce gli oggetti in ogni classe, mentre nelle tecniche di classificazione gli oggetti vengono assegnati in classi predefinite.
  4. Predizione - La previsione è una tecnica di data mining che viene spesso utilizzata in combinazione con le altre tecniche di data mining. Si tratta di analizzare tendenze, classificazione, corrispondenza dei modelli e relazione. Analizzando eventi passati o istanze in una sequenza corretta si può tranquillamente prevedere un evento futuro. Ad esempio, la tecnica di analisi predittiva può essere utilizzata nella vendita per prevedere il profitto futuro se la vendita viene scelta come variabile indipendente e il profitto come variabile dipendente dalla vendita. Quindi, sulla base dei dati storici di vendita e profitto, si può tracciare una curva di regressione adattata che viene utilizzata per la previsione degli utili.
  5. Alberi decisionali - All'interno dell'albero delle decisioni, iniziamo con una semplice domanda che ha più risposte. Ogni risposta porta a un'ulteriore domanda per aiutare a classificare o identificare i dati in modo che possano essere classificati, o in modo che sia possibile effettuare una previsione in base a ciascuna risposta. Ad esempio, utilizziamo il seguente albero decisionale per determinare se giocare o meno a cricket ODI: Albero decisionale del data mining: a partire dal nodo radice, se la previsione del tempo prevede che piova, dovremmo evitare la partita per il giorno. In alternativa, se le previsioni del tempo sono chiare, dovremmo giocare la partita.

Il data mining è il fulcro degli sforzi di analisi in una varietà di settori e discipline come le comunicazioni, l'assicurazione, l'istruzione, la produzione, l'attività bancaria e il commercio al dettaglio e altro ancora. Pertanto, avere informazioni corrette su di esso è essenziale prima di applicare le diverse tecniche.

Consigliato: