Οδηγός εξόρυξης δεδομένων: Τι είναι η εξόρυξη δεδομένων; Τεχνικές, Διαδικασία
Τι είναι η Εξόρυξη Δεδομένων;
Data Mining είναι μια διαδικασία εύρεσης δυνητικά χρήσιμων προτύπων από τεράστια σύνολα δεδομένων. Είναι μια πολυεπιστημονική δεξιότητα που χρησιμοποιεί μάθηση μηχανής, στατιστικά στοιχεία και Τεχνητή Νοημοσύνη για την εξαγωγήtracπληροφορίες για την αξιολόγηση της πιθανότητας μελλοντικών γεγονότων. Οι γνώσεις που προκύπτουν από την Εξόρυξη Δεδομένων χρησιμοποιούνται για μάρκετινγκ, ανίχνευση απάτης, επιστημονική ανακάλυψη κ.λπ.
Η εξόρυξη δεδομένων αφορά την ανακάλυψη κρυφών, ανυποψίαστων και προηγουμένως άγνωστων αλλά έγκυρων σχέσεων μεταξύ των δεδομένων. Η εξόρυξη δεδομένων ονομάζεται επίσης Ανακάλυψη Γνώσης στα Δεδομένα (KDD), Knowledge ex.tracανάλυση δεδομένων/προτύπων, συλλογή πληροφοριών κ.λπ.
Τύποι δεδομένων
Η εξόρυξη δεδομένων μπορεί να πραγματοποιηθεί στους ακόλουθους τύπους δεδομένων
- Σχεσιακές βάσεις δεδομένων
- Αποθήκες δεδομένων
- Προηγμένα αποθετήρια DB και πληροφοριών
- Αντικειμενοστρεφείς και αντικειμενοσχεσιακές βάσεις δεδομένων
- Συναλλακτικές και Χωρικές βάσεις δεδομένων
- Ετερογενείς και παλαιού τύπου βάσεις δεδομένων
- Βάση δεδομένων πολυμέσων και ροής
- Βάσεις δεδομένων κειμένου
- Εξόρυξη κειμένου και εξόρυξη Ιστού
Διαδικασία Υλοποίησης Data Mining

Ας μελετήσουμε αναλυτικά τη διαδικασία υλοποίησης της Εξόρυξης Δεδομένων
Επιχειρηματική κατανόηση
Σε αυτή τη φάση, καθορίζονται επιχειρηματικοί στόχοι και στόχοι εξόρυξης δεδομένων.
- Πρώτον, πρέπει να κατανοήσετε τους στόχους της επιχείρησης και των πελατών. Πρέπει να ορίσετε τι θέλει ο πελάτης σας (το οποίο πολλές φορές δεν το γνωρίζουν ούτε οι ίδιοι)
- Κάντε απολογισμό του τρέχοντος σεναρίου εξόρυξης δεδομένων. Λάβετε υπόψη τους πόρους, την υπόθεση, τους περιορισμούς και άλλους σημαντικούς παράγοντες στην αξιολόγησή σας.
- Χρησιμοποιώντας τους επιχειρηματικούς στόχους και το τρέχον σενάριο, καθορίστε τους στόχους εξόρυξης δεδομένων σας.
- Ένα καλό σχέδιο εξόρυξης δεδομένων είναι πολύ λεπτομερές και θα πρέπει να αναπτυχθεί για την επίτευξη τόσο των επιχειρηματικών όσο και των στόχων εξόρυξης δεδομένων.
Κατανόηση δεδομένων
Σε αυτή τη φάση, πραγματοποιείται έλεγχος λογικής στα δεδομένα για να ελεγχθεί αν είναι κατάλληλος για τους στόχους εξόρυξης δεδομένων.
- Πρώτον, τα δεδομένα συλλέγονται από πολλαπλές πηγές δεδομένων που είναι διαθέσιμες στον οργανισμό.
- Αυτές οι πηγές δεδομένων μπορεί να περιλαμβάνουν πολλαπλές βάσεις δεδομένων, επίπεδο αρχείου ή κύβους δεδομένων. Υπάρχουν ζητήματα όπως η αντιστοίχιση αντικειμένων και η ενοποίηση σχήματος που μπορεί να προκύψουν κατά τη διαδικασία ενσωμάτωσης δεδομένων. Είναι μια αρκετά περίπλοκη και δύσκολη διαδικασία καθώς δεδομένα από διάφορες πηγές είναι απίθανο να ταιριάζουν εύκολα. Για παράδειγμα, ο πίνακας Α περιέχει μια οντότητα με το όνομα cust_no ενώ ένας άλλος πίνακας Β περιέχει μια οντότητα με το όνομα cust-id.
- Επομένως, είναι αρκετά δύσκολο να διασφαλιστεί ότι και τα δύο αυτά δεδομένα αναφέρονται στην ίδια τιμή ή όχι. Εδώ, τα μεταδεδομένα θα πρέπει να χρησιμοποιούνται για τη μείωση των σφαλμάτων στη διαδικασία ενοποίησης δεδομένων.
- Στη συνέχεια, το βήμα είναι να αναζητήσετε ιδιότητες των δεδομένων που αποκτήθηκαν. Ένας καλός τρόπος για να εξερευνήσετε τα δεδομένα είναι να απαντήσετε στις ερωτήσεις εξόρυξης δεδομένων (που αποφασίστηκαν στην επιχειρηματική φάση) χρησιμοποιώντας τα εργαλεία ερωτημάτων, αναφορών και οπτικοποίησης.
- Με βάση τα αποτελέσματα του ερωτήματος, θα πρέπει να εξακριβωθεί η ποιότητα των δεδομένων. Θα πρέπει να ληφθούν δεδομένα που λείπουν εάν υπάρχουν.
Προετοιμασία δεδομένων
Σε αυτή τη φάση, η παραγωγή δεδομένων είναι έτοιμη.
Η διαδικασία προετοιμασίας δεδομένων καταναλώνει περίπου το 90% του χρόνου του έργου.
Τα δεδομένα από διαφορετικές πηγές θα πρέπει να επιλέγονται, να καθαρίζονται, να μετασχηματίζονται, να μορφοποιούνται, να ανωνυμοποιούνται και να δημιουργούνται (εάν απαιτείται).
Ο καθαρισμός δεδομένων είναι μια διαδικασία «καθαρισμού» των δεδομένων εξομαλύνοντας τα θορυβώδη δεδομένα και συμπληρώνοντας τιμές που λείπουν.
Για παράδειγμα, για ένα προφίλ δημογραφικών στοιχείων πελάτη, λείπουν δεδομένα ηλικίας. Τα δεδομένα είναι ελλιπή και πρέπει να συμπληρωθούν. Σε ορισμένες περιπτώσεις, ενδέχεται να υπάρχουν ακραίες τιμές δεδομένων. Για παράδειγμα, η ηλικία έχει τιμή 300. Τα δεδομένα μπορεί να είναι ασυνεπή. Για παράδειγμα, το όνομα του πελάτη είναι διαφορετικό σε διαφορετικούς πίνακες.
Οι λειτουργίες μετασχηματισμού δεδομένων αλλάζουν τα δεδομένα για να τα καταστήσουν χρήσιμα στην εξόρυξη δεδομένων. Μπορεί να εφαρμοστεί ο ακόλουθος μετασχηματισμός
Μετασχηματισμός δεδομένων
Οι λειτουργίες μετασχηματισμού δεδομένων θα συμβάλουν στην επιτυχία της διαδικασίας εξόρυξης.
Εξομάλυνση: Βοηθά στην αφαίρεση του θορύβου από τα δεδομένα.
Συσσωμάτωση: Οι πράξεις σύνοψης ή συγκέντρωσης εφαρμόζονται στα δεδομένα. Δηλαδή, τα εβδομαδιαία δεδομένα πωλήσεων συγκεντρώνονται για τον υπολογισμό του μηνιαίου και του ετήσιου συνόλου.
Γενίκευση: Σε αυτό το βήμα, τα δεδομένα χαμηλού επιπέδου αντικαθίστανται από έννοιες υψηλότερου επιπέδου με τη βοήθεια ιεραρχιών εννοιών. Για παράδειγμα, η πόλη αντικαθίσταται από την κομητεία.
Ομαλοποίηση: Η κανονικοποίηση εκτελείται όταν τα δεδομένα χαρακτηριστικών κλιμακώνονται προς τα πάνω ή προς τα κάτω. Παράδειγμα: Τα δεδομένα θα πρέπει να βρίσκονται στο εύρος -2.0 έως 2.0 μετά την κανονικοποίηση.
Κατασκευή χαρακτηριστικών: αυτά τα χαρακτηριστικά κατασκευάζονται και περιλαμβάνουν το δεδομένο σύνολο χαρακτηριστικών που είναι χρήσιμα για την εξόρυξη δεδομένων.
Το αποτέλεσμα αυτής της διαδικασίας είναι ένα τελικό σύνολο δεδομένων που μπορεί να χρησιμοποιηθεί στη μοντελοποίηση.
Πρίπλασμα
Σε αυτή τη φάση, χρησιμοποιούνται μαθηματικά μοντέλα για τον προσδιορισμό προτύπων δεδομένων.
- Με βάση τους επιχειρηματικούς στόχους, θα πρέπει να επιλεγούν κατάλληλες τεχνικές μοντελοποίησης για το προετοιμασμένο σύνολο δεδομένων.
- Δημιουργήστε ένα σενάριο για να ελέγξετε την ποιότητα και την εγκυρότητα του μοντέλου.
- Εκτελέστε το μοντέλο στο προετοιμασμένο σύνολο δεδομένων.
- Τα αποτελέσματα θα πρέπει να αξιολογούνται από όλους τους ενδιαφερόμενους για να διασφαλιστεί ότι το μοντέλο μπορεί να ανταποκριθεί στους στόχους εξόρυξης δεδομένων.
Εκτίμηση
Σε αυτή τη φάση, τα πρότυπα που προσδιορίζονται αξιολογούνται σε σχέση με τους επιχειρηματικούς στόχους.
- Τα αποτελέσματα που παράγονται από το μοντέλο εξόρυξης δεδομένων θα πρέπει να αξιολογούνται σε σχέση με τους επιχειρηματικούς στόχους.
- Η απόκτηση επιχειρηματικής κατανόησης είναι μια επαναληπτική διαδικασία. Στην πραγματικότητα, ενώ κατανοούμε, ενδέχεται να προκύψουν νέες επιχειρηματικές απαιτήσεις λόγω της εξόρυξης δεδομένων.
- Λαμβάνεται μια απόφαση για τη μετακίνηση του μοντέλου στη φάση ανάπτυξης.
Ανάπτυξη
Στη φάση της ανάπτυξης, στέλνετε τις ανακαλύψεις εξόρυξης δεδομένων σας στις καθημερινές επιχειρηματικές λειτουργίες.
- Οι γνώσεις ή οι πληροφορίες που ανακαλύπτονται κατά τη διαδικασία εξόρυξης δεδομένων θα πρέπει να γίνονται εύκολα κατανοητές από μη τεχνικούς ενδιαφερόμενους.
- Ένα λεπτομερές σχέδιο ανάπτυξης για το πλοίοping, η συντήρηση και η παρακολούθηση των ανακαλύψεων εξόρυξης δεδομένων δημιουργούνται.
- Δημιουργείται μια τελική έκθεση έργου με διδάγματα και βασικές εμπειρίες κατά τη διάρκεια του έργου. Αυτό βοηθά στη βελτίωση της επιχειρηματικής πολιτικής του οργανισμού.
Τεχνικές εξόρυξης δεδομένων

1. Ταξινόμηση
Αυτή η ανάλυση χρησιμοποιείται για την ανάκτηση σημαντικών και σχετικών πληροφοριών σχετικά με δεδομένα και μεταδεδομένα. Αυτή η μέθοδος εξόρυξης δεδομένων βοηθά στην ταξινόμηση δεδομένων σε διαφορετικές κλάσεις.
2. ClusterING
ClusterΗ ανάλυση είναι μια τεχνική εξόρυξης δεδομένων για τον εντοπισμό δεδομένων που μοιάζουν μεταξύ τους. Αυτή η διαδικασία βοηθά στην κατανόηση των διαφορών και των ομοιοτήτων μεταξύ των δεδομένων.
3. Παλινδρόμηση
Η ανάλυση παλινδρόμησης είναι η μέθοδος εξόρυξης δεδομένων για τον εντοπισμό και την ανάλυση της σχέσης μεταξύ των μεταβλητών. Χρησιμοποιείται για τον προσδιορισμό της πιθανότητας μιας συγκεκριμένης μεταβλητής, δεδομένης της παρουσίας άλλων μεταβλητών.
4. Κανόνες Συνδέσμου
Αυτή η τεχνική εξόρυξης δεδομένων βοηθά στην εύρεση της συσχέτισης μεταξύ δύο ή περισσότερων αντικειμένων. Ανακαλύπτει ένα κρυφό μοτίβο στο σύνολο δεδομένων.
5. Εξωτερική ανίχνευση
Αυτός ο τύπος τεχνικής εξόρυξης δεδομένων αναφέρεται στην παρατήρηση στοιχείων δεδομένων στο σύνολο δεδομένων που δεν ταιριάζουν με ένα αναμενόμενο πρότυπο ή αναμενόμενη συμπεριφορά. Αυτή η τεχνική μπορεί να χρησιμοποιηθεί σε διάφορους τομείς, όπως εισβολή, ανίχνευση, ανίχνευση απάτης ή σφαλμάτων κ.λπ. Ο εξωτερικός εντοπισμός ονομάζεται επίσης Outlier Analysis ή Outlier Mining.
6. Διαδοχικά Μοτίβα
Αυτή η τεχνική εξόρυξης δεδομένων βοηθά στον εντοπισμό ή τον εντοπισμό παρόμοιων μοτίβων ή τάσεων στα δεδομένα συναλλαγών για συγκεκριμένη περίοδο.
7. Πρόβλεψη
Η Πρόβλεψη έχει χρησιμοποιήσει έναν συνδυασμό άλλων τεχνικών εξόρυξης δεδομένων όπως τάσεις, διαδοχικά μοτίβα, ομαδοποίηση, ταξινόμηση κ.λπ. Αναλύει προηγούμενα γεγονότα ή παρουσίες με σωστή σειρά για την πρόβλεψη ενός μελλοντικού γεγονότος.
Προκλήσεις Εφαρμογής Data mine
- Απαιτούνται ειδικευμένοι ειδικοί για τη διαμόρφωση των ερωτημάτων εξόρυξης δεδομένων.
- Υπερπροσαρμογή: Λόγω του μικρού μεγέθους της βάσης δεδομένων εκπαίδευσης, ένα μοντέλο ενδέχεται να μην ταιριάζει σε μελλοντικές καταστάσεις.
- Η εξόρυξη δεδομένων χρειάζεται μεγάλες βάσεις δεδομένων που μερικές φορές είναι δύσκολο να διαχειριστούν
- Οι επιχειρηματικές πρακτικές μπορεί να χρειαστεί να τροποποιηθούν για να καθοριστεί η χρήση των ακάλυπτων πληροφοριών.
- Εάν το σύνολο δεδομένων δεν είναι διαφορετικό, τα αποτελέσματα εξόρυξης δεδομένων ενδέχεται να μην είναι ακριβή.
- Οι πληροφορίες ολοκλήρωσης που απαιτούνται από ετερογενείς βάσεις δεδομένων και παγκόσμια συστήματα πληροφοριών μπορεί να είναι πολύπλοκες
Παραδείγματα εξόρυξης δεδομένων
Τώρα σε αυτό το μάθημα εξόρυξης δεδομένων, ας μάθουμε για την εξόρυξη δεδομένων με παραδείγματα:
Παράδειγμα 1:
Σκεφτείτε έναν επικεφαλής μάρκετινγκ που παρέχει υπηρεσίες τηλεπικοινωνιών που θέλει να αυξήσει τα έσοδα από υπηρεσίες μεγάλων αποστάσεων. Για την υψηλή απόδοση επένδυσης στις πωλήσεις και τις προσπάθειες μάρκετινγκ του, το προφίλ των πελατών είναι σημαντικό. Έχει μια τεράστια δεξαμενή δεδομένων με πληροφορίες πελατών, όπως ηλικία, φύλο, εισόδημα, πιστωτικό ιστορικό κ.λπ. Αλλά είναι αδύνατο να προσδιοριστούν τα χαρακτηριστικά των ανθρώπων που προτιμούν τις υπεραστικές κλήσεις με μη αυτόματη ανάλυση. Χρησιμοποιώντας τεχνικές εξόρυξης δεδομένων, μπορεί να αποκαλύψει μοτίβα μεταξύ των χρηστών κλήσεων μεγάλων αποστάσεων και των χαρακτηριστικών τους.
Για παράδειγμα, μπορεί να μάθει ότι οι καλύτεροι πελάτες του είναι παντρεμένες γυναίκες μεταξύ 45 και 54 ετών που βγάζουν περισσότερα από 80,000 $ ετησίως. Οι προσπάθειες μάρκετινγκ μπορούν να στοχεύουν σε τέτοια δημογραφικά στοιχεία.
Παράδειγμα 2:
Μια τράπεζα θέλει να αναζητήσει νέους τρόπους για να αυξήσει τα έσοδα από τις εργασίες της με πιστωτικές κάρτες. Θέλουν να ελέγξουν εάν η χρήση θα διπλασιαζόταν εάν τα τέλη μειωνόταν στο μισό.
Η Τράπεζα έχει ιστορικό πολλαπλών ετών σχετικά με τα μέσα υπόλοιπα πιστωτικών καρτών, τα ποσά πληρωμών, τη χρήση του πιστωτικού ορίου και άλλες βασικές παραμέτρους. Δημιουργούν ένα μοντέλο για να ελέγξουν τον αντίκτυπο της προτεινόμενης νέας επιχειρηματικής πολιτικής. Τα αποτελέσματα των δεδομένων δείχνουν ότι η μείωση των τελών στο μισό για μια στοχευμένη πελατειακή βάση θα μπορούσε να αυξήσει τα έσοδα κατά 10 εκατομμύρια δολάρια.
Εργαλεία εξόρυξης δεδομένων
Ακολουθούν 2 δημοφιλή Εργαλεία εξόρυξης δεδομένων χρησιμοποιείται ευρέως στη Βιομηχανία
R-γλώσσα:
R γλώσσα είναι ένα εργαλείο ανοιχτού κώδικα για στατιστικούς υπολογιστές και γραφικά. Το R έχει μια μεγάλη ποικιλία από στατιστικές, κλασικές στατιστικές δοκιμές, ανάλυση χρονοσειρών, ταξινόμηση και γραφικές τεχνικές. Προσφέρει αποτελεσματική δυνατότητα μεταφοράς και αποθήκευσης δεδομένων.
Oracle Εξόρυξη δεδομένων:
Oracle Data Mining ευρέως γνωστό ως ODM είναι μια ενότητα του Oracle Προηγμένη βάση δεδομένων Analytics. Αυτό το εργαλείο εξόρυξης δεδομένων επιτρέπει στους αναλυτές δεδομένων να δημιουργούν λεπτομερείς πληροφορίες και να κάνουν προβλέψεις. Βοηθά στην πρόβλεψη της συμπεριφοράς των πελατών, αναπτύσσει προφίλ πελατών, εντοπίζει ευκαιρίες cross-selling.
Οφέλη της Εξόρυξης Δεδομένων
- Η τεχνική εξόρυξης δεδομένων βοηθά τις εταιρείες να λαμβάνουν πληροφορίες βασισμένες στη γνώση.
- Η εξόρυξη δεδομένων βοηθά τους οργανισμούς να κάνουν τις κερδοφόρες προσαρμογές στη λειτουργία και την παραγωγή.
- Η εξόρυξη δεδομένων είναι μια οικονομικά αποδοτική και αποδοτική λύση σε σύγκριση με άλλες εφαρμογές στατιστικών δεδομένων.
- Η εξόρυξη δεδομένων βοηθά στη διαδικασία λήψης αποφάσεων.
- Διευκολύνει την αυτοματοποιημένη πρόβλεψη τάσεων και συμπεριφορών καθώς και την αυτοματοποιημένη ανακάλυψη κρυφών μοτίβων.
- Μπορεί να εφαρμοστεί σε νέα συστήματα καθώς και σε υπάρχουσες πλατφόρμες
- Είναι η γρήγορη διαδικασία που διευκολύνει τους χρήστες να αναλύσουν τεράστιο όγκο δεδομένων σε λιγότερο χρόνο.
Μειονεκτήματα της Εξόρυξης Δεδομένων
- Υπάρχουν πιθανότητες οι εταιρείες να πουλήσουν χρήσιμες πληροφορίες των πελατών τους σε άλλες εταιρείες για χρήματα. Για παράδειγμα, η American Express έχει πουλήσει τις αγορές των πελατών της με πιστωτική κάρτα σε άλλες εταιρείες.
- Πολλά λογισμικά ανάλυσης εξόρυξης δεδομένων είναι δύσκολο να λειτουργήσουν και απαιτούν εκ των προτέρων εκπαίδευση για να εργαστείτε.
- Διαφορετικά εργαλεία εξόρυξης δεδομένων λειτουργούν με διαφορετικούς τρόπους λόγω διαφορετικών αλγορίθμων που χρησιμοποιούνται στο σχεδιασμό τους. Ως εκ τούτου, η επιλογή του σωστού εργαλείου εξόρυξης δεδομένων είναι ένα πολύ δύσκολο έργο.
- Οι τεχνικές εξόρυξης δεδομένων δεν είναι ακριβείς και επομένως μπορεί να προκαλέσει σοβαρές συνέπειες σε ορισμένες συνθήκες.
Εφαρμογές Εξόρυξης Δεδομένων
| Εφαρμογές | Χρήση |
|---|---|
| Διαβιβάσεις | Οι τεχνικές εξόρυξης δεδομένων χρησιμοποιούνται στον τομέα της επικοινωνίας για την πρόβλεψη της συμπεριφοράς των πελατών για την προσφορά εξαιρετικά στοχευμένων και σχετικών καμπανιών. |
| Ασφάλιση | Η εξόρυξη δεδομένων βοηθά τις ασφαλιστικές εταιρείες να τιμολογούν τα προϊόντα τους κερδοφόρα και να προωθούν νέες προσφορές στους νέους ή υπάρχοντες πελάτες τους. |
| Εκπαίδευση | Η εξόρυξη δεδομένων ωφελεί τους εκπαιδευτικούς να έχουν πρόσβαση σε δεδομένα μαθητών, να προβλέψουν τα επίπεδα επιτυχίας και να βρουν μαθητές ή ομάδες μαθητών που χρειάζονται επιπλέον προσοχή. Για παράδειγμα, μαθητές που είναι αδύναμοι στο μάθημα των μαθηματικών. |
| Βιομηχανίες | Με τη βοήθεια της εξόρυξης δεδομένων, οι κατασκευαστές μπορούν να προβλέψουν τη φθορά των περιουσιακών στοιχείων της παραγωγής. Μπορούν να προβλέψουν τη συντήρηση που τους βοηθά να τα μειώσουν για να ελαχιστοποιήσουν το χρόνο διακοπής λειτουργίας. |
| Τράπεζες | Η εξόρυξη δεδομένων βοηθά τον χρηματοοικονομικό τομέα να αποκτήσει μια εικόνα των κινδύνων της αγοράς και να διαχειριστεί τη συμμόρφωση με τους κανονισμούς. Βοηθά τις τράπεζες να εντοπίσουν πιθανούς κακοπληρωτές για να αποφασίσουν εάν θα εκδώσουν πιστωτικές κάρτες, δάνεια κ.λπ. |
| Λιανεμποριο | Οι τεχνικές εξόρυξης δεδομένων βοηθούν τα εμπορικά κέντρα λιανικής και τα παντοπωλεία να εντοπίζουν και να τακτοποιούν τα περισσότερα αντικείμενα που πωλούνται στις πιο προσεγμένες θέσεις. Βοηθά τους ιδιοκτήτες καταστημάτων να προτείνουν την προσφορά που ενθαρρύνει τους πελάτες να αυξήσουν τις δαπάνες τους. |
| Παροχείς Υπηρεσιών | Οι πάροχοι υπηρεσιών όπως οι βιομηχανίες κινητής τηλεφωνίας και κοινής ωφέλειας χρησιμοποιούν την εξόρυξη δεδομένων για να προβλέψουν τους λόγους που ένας πελάτης εγκαταλείπει την εταιρεία τους. Αναλύουν τις λεπτομέρειες τιμολόγησης, τις αλληλεπιδράσεις με την εξυπηρέτηση πελατών, τα παράπονα που γίνονται στην εταιρεία για να ορίσουν σε κάθε πελάτη μια βαθμολογία πιθανότητας και προσφέρουν κίνητρα. |
| E-commerce | Οι ιστότοποι ηλεκτρονικού εμπορίου χρησιμοποιούν την Εξόρυξη Δεδομένων για να προσφέρουν πολλαπλές και ανοδικές πωλήσεις μέσω των ιστότοπών τους. Ένα από τα πιο γνωστά ονόματα είναι Amazon, που χρησιμοποιούν τεχνικές εξόρυξης δεδομένων για να προσελκύσουν περισσότερους πελάτες στο ηλεκτρονικό τους κατάστημα. |
| Super Markets | Η εξόρυξη δεδομένων επιτρέπει στα σούπερ μάρκετ να αναπτύσσουν κανόνες για να προβλέψουν εάν οι αγοραστές τους ήταν πιθανό να περιμένουν. Αξιολογώντας το μοντέλο αγοράς τους, θα μπορούσαν να βρουν γυναίκες πελάτες που είναι πιθανότατα έγκυες. Μπορούν να αρχίσουν να στοχεύουν προϊόντα όπως πούδρα μωρών, κατάστημα μωρών, πάνες και ούτω καθεξής. |
| Διερεύνηση Εγκλήματος | Η Εξόρυξη Δεδομένων βοηθά τις υπηρεσίες διερεύνησης εγκλημάτων να αναπτύξουν αστυνομικό δυναμικό (πού είναι πιο πιθανό να συμβεί ένα έγκλημα και πότε;), ποιον να ψάξει σε μια συνοριακή διάβαση κ.λπ. |
| Βιοπληροφορική | Η Εξόρυξη Δεδομένων βοηθά στην εξόρυξη βιολογικών δεδομένων από τεράστια σύνολα δεδομένων που συγκεντρώνονται στη βιολογία και την ιατρική. |
Περίληψη
- Ορισμός Εξόρυξης Δεδομένων: Η Εξόρυξη Δεδομένων έχει να κάνει με την εξήγηση του παρελθόντος και την πρόβλεψη του μέλλοντος μέσω Ανάλυση δεδομένων.
- Η εξόρυξη δεδομένων βοηθά στην εξερεύνησηtracπληροφορίες από τεράστια σύνολα δεδομένων. Είναι η διαδικασία εξόρυξης γνώσης από δεδομένα.
- Η διαδικασία εξόρυξης δεδομένων περιλαμβάνει επιχειρηματική κατανόηση, κατανόηση δεδομένων, προετοιμασία δεδομένων, μοντελοποίηση, εξέλιξη, ανάπτυξη.
- Σημαντικές τεχνικές εξόρυξης δεδομένων είναι η ταξινόμηση, η ομαδοποίηση, η παλινδρόμηση, οι κανόνες συσχέτισης, η εξωτερική ανίχνευση, τα διαδοχικά μοτίβα και η πρόβλεψη
- R-γλώσσα Oracle Η εξόρυξη δεδομένων είναι εξέχοντα εργαλεία και τεχνικές εξόρυξης δεδομένων.
- Η τεχνική εξόρυξης δεδομένων βοηθά τις εταιρείες να λαμβάνουν πληροφορίες βασισμένες στη γνώση.
- Το κύριο μειονέκτημα της εξόρυξης δεδομένων είναι ότι πολλά λογισμικά ανάλυσης είναι δύσκολο να λειτουργήσουν και απαιτούν εκ των προτέρων εκπαίδευση για να εργαστούν.
- Η εξόρυξη δεδομένων χρησιμοποιείται σε διάφορους κλάδους, όπως οι Επικοινωνίες, οι Ασφάλειες, η Εκπαίδευση, η Μεταποίηση, οι Τράπεζες, το Λιανικό εμπόριο, οι πάροχοι υπηρεσιών, το ηλεκτρονικό εμπόριο, οι σούπερ μάρκετ Βιοπληροφορική.
