Data Mining – Manipulation durch Daten

Wer kennt es nicht? Du suchst etwas im Internet und bekommst Tage später förmlich maßgeschneiderte Werbungen eingeblendet. Was genau steckt hinter dieser neuen Art der Werbung und können die Unternehmen tatsächlich unsere Gedanken lesen?

Ein Werkzeug solcher „Werbetricks“ ist unter anderem Data Mining. In diesem Blogeintrag wird dir die Funktionsweise von Data Minig erklärt.

Doch was ist Data Mining?

Unter Data Mining versteht man das Analyseverfahren des „Knowledge Discovery in Databases-Prozesses“, welches hilft, automatisch systematische Anwendungen statistischer Methoden auf große Datenmengen anzusetzen, um vorher unbekannte Informationen oder Zusammenhänge zu gewinnen. Mit den gewonnenen Informationen lassen sich vorher unklare Zusammenhänge interpretieren oder gar präzise Vorhersagen machen. Data Mining kann mit verschieden Methoden angewendet werden, wie zum Beispiel der Assoziationsanalyse, Klassifikationsanalyse, Clustering und der Ausreißerkennung. Doch wie kommen die Unternehmen eigentlich an die Daten? Ganz einfach! Sie sammeln die Daten von jedem einzelnen Einkauf an der Kasse oder verwenden zusätzliche Tricks, wie die Payback Karte oder über soziale Netzwerke. Anhand von simplen Beispielen werde ich euch erklären, wie einige dieser Methoden funktionieren.

Assoziationsanalyse

Die Assoziationsanalyse stellt Abhängigkeiten zwischen Objekten in einem Datenbestand dar. Diese Methode wird oft bei Warenkorbanalysen angewendet. Ein Beispiel für eine Assoziationsanalyse ist, wenn Kunden ein Hemd kaufen, dann kaufen 70% auch eine Krawatte. Diese Methode ist auch oftmals in Online Shops verbreitet. Wenn der Kunde im Online-Shop einkauft, bekommt er, nachdem er Waren in den Warenkorb gelegt hat, angezeigt, was andere Kunden außerdem noch gekauft haben. Unternehmen erreichen so mit diesem Verfahren das Ziel, für Produkte zu werben, die zu dem gewünschten Artikel benötigt werden und der Kunde eventuell zusätzliche Artikel kauft, obwohl er zuvor nicht beabsichtigte, dieses Produkt zu erweben.

Klassifikationsanalyse

Bei den Klassifikationsanalysen werden Objekte verschiedenen Klassen und Kategorien zugeordnet. Die Zuordnungen geschehen durch Klasseneigenschaften und Objektmerkmalen, die in den Datensätzen vorhanden sind. Wurde ein Klassifikationsmodell entwickelt, kann man nun die Klassenzugehörigkeit von neuen Objekten vorhersagen. Dies kann mit Hilfe von Entscheidungsbäumen, Bayes Klassifikation, Neuronale Netze und dem K-nächste-Nachbarn-Verfahren geschehen. Ein einfaches Beispiel dafür wäre eine Kreditvergabe einer Bank, wie in der folgenden Abbildung 1 zu sehen ist.

Kreditverhabe_Kassifikationsanalyse

Abbildung 1: Klassifikationsbaum

Clustering

Bei dem Clustering versucht man Ähnlichkeitsstrukturen zwischen den Objekten in Gruppen aufzuteilen oder zu homogenen Gruppen zusammenzufassen. Im Gegensatz zu den Klassifikationsanalysen sind die Klassen der Objekte vorher nicht bekannt. Die Cluster werden so gebildet, dass die Ähnlichkeit der Objekte in einer Klasse groß und die Ähnlichkeit zwischen den Objekten in verschiedenen Klassen möglichst gering sind.

Tabelle_Cluster

Abbildung 2: Cluster Tabelle

In der Abbildung 2 werden die Einkaufe von drei Personen in Gruppen zusammengefasst.  Mit dem Clusteringverfahren würden nun zwei Gruppen enstehen. Person 1 und Person 2 bilden die erste Gruppe, da die Ähnlichkeit von dem Konsum der Personen möglichst nahe liegt und Person3 bildet die zweite Gruppe, da der Konsum sich stark unterscheidet. Die Anzahl der gebildeten Cluster und Eigenschaften können bei einer größeren Analyse mit z.B 200 Personen nicht genau vorhergesagt werden und Person 1 & 2 würden mit hoher Wahrscheinlichkeit nicht mehr zusammen in einem Cluster bestehen. Mit der Methode könnte zum Beispiel die Struktur eines Supermarktes optimert werden.

Die Gefahren des Data Minings

Durch die großen Datenmengen, die überall gesammelt werden, unter anderem auch in sozialen Netzwerken wie Facebook, die heutzutage über Milliarden an Mitglieder besitzen und stetig weiter wachsen, besteht auch eine Gefahr für die Nutzer. Durch das tägliche Benutzen dieser Netzwerke und der Verbreitung von Informationen oder Betätigungen von „Likes“ können ebenso verwertbare Informationen gewonnen werden und die Benutzer machen sich somit durchschaubar für die Betreiber. Manipulation durch Werbung oder vorgeschlagenen Beiträgen auf den Sozialen Netzwerken sind die Folgen. Durch die persönlichen Informationen, die durch die Benutzer preisgeben werden, machen sie sich durchschaubar. Dies steht auch oft im Konflikt mit dem Datenschutz, da die Legalität der Datenquellen fragwürdig ist. Die Nutzung von Data Mining wird sogar von Obama und Romney bei den Präsidentschaftswahlen angewendet. Es werden Millionen Dollar für Informationen über Wähler investiert, um diese dann mit den gewonnenen Ergebnissen bei den Wahlveranstaltungen zu beeinflussen.

Fazit

Data Mining ist ein fester Bestandteil unseres modernen Computer abhängigen Systems. Data Mining Prozesse helfen Unternehmen und der Industrie sich zu optimieren. Dies fördert auch die Wirtschaft. Betriebe können ihre Produkte besser verkaufen und die Kunden bekommen vielseitige, fast maßgeschneiderte Angebote, die das Einkaufen erleichtern. Doch es hilft uns nicht nur beim Ein- oder Verkaufen von Gütern, sondern kann uns sogar schützen. Zum Beispiel vor Verschuldung durch einen Kredit bei der Bank, den man nicht zurückzahlen könnte. Wissenschaftler der Kriminaltechnik versuchen durch Data Mining zusätzlich Verbrechen vorzubeugen und Zusammenhänge schneller und zielgerichteter zu erkennen. Doch es verbergen sich auch negative Seiten hinter dem Data Mining. Laut Kritikern sollen die Datensätze, auf die es angewendet wird oft an Spionage grenzen. Die enorme Menge an Daten, die täglich über die Menschen gespeichert werden, können von keinem mehr überprüft werden. Man hat keine Macht mehr darüber ob man seine Daten preisgeben will oder nicht, denn fast jede Handlung kann mittlerweile erfasst und zu Diensten von Unternehmen verwendet und verarbeitet werden. In der Zeit von Computer, Internet und Smartphones ist es fast unmöglich, sich dagegen zu schützen, denn nahezu jeder Mensch ist darauf angewiesen und abhängig. Man sollte mit offenen Augen durchs Leben gehen und versuchen gewissenhafter mit seinen Daten umzugehen.Viele Dinge mit einem kritischen Auge zu betrachten ist unumgänglich in einer Zeit, in der Mensch vieles nicht mehr selbst steuern und kontrollieren kann.

Falls dich dieser Beitrag zum Nachdenken angeregt hat, kannst du dich hier gerne zusätzlich informieren.

Quellen

http://winf-wiki.fhslabs.ch/index.php?title=Data_Mining

http://wissensexploration.de/datamining-kdd-aufgaben-methoden.php

https://www.mindup.de/data-mining-in-der-praxis.html

http://www.sueddeutsche.de/politik/data-mining-im-wahlkampf-werben-um-den-glaesernen-waehler-1.1511298

https://entwickler.de/online/datenbanken/data-mining-typische-verfahren-und-praxisbeispiele-115010.html

Advertisements

Eine Antwort zu “Data Mining – Manipulation durch Daten

  1. Pingback: Prozessverbesserung durch Process Mining? | E-Business·

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s