14. Mrz 2016

Statistik für Industrie, Wirtschaft und Technik – Fortsetzung

Fortsetzung des Gespräches zur überarbeiteten Lehrgangsreihe ST/QII

Quality AustriaThemenwechsel. Stichwort: “Big Data”… 
Michael Lucyshyn: Und die unweigerliche Stich-Antwort: “Big Brother” – eine recht häufige Assoziation, leider. Das ist andererseits auch faszinierend, weil es zeigt, wie sehr sich das Thema “Daten” aus dem “Elfenbeinturm”, in dem die “traditionellen Statistiker” gepokert haben, aufgemacht hat und in unserem Alltag angekommen ist, wenn man das einmal so plakativ ausdrücken will.

Quality AustriaThemen wie Snowden, NSA… 
Michael Lucyshyn: …ja, oder die Facebook-Klage von Max Schrems – das alles betont die negative Seite der Medaille. Geschieht auch gar nicht zu unrecht – es gibt eine Studie, die zeigt, wie ein entsprechend “trainierter” Algorithmus, den man mit 10 Facebook-likes füttert, die Persönlichkeitszüge eines Menschen besser vorhersagen kann als die Kolleginnen und Kollegen am Arbeitsplatz. Um auf die selbe Genauigkeit wie gute Freunde zu kommen, benötigt ein Computer etwa 70 likes, und mit 150 likes ist der Rechner so gut wie Familienmitglieder. Durchschnittliche Facebook-User kommen auf über 200 likes…

Quality AustriaDas ist auch ein wenig unheimlich… 
Michael Lucyshyn: Sicher – wer denkt beim “liken” schon an diesen möglichen Gebrauch der “Daten”? Da hinken unser Allgemein-Wissen und die gesetzlichen und ethischen Rahmenbedingungen der “Realität des Möglichen” wohl um Einiges hinterher. Wenn man die Geisteshaltung, die jemanden dazu antreibt, bei plus 15 Grad Außentemperatur Schneekanonen anzuwerfen (“Es wäre ein bisschen komisch, wenn das ganze Werkl steht und man nutzt es nicht”), auf Facebook und darüber hinaus extrapoliert, kann man sich natürlich schon auch Sorgen machen. Wobei - man braucht gar nicht Richtung Facebook zu denken, es genügt, sich das Wort “Vorratsdaten” durch den Kopf sausen zu lassen: Mit einer Dosis pessimistischer Phantasie fühlt man sich schnell an der Abzweigung zu einer möglichen “Road to Serfdom”.

Quality AustriaAber es gibt ja nicht nur negative Beispiele für Big Data! 
Michael Lucyshyn: Ganz im Gegenteil! Wie überall. Ein schön kurioser Fall sind die Litterati, die Müll photographieren, mit Geo-Tags und Zeit-Stempel versehen und diese Information online zur Verfügung stellen. Abgesehen vom Humor lassen sich die Idee und die Daten auch ganz praktisch nützen. So hat man zum Beispiel in San Francisco mit Hilfe dieser Informationen den Nachweis führen können, wie viele Zigarettenstummel von welcher Hersteller-Firma zu welcher Zeit an welchem Ort gefunden worden sind. Das hat die Argumentation der Stadtverwaltung für die Einhebung einer “Aufräumsteuer” auf Zigaretten-Packerl gestützt. Gerade in Themenfeldern wie Umwelt oder Gesundheit sind die positiven Anwendungsszenarien sehr vielversprechend. Ein methodisch und praktisch interessanter Aspekt dabei – durch “Big Data” verliert in bestimmten Szenarien die gefürchtete Stichprobengröße “eins” plötzlich ihren Schrecken.

Quality AustriaWie passt das Thema zur Statistik für Industrie, Wirtschaft & Technik? 
Michael Lucyshyn: Ich sehe es als eine spannende Erweiterung der “klassischen” statistischen Werkzeuge, wie wir sie zur Zeit in den Modulen von ST/QII anbieten. Darin beschäftigen wir uns ja in erster Linie mit “niedrig-dimensionalen” Daten, wo wir zu einer Zielgröße (z. B. einer Ziel-Charakteristik wie Festigkeit oder ähnlichem) eine gewisse Menge (n) an Daten sammeln und sie mit ein paar (p) Einflussgrößen (wie Druck, Temperatur und Dauer) verknüpfen wollen. Das machen wir, weil uns interessiert, wie die sich auf diese Zielgröße auswirken. Wir notieren also Festigkeitsdaten von n=25 Produkten, zu denen wir auch die p=3 Prozess-Parameter 25 mal aufgezeichnet haben. Wenn wir uns das als Excel-Tabelle vorstellen…

Quality Austria...oder als Matrix? 
Michael Lucyshyn: Ja, warum nicht? Das Logo für ST/QII hat schon einen Sinn…Da haben wir also 25 Zeilen in 4 Spalten – eine Spalte für die Festigkeitswerte und drei Spalten für die Prozess-Parameter. Hier ist n größer als p (25 > 3), und alle die “klassischen” Werkzeuge, wie wir sie in ST/QII behandeln, machen Sinn.

Quality AustriaWas ändert sich daran bei Big Data? 
Michael Lucyshyn: Jetzt kommen wir an die Definition von “Big”. Was heißt “Big”? Auf der Plauder-Ebene kommen einem da die “3V” in den Sinn: “Volume”, “Variety” und “Velocity”. Und das sind nicht die einzigen V´s… Auf einer etwas detaillierteren und “praktischeren” Ebene, um an das Beispiel von vorhin anzuschließen, könnte “Big” bedeuten, dass wir statt der geizigen 25 Stück lieber 25000 Stück messen, also die Anzahl der Zeilen in unserer Excel-Tabelle erhöhen. Die ist dann größer geworden, weil sie “länger” geworden ist: Big Data würde hier “tall data” meinen. In Wirklichkeit reden wir nicht über x-Tausend, sondern über Dinge wie Petabytes. Das kann die Präzision von unseren Aussagen erhöhen, stellt aber neue Anforderungen an Analysewerkzeuge, an die interpretierbare Darstellbarkeit der vorhandenen Information – und an die technische Handhabe der Daten an und für sich, also Fragen der Rechnerleistung und der zugehörigen Lösungen und Algorithmen.

Quality AustriaGibt es noch eine Interpretationsmöglichkeit? 
Michael Lucyshyn: Naja, wir können statt in die Länge auch in die Breite denken – und zusätzliche 997 Prozess-Parameter aufzeichnen. Da ist Big Data eher “wide data”. Jetzt gibt es zu n=25 Werten der Zielgröße auf einmal p=1000 Spalten mit Einflussgrößen, die wir z. B. entlang eines gesamten Produktions-Prozesses oder über verschiedene Aspekte eines Organismus aufzeichnen können.

Hier, wo p sehr viel größer als n ist, haben wir es mit “hoch dimensionalen” Daten zu tun. So etwas finden wir auch zum Beispiel bei genetischen Informationen, Gesundheitsdaten oder Daten aus Markt- und Kundenanalysen. Da werden Anwendungen aus der “klassischen” Statistik entweder nutzlos oder problematisch, und wir hätten gern zusätzliche Erweiterungen des Werkzeugkoffers.

Quality AustriaWas könnte das sein? 
Michael Lucyshyn: Einige Werkzeuge in diesem Bereich betreffen zum Beispiel die Frage nach der Klassifizierung – also zu welcher Gruppe bekannter Informationen eine neu hinzugekommene Beobachtung  am Besten passen könnte. Oder die Ansätze der Dimensions-Reduktion, womit man wieder zurück auf eine n>p Situation kommen möchte. Die Problematik wird verschärft, wenn wir zwar 1000 Einflussgrößen aufzeichnen, aber die Bestückung unserer Tabelle eher spärlich ausfällt. Das heißt, von den möglichen 25x1000 Excel-Kasterln sind “nur” 1756 befüllt.

Quality Austria1756?
Michael Lucyshyn: Nur ein Beispiel! Und wieder: Big Data meint natürlich viel, viel größere Zahlen – aber da tun wir uns schwer, eine gute Intuition zu entwickeln. Bei 1756 wissen wir wenigstens: Zufällig Mozarts Geburtsjahr.

Quality AustriaOk… – zurück zur fast leeren Tabelle – wo gibt es eine solche Situation? 
Michael Lucyshyn: So etwas kann man sich für eine Tabelle vorstellen, wo jede Zeile die Information über einen Kunden bedeutet, und jede Spalte ein Produkt aus dem Angebot eines Ladens. Denken wir an Webseiten-Hits – oder Netflix & Co: Jede Spalte wäre ein Filmtitel. Ein Kunde wird nicht alle Titel aus dem Katalog beziehen – aber wir alle kennen die Empfehlungen, die wir erhalten. Die beruhen auf “statistischen” Algorithmen, die Zusammenhänge aufspüren – wobei das Feld, das solche Algorithmen erfindet, doch einiges über das hinausgeht, was wir als “normale Statistik” erkennen. Ein komischer Zufall, wenn man da an Zufälle glauben will, ist ja, dass sich die modernen Nachfahren von Pascal und Fermat auch gern mit Spielen beschäftigen – nur sind es statt Münzen oder Würfel diesmal Schach oder Go.

Quality AustriaKünstliche Intelligenz? 
Michael Lucyshyn: Diese Richtung, ja. Einerseits kommen dabei Instrumente zur Anwendung, die dazu dienen, Strukturen in den Daten aufzuspüren – also eher auf der explorativen Seite der Datenanalyse angesiedelt sind. Dem stehen Methoden gegenüber, die uns helfen, Zusammenhänge zwischen Faktoren herzustellen oder auch ohne genaue Kenntnis der Ursache-Wirkungs-Struktur halbwegs brauchbare Vorhersagen zu machen. Das Grundproblem ist: Für “Big Data” suchen wir eine andere Herangehensweise als für einen Zettel mit Stichproben-Aufzeichnungen. Wie sagen die Engländer: horses for courses…

Quality AustriaJeder Topf braucht seinen Deckel! 
Michael Lucyshyn: Ja! Am Deckel für den Big Data Topf arbeiten wir noch – bis dahin kann ich nur anregen: Es zahlt sich aus, auch einmal die “normalen” Instrumente, wie wir sie in ST/QII vorstellen, ausprobiert zu haben: Da gibt es nach wie vor sehr lohnende Anwendungsmöglichkeiten!

Quality AustriaNoch eine persönliche Frage - einige Leserinnen und Leser deiner Artikel zum Thema Statistik und Six Sigma geben das Feedback, dass sie ein wenig… 
Michael Lucyshyn: …schräg sind?

Quality AustriaJa.
Michael Lucyshyn: Was soll ich dazu sagen? Feedback ist immer gut. Aber nicht einmal Wahnsinnige können – ganz – aus ihrer Haut…

Autor

Netzwerkpartner*in

Herr DI Michael Lucyshyn

Netzwerkpartner, Produktexperte Six Sigma und Statistik

Ansprechpartner

Team

Frau Mag. Dr. Anni Koubek

Prokuristin Branchenmanagement Medizinprodukte

Weitere News & Events

Immer topaktuell informiert

24. Apr 2024

Mit diesen 5 Tipps haben Unternehmen Berichts­pflichten im Griff

Auf bestehenden Systemen aufbauen:

Mehr erfahren
23. Apr 2024

Klimawandel rückt in den Fokus der Management­system­standards

Neue ISO Anforderung:

Mehr erfahren
22. Apr 2024

Welttag der Erde: Ein Aufruf zum Handeln für unseren Planeten

Am 22. April feiern Menschen weltweit den Welttag der Erde.

Mehr erfahren
18. Apr 2024

Überdurch­schnittlich hohe Weiter­empfehlungs­rate für Quality Austria

Gemeinsam Höchstleistungen erbringen:

Mehr erfahren
16. Apr 2024

Treibhausgase bilanzieren – wozu?

Was Sie jetzt wissen sollten

Mehr erfahren
07. Apr 2024

Weltgesundheitstag

„My health, my right“

Mehr erfahren
29. Mrz 2024

ESG-Management

Updates und Neuigkeiten rund um die 3 Säulen der Nachhaltigkeit

Mehr erfahren
28. Mrz 2024

ISO 14001 wird überarbeitet – was erwartet uns?

Neue Revision geplant

Mehr erfahren
26. Mrz 2024

Innovation? Sicher – und mit System

Innovationsmanagement: Kostenloses Webinar und Zertifikatslehrgang

Mehr erfahren
25. Mrz 2024

Machen Sie die Qualifikationen Ihrer Aus- und Weiter­bildungen einzigartig!

Kostenfreies Webinar mit NKS

Mehr erfahren
22. Mrz 2024

Mit System in die Zukunft

Neue qualityaustria Leistungsübersicht 2024 erschienen

Mehr erfahren
20. Mrz 2024

ESG: Must-Have mit Sinn

Warum ESG-Weiterbildung immer wichtiger wird

Mehr erfahren
+43 732 34 23 22