14. Mrz 2016

Statistik für Industrie, Wirtschaft und Technik – Fortsetzung

Fortsetzung des Gespräches zur überarbeiteten Lehrgangsreihe ST/QII

Quality AustriaThemenwechsel. Stichwort: “Big Data”… 
Michael Lucyshyn: Und die unweigerliche Stich-Antwort: “Big Brother” – eine recht häufige Assoziation, leider. Das ist andererseits auch faszinierend, weil es zeigt, wie sehr sich das Thema “Daten” aus dem “Elfenbeinturm”, in dem die “traditionellen Statistiker” gepokert haben, aufgemacht hat und in unserem Alltag angekommen ist, wenn man das einmal so plakativ ausdrücken will.

Quality AustriaThemen wie Snowden, NSA… 
Michael Lucyshyn: …ja, oder die Facebook-Klage von Max Schrems – das alles betont die negative Seite der Medaille. Geschieht auch gar nicht zu unrecht – es gibt eine Studie, die zeigt, wie ein entsprechend “trainierter” Algorithmus, den man mit 10 Facebook-likes füttert, die Persönlichkeitszüge eines Menschen besser vorhersagen kann als die Kolleginnen und Kollegen am Arbeitsplatz. Um auf die selbe Genauigkeit wie gute Freunde zu kommen, benötigt ein Computer etwa 70 likes, und mit 150 likes ist der Rechner so gut wie Familienmitglieder. Durchschnittliche Facebook-User kommen auf über 200 likes…

Quality AustriaDas ist auch ein wenig unheimlich… 
Michael Lucyshyn: Sicher – wer denkt beim “liken” schon an diesen möglichen Gebrauch der “Daten”? Da hinken unser Allgemein-Wissen und die gesetzlichen und ethischen Rahmenbedingungen der “Realität des Möglichen” wohl um Einiges hinterher. Wenn man die Geisteshaltung, die jemanden dazu antreibt, bei plus 15 Grad Außentemperatur Schneekanonen anzuwerfen (“Es wäre ein bisschen komisch, wenn das ganze Werkl steht und man nutzt es nicht”), auf Facebook und darüber hinaus extrapoliert, kann man sich natürlich schon auch Sorgen machen. Wobei - man braucht gar nicht Richtung Facebook zu denken, es genügt, sich das Wort “Vorratsdaten” durch den Kopf sausen zu lassen: Mit einer Dosis pessimistischer Phantasie fühlt man sich schnell an der Abzweigung zu einer möglichen “Road to Serfdom”.

Quality AustriaAber es gibt ja nicht nur negative Beispiele für Big Data! 
Michael Lucyshyn: Ganz im Gegenteil! Wie überall. Ein schön kurioser Fall sind die Litterati, die Müll photographieren, mit Geo-Tags und Zeit-Stempel versehen und diese Information online zur Verfügung stellen. Abgesehen vom Humor lassen sich die Idee und die Daten auch ganz praktisch nützen. So hat man zum Beispiel in San Francisco mit Hilfe dieser Informationen den Nachweis führen können, wie viele Zigarettenstummel von welcher Hersteller-Firma zu welcher Zeit an welchem Ort gefunden worden sind. Das hat die Argumentation der Stadtverwaltung für die Einhebung einer “Aufräumsteuer” auf Zigaretten-Packerl gestützt. Gerade in Themenfeldern wie Umwelt oder Gesundheit sind die positiven Anwendungsszenarien sehr vielversprechend. Ein methodisch und praktisch interessanter Aspekt dabei – durch “Big Data” verliert in bestimmten Szenarien die gefürchtete Stichprobengröße “eins” plötzlich ihren Schrecken.

Quality AustriaWie passt das Thema zur Statistik für Industrie, Wirtschaft & Technik? 
Michael Lucyshyn: Ich sehe es als eine spannende Erweiterung der “klassischen” statistischen Werkzeuge, wie wir sie zur Zeit in den Modulen von ST/QII anbieten. Darin beschäftigen wir uns ja in erster Linie mit “niedrig-dimensionalen” Daten, wo wir zu einer Zielgröße (z. B. einer Ziel-Charakteristik wie Festigkeit oder ähnlichem) eine gewisse Menge (n) an Daten sammeln und sie mit ein paar (p) Einflussgrößen (wie Druck, Temperatur und Dauer) verknüpfen wollen. Das machen wir, weil uns interessiert, wie die sich auf diese Zielgröße auswirken. Wir notieren also Festigkeitsdaten von n=25 Produkten, zu denen wir auch die p=3 Prozess-Parameter 25 mal aufgezeichnet haben. Wenn wir uns das als Excel-Tabelle vorstellen…

Quality Austria...oder als Matrix? 
Michael Lucyshyn: Ja, warum nicht? Das Logo für ST/QII hat schon einen Sinn…Da haben wir also 25 Zeilen in 4 Spalten – eine Spalte für die Festigkeitswerte und drei Spalten für die Prozess-Parameter. Hier ist n größer als p (25 > 3), und alle die “klassischen” Werkzeuge, wie wir sie in ST/QII behandeln, machen Sinn.

Quality AustriaWas ändert sich daran bei Big Data? 
Michael Lucyshyn: Jetzt kommen wir an die Definition von “Big”. Was heißt “Big”? Auf der Plauder-Ebene kommen einem da die “3V” in den Sinn: “Volume”, “Variety” und “Velocity”. Und das sind nicht die einzigen V´s… Auf einer etwas detaillierteren und “praktischeren” Ebene, um an das Beispiel von vorhin anzuschließen, könnte “Big” bedeuten, dass wir statt der geizigen 25 Stück lieber 25000 Stück messen, also die Anzahl der Zeilen in unserer Excel-Tabelle erhöhen. Die ist dann größer geworden, weil sie “länger” geworden ist: Big Data würde hier “tall data” meinen. In Wirklichkeit reden wir nicht über x-Tausend, sondern über Dinge wie Petabytes. Das kann die Präzision von unseren Aussagen erhöhen, stellt aber neue Anforderungen an Analysewerkzeuge, an die interpretierbare Darstellbarkeit der vorhandenen Information – und an die technische Handhabe der Daten an und für sich, also Fragen der Rechnerleistung und der zugehörigen Lösungen und Algorithmen.

Quality AustriaGibt es noch eine Interpretationsmöglichkeit? 
Michael Lucyshyn: Naja, wir können statt in die Länge auch in die Breite denken – und zusätzliche 997 Prozess-Parameter aufzeichnen. Da ist Big Data eher “wide data”. Jetzt gibt es zu n=25 Werten der Zielgröße auf einmal p=1000 Spalten mit Einflussgrößen, die wir z. B. entlang eines gesamten Produktions-Prozesses oder über verschiedene Aspekte eines Organismus aufzeichnen können.

Hier, wo p sehr viel größer als n ist, haben wir es mit “hoch dimensionalen” Daten zu tun. So etwas finden wir auch zum Beispiel bei genetischen Informationen, Gesundheitsdaten oder Daten aus Markt- und Kundenanalysen. Da werden Anwendungen aus der “klassischen” Statistik entweder nutzlos oder problematisch, und wir hätten gern zusätzliche Erweiterungen des Werkzeugkoffers.

Quality AustriaWas könnte das sein? 
Michael Lucyshyn: Einige Werkzeuge in diesem Bereich betreffen zum Beispiel die Frage nach der Klassifizierung – also zu welcher Gruppe bekannter Informationen eine neu hinzugekommene Beobachtung  am Besten passen könnte. Oder die Ansätze der Dimensions-Reduktion, womit man wieder zurück auf eine n>p Situation kommen möchte. Die Problematik wird verschärft, wenn wir zwar 1000 Einflussgrößen aufzeichnen, aber die Bestückung unserer Tabelle eher spärlich ausfällt. Das heißt, von den möglichen 25x1000 Excel-Kasterln sind “nur” 1756 befüllt.

Quality Austria1756?
Michael Lucyshyn: Nur ein Beispiel! Und wieder: Big Data meint natürlich viel, viel größere Zahlen – aber da tun wir uns schwer, eine gute Intuition zu entwickeln. Bei 1756 wissen wir wenigstens: Zufällig Mozarts Geburtsjahr.

Quality AustriaOk… – zurück zur fast leeren Tabelle – wo gibt es eine solche Situation? 
Michael Lucyshyn: So etwas kann man sich für eine Tabelle vorstellen, wo jede Zeile die Information über einen Kunden bedeutet, und jede Spalte ein Produkt aus dem Angebot eines Ladens. Denken wir an Webseiten-Hits – oder Netflix & Co: Jede Spalte wäre ein Filmtitel. Ein Kunde wird nicht alle Titel aus dem Katalog beziehen – aber wir alle kennen die Empfehlungen, die wir erhalten. Die beruhen auf “statistischen” Algorithmen, die Zusammenhänge aufspüren – wobei das Feld, das solche Algorithmen erfindet, doch einiges über das hinausgeht, was wir als “normale Statistik” erkennen. Ein komischer Zufall, wenn man da an Zufälle glauben will, ist ja, dass sich die modernen Nachfahren von Pascal und Fermat auch gern mit Spielen beschäftigen – nur sind es statt Münzen oder Würfel diesmal Schach oder Go.

Quality AustriaKünstliche Intelligenz? 
Michael Lucyshyn: Diese Richtung, ja. Einerseits kommen dabei Instrumente zur Anwendung, die dazu dienen, Strukturen in den Daten aufzuspüren – also eher auf der explorativen Seite der Datenanalyse angesiedelt sind. Dem stehen Methoden gegenüber, die uns helfen, Zusammenhänge zwischen Faktoren herzustellen oder auch ohne genaue Kenntnis der Ursache-Wirkungs-Struktur halbwegs brauchbare Vorhersagen zu machen. Das Grundproblem ist: Für “Big Data” suchen wir eine andere Herangehensweise als für einen Zettel mit Stichproben-Aufzeichnungen. Wie sagen die Engländer: horses for courses…

Quality AustriaJeder Topf braucht seinen Deckel! 
Michael Lucyshyn: Ja! Am Deckel für den Big Data Topf arbeiten wir noch – bis dahin kann ich nur anregen: Es zahlt sich aus, auch einmal die “normalen” Instrumente, wie wir sie in ST/QII vorstellen, ausprobiert zu haben: Da gibt es nach wie vor sehr lohnende Anwendungsmöglichkeiten!

Quality AustriaNoch eine persönliche Frage - einige Leserinnen und Leser deiner Artikel zum Thema Statistik und Six Sigma geben das Feedback, dass sie ein wenig… 
Michael Lucyshyn: …schräg sind?

Quality AustriaJa.
Michael Lucyshyn: Was soll ich dazu sagen? Feedback ist immer gut. Aber nicht einmal Wahnsinnige können – ganz – aus ihrer Haut…

Autor

Netzwerkpartner*in

Herr DI Michael Lucyshyn

Netzwerkpartner, Produktexperte Six Sigma und Statistik

Ansprechpartner

Team

Frau Mag. Dr. Anni Koubek

Prokuristin Innovation, Business Development Zertifizierung Qualität

Weitere News & Events

Immer topaktuell informiert

30. Sep 2022

Einkaufen von Medizin­produkten im Gesundheits­wesen

Welche Anforderungen aus normativer ­Sicht gelten

Mehr erfahren
28. Sep 2022

Junge Talente fördern – Ideen pushen!

Jetzt als „Qualitäts-Talent“ und „Qualitäts-Champion“ bewerben

Mehr erfahren
26. Sep 2022

Was bedeuten die neuen Berichts­pflichten (CSRD) für Unternehmen?

Gastbeitrag von Mag. Anneli Fischer, MSc

Mehr erfahren
23. Sep 2022

Qualitäts­management in medizinischen Laboratorien

ISO 15189 – eine Norm im Spannungsfeld von Medizin und Technik

Mehr erfahren
22. Sep 2022

Management­systeme von A bis Z

Auffrischung für Ihr Wissen gefällig?

Mehr erfahren
19. Sep 2022

Wie man zu hoher (Unternehmens-) Qualität kommt

FH Campus Wien gibt Tipps für den Weg zur Exzellenz

Mehr erfahren
16. Sep 2022

Neue Kooperation mit ENFIT für höchste Standards

HQF-Zertifizierung nach ENFIT Standard innerhalb von Lieferketten

Mehr erfahren
12. Sep 2022

Lieferketten­gesetz – Jetzt Know-how aneignen!

Gastbeitrag von Mag. Anneli Fischer, MSc

Mehr erfahren
06. Sep 2022

Beruflicher Erfolg durch akkreditiere Personen­zertifikate

Was Sie über Akkreditierungen wissen sollten

Mehr erfahren
05. Sep 2022

Frischer Schwung für Österreichs Organisationen: Erweitertes Ausbildungs­angebot

Ausblick Kursprogramm 2023 der Quality Austria

Mehr erfahren
02. Sep 2022

Support der Digitalisierung durch das Integrierte Management­system

Artikelserie von 3 Experten: Teil 2

Mehr erfahren
01. Sep 2022

Hämmer, Nägel und KI

Gastbeitrag von Mischa Lucyshyn

Mehr erfahren
+43 732 34 23 22