14. Mrz 2016

Statistik für Industrie, Wirtschaft und Technik – Fortsetzung

Fortsetzung des Gespräches zur überarbeiteten Lehrgangsreihe ST/QII

Quality AustriaThemenwechsel. Stichwort: “Big Data”… 
Michael Lucyshyn: Und die unweigerliche Stich-Antwort: “Big Brother” – eine recht häufige Assoziation, leider. Das ist andererseits auch faszinierend, weil es zeigt, wie sehr sich das Thema “Daten” aus dem “Elfenbeinturm”, in dem die “traditionellen Statistiker” gepokert haben, aufgemacht hat und in unserem Alltag angekommen ist, wenn man das einmal so plakativ ausdrücken will.

Quality AustriaThemen wie Snowden, NSA… 
Michael Lucyshyn: …ja, oder die Facebook-Klage von Max Schrems – das alles betont die negative Seite der Medaille. Geschieht auch gar nicht zu unrecht – es gibt eine Studie, die zeigt, wie ein entsprechend “trainierter” Algorithmus, den man mit 10 Facebook-likes füttert, die Persönlichkeitszüge eines Menschen besser vorhersagen kann als die Kolleginnen und Kollegen am Arbeitsplatz. Um auf die selbe Genauigkeit wie gute Freunde zu kommen, benötigt ein Computer etwa 70 likes, und mit 150 likes ist der Rechner so gut wie Familienmitglieder. Durchschnittliche Facebook-User kommen auf über 200 likes…

Quality AustriaDas ist auch ein wenig unheimlich… 
Michael Lucyshyn: Sicher – wer denkt beim “liken” schon an diesen möglichen Gebrauch der “Daten”? Da hinken unser Allgemein-Wissen und die gesetzlichen und ethischen Rahmenbedingungen der “Realität des Möglichen” wohl um Einiges hinterher. Wenn man die Geisteshaltung, die jemanden dazu antreibt, bei plus 15 Grad Außentemperatur Schneekanonen anzuwerfen (“Es wäre ein bisschen komisch, wenn das ganze Werkl steht und man nutzt es nicht”), auf Facebook und darüber hinaus extrapoliert, kann man sich natürlich schon auch Sorgen machen. Wobei - man braucht gar nicht Richtung Facebook zu denken, es genügt, sich das Wort “Vorratsdaten” durch den Kopf sausen zu lassen: Mit einer Dosis pessimistischer Phantasie fühlt man sich schnell an der Abzweigung zu einer möglichen “Road to Serfdom”.

Quality AustriaAber es gibt ja nicht nur negative Beispiele für Big Data! 
Michael Lucyshyn: Ganz im Gegenteil! Wie überall. Ein schön kurioser Fall sind die Litterati, die Müll photographieren, mit Geo-Tags und Zeit-Stempel versehen und diese Information online zur Verfügung stellen. Abgesehen vom Humor lassen sich die Idee und die Daten auch ganz praktisch nützen. So hat man zum Beispiel in San Francisco mit Hilfe dieser Informationen den Nachweis führen können, wie viele Zigarettenstummel von welcher Hersteller-Firma zu welcher Zeit an welchem Ort gefunden worden sind. Das hat die Argumentation der Stadtverwaltung für die Einhebung einer “Aufräumsteuer” auf Zigaretten-Packerl gestützt. Gerade in Themenfeldern wie Umwelt oder Gesundheit sind die positiven Anwendungsszenarien sehr vielversprechend. Ein methodisch und praktisch interessanter Aspekt dabei – durch “Big Data” verliert in bestimmten Szenarien die gefürchtete Stichprobengröße “eins” plötzlich ihren Schrecken.

Quality AustriaWie passt das Thema zur Statistik für Industrie, Wirtschaft & Technik? 
Michael Lucyshyn: Ich sehe es als eine spannende Erweiterung der “klassischen” statistischen Werkzeuge, wie wir sie zur Zeit in den Modulen von ST/QII anbieten. Darin beschäftigen wir uns ja in erster Linie mit “niedrig-dimensionalen” Daten, wo wir zu einer Zielgröße (z. B. einer Ziel-Charakteristik wie Festigkeit oder ähnlichem) eine gewisse Menge (n) an Daten sammeln und sie mit ein paar (p) Einflussgrößen (wie Druck, Temperatur und Dauer) verknüpfen wollen. Das machen wir, weil uns interessiert, wie die sich auf diese Zielgröße auswirken. Wir notieren also Festigkeitsdaten von n=25 Produkten, zu denen wir auch die p=3 Prozess-Parameter 25 mal aufgezeichnet haben. Wenn wir uns das als Excel-Tabelle vorstellen…

Quality Austria...oder als Matrix? 
Michael Lucyshyn: Ja, warum nicht? Das Logo für ST/QII hat schon einen Sinn…Da haben wir also 25 Zeilen in 4 Spalten – eine Spalte für die Festigkeitswerte und drei Spalten für die Prozess-Parameter. Hier ist n größer als p (25 > 3), und alle die “klassischen” Werkzeuge, wie wir sie in ST/QII behandeln, machen Sinn.

Quality AustriaWas ändert sich daran bei Big Data? 
Michael Lucyshyn: Jetzt kommen wir an die Definition von “Big”. Was heißt “Big”? Auf der Plauder-Ebene kommen einem da die “3V” in den Sinn: “Volume”, “Variety” und “Velocity”. Und das sind nicht die einzigen V´s… Auf einer etwas detaillierteren und “praktischeren” Ebene, um an das Beispiel von vorhin anzuschließen, könnte “Big” bedeuten, dass wir statt der geizigen 25 Stück lieber 25000 Stück messen, also die Anzahl der Zeilen in unserer Excel-Tabelle erhöhen. Die ist dann größer geworden, weil sie “länger” geworden ist: Big Data würde hier “tall data” meinen. In Wirklichkeit reden wir nicht über x-Tausend, sondern über Dinge wie Petabytes. Das kann die Präzision von unseren Aussagen erhöhen, stellt aber neue Anforderungen an Analysewerkzeuge, an die interpretierbare Darstellbarkeit der vorhandenen Information – und an die technische Handhabe der Daten an und für sich, also Fragen der Rechnerleistung und der zugehörigen Lösungen und Algorithmen.

Quality AustriaGibt es noch eine Interpretationsmöglichkeit? 
Michael Lucyshyn: Naja, wir können statt in die Länge auch in die Breite denken – und zusätzliche 997 Prozess-Parameter aufzeichnen. Da ist Big Data eher “wide data”. Jetzt gibt es zu n=25 Werten der Zielgröße auf einmal p=1000 Spalten mit Einflussgrößen, die wir z. B. entlang eines gesamten Produktions-Prozesses oder über verschiedene Aspekte eines Organismus aufzeichnen können.

Hier, wo p sehr viel größer als n ist, haben wir es mit “hoch dimensionalen” Daten zu tun. So etwas finden wir auch zum Beispiel bei genetischen Informationen, Gesundheitsdaten oder Daten aus Markt- und Kundenanalysen. Da werden Anwendungen aus der “klassischen” Statistik entweder nutzlos oder problematisch, und wir hätten gern zusätzliche Erweiterungen des Werkzeugkoffers.

Quality AustriaWas könnte das sein? 
Michael Lucyshyn: Einige Werkzeuge in diesem Bereich betreffen zum Beispiel die Frage nach der Klassifizierung – also zu welcher Gruppe bekannter Informationen eine neu hinzugekommene Beobachtung  am Besten passen könnte. Oder die Ansätze der Dimensions-Reduktion, womit man wieder zurück auf eine n>p Situation kommen möchte. Die Problematik wird verschärft, wenn wir zwar 1000 Einflussgrößen aufzeichnen, aber die Bestückung unserer Tabelle eher spärlich ausfällt. Das heißt, von den möglichen 25x1000 Excel-Kasterln sind “nur” 1756 befüllt.

Quality Austria1756?
Michael Lucyshyn: Nur ein Beispiel! Und wieder: Big Data meint natürlich viel, viel größere Zahlen – aber da tun wir uns schwer, eine gute Intuition zu entwickeln. Bei 1756 wissen wir wenigstens: Zufällig Mozarts Geburtsjahr.

Quality AustriaOk… – zurück zur fast leeren Tabelle – wo gibt es eine solche Situation? 
Michael Lucyshyn: So etwas kann man sich für eine Tabelle vorstellen, wo jede Zeile die Information über einen Kunden bedeutet, und jede Spalte ein Produkt aus dem Angebot eines Ladens. Denken wir an Webseiten-Hits – oder Netflix & Co: Jede Spalte wäre ein Filmtitel. Ein Kunde wird nicht alle Titel aus dem Katalog beziehen – aber wir alle kennen die Empfehlungen, die wir erhalten. Die beruhen auf “statistischen” Algorithmen, die Zusammenhänge aufspüren – wobei das Feld, das solche Algorithmen erfindet, doch einiges über das hinausgeht, was wir als “normale Statistik” erkennen. Ein komischer Zufall, wenn man da an Zufälle glauben will, ist ja, dass sich die modernen Nachfahren von Pascal und Fermat auch gern mit Spielen beschäftigen – nur sind es statt Münzen oder Würfel diesmal Schach oder Go.

Quality AustriaKünstliche Intelligenz? 
Michael Lucyshyn: Diese Richtung, ja. Einerseits kommen dabei Instrumente zur Anwendung, die dazu dienen, Strukturen in den Daten aufzuspüren – also eher auf der explorativen Seite der Datenanalyse angesiedelt sind. Dem stehen Methoden gegenüber, die uns helfen, Zusammenhänge zwischen Faktoren herzustellen oder auch ohne genaue Kenntnis der Ursache-Wirkungs-Struktur halbwegs brauchbare Vorhersagen zu machen. Das Grundproblem ist: Für “Big Data” suchen wir eine andere Herangehensweise als für einen Zettel mit Stichproben-Aufzeichnungen. Wie sagen die Engländer: horses for courses…

Quality AustriaJeder Topf braucht seinen Deckel! 
Michael Lucyshyn: Ja! Am Deckel für den Big Data Topf arbeiten wir noch – bis dahin kann ich nur anregen: Es zahlt sich aus, auch einmal die “normalen” Instrumente, wie wir sie in ST/QII vorstellen, ausprobiert zu haben: Da gibt es nach wie vor sehr lohnende Anwendungsmöglichkeiten!

Quality AustriaNoch eine persönliche Frage - einige Leserinnen und Leser deiner Artikel zum Thema Statistik und Six Sigma geben das Feedback, dass sie ein wenig… 
Michael Lucyshyn: …schräg sind?

Quality AustriaJa.
Michael Lucyshyn: Was soll ich dazu sagen? Feedback ist immer gut. Aber nicht einmal Wahnsinnige können – ganz – aus ihrer Haut…

Autor

Netzwerkpartner*in

Herr DI Michael Lucyshyn

Netzwerkpartner, Produktexperte Six Sigma und Statistik

Ansprechpartner

Team

Frau Mag. Dr. Anni Koubek

Prokuristin Innovation, Business Development Zertifizierung Qualität

Weitere News & Events

Immer topaktuell informiert

01. Feb 2023

Harald Erkinger ist neuer Geschäftsführer der CIS

Erfahrener IT- und Cybersicherheits-Experte Harald Erkinger ist neuer CEO.

Mehr erfahren
24. Jan 2023

Staatspreis Unternehmens­qualität 2023 zeichnet wieder exzellente Betriebe aus

Call for Entries: Einreichfrist läuft bis 15. März 2023

Mehr erfahren
23. Nov 2023

Event: 9. qualityaustria Nachhaltigkeitsforum

Das Event findet am 23. November 2023 virtuell statt.

Mehr erfahren
16. Jan 2023

Frischen Sie Ihr Wissen auf

Verlängern Sie Ihr Personenzertifikat.

Mehr erfahren
25. Jan 2023

Event: QMD Kick-off Event

QMD-Informationsveranstaltung für IVD-Hersteller

Mehr erfahren
12. Jan 2023

Digitale Barriere­freiheit: Zeichen von Inklusion und Menschlich­keit

DESIGN FOR ALL

Mehr erfahren
10. Jan 2023

QMD Services erhält Zulassung als Benannte Stelle für In-vitro-Diagnostika

Meilenstein für die österreichische Medizinproduktebranche

Mehr erfahren
10. Jan 2023

Warum ESG für Organisationen immer wichtiger wird

Mehr Nachhaltigkeit für die Wirtschaft

Mehr erfahren
03. Jan 2023

EN ISO 15189 – Ihre Fragen, unsere Antworten

Was Sie jetzt über den Standard wissen sollten

Mehr erfahren
19. Dez 2022

Quality Austria mit Top Company Siegel 2023 ausgezeichnet

kununu kürt erneut die besten Arbeitgeber*innen

Mehr erfahren
06. Sep 2023

Event: 17. qualityaustria Gesundheitsforum

Das Event findet am 6. September 2023 in Wien statt.

Mehr erfahren
10. Okt 2023

Event: 14. qualityaustria Lebensmittelforum

Das Event findet am 10. - 11. Oktober 2023 in Wien statt.

Mehr erfahren
+43 732 34 23 22