Busting Big Data

Eine Antithese (griechisch αντίθεσις – Gegensatz, Opposition von anti~ – gegen~ und These – Behauptung, Leitsatz) bezeichnet allgemein eine Gegenbehauptung zu einer Ausgangsbehauptung (These). Dabei werden zwei Wörter, Begriffe, Satzteile oder Sätze einander gegenübergestellt, die sich im Sinn widersprechen: Durch diese Gegenüberstellung wird ein Gegensatz oder Widerspruch besonders hervorgehoben. Mit einer Antithese kann man eine Widerlegung erreichen. Eine Antithese wird oft mit "aber" eingeleitet. In der Literatur ist eine Antithese eine rhetorische Figur, in der unter einem Oberbegriff in direktem Gegensatz zueinander stehenden Begriffe oder Gedanken kombiniert werden. Dadurch können unter anderem Zwiespalt, Spannung und Zerrissenheit ausgedrückt werden. Beispiele sind: Himmel und Hölle; Gut und Böse; Tugend und Laster. Diese sogenannte Antithetik ist insbesondere in der Lyrik seit der Barockzeit beliebt. Beispiel: In der Bergpredigt greift Jesus sechs bekannte Gesetze aus den zehn Geboten auf. Eine bekannte Antithese ist die über die Vergeltung (Matthäus 5,38): "Ihr wisst, dass es heißt: Auge um Auge, Zahn um Zahn. Ich aber sage euch: Ihr sollt euch überhaupt nicht gegen das Böse wehren. Wenn dich einer auf die rechte Wange schlägt, dann halt ihm auch die linke hin."
Benutzeravatar
fehlgeleitet
Ausgetreten|Ausgetreten|Ausgetreten
Beiträge: 2774
Registriert: 15. November 2015, 18:04

Re: Busting Big Data

Beitrag von fehlgeleitet »

so, ich habe mich jetzt auf https://www.coursera.org/ registriert und mache ein Aufbaustudium Datascience, danach wollte ich noch IT-Sicherheit machen. Kostet 49$ im Monat, ich plane in 4 Monaten beide Aufbaulehrgänge erledigt zu haben.

Die Einstiegsvideos sind etwas großmäulig ala "Kunst trifft Wissenschaft" und "werde Millionär". wirkt natürlich unseriös.
Die Programmiersprache "R" scheint dabei im Mittelpunkt zu stehen.
Sie versprechen aus dir ne Art Hacker zu machen, der sich auch noch auf Statistik versteht.

Neben dem Zertifikat erhoffe ich mir einen Einblick in die Möglichkeiten der künstlichen Intelligenz die ja eben auf diesem "Big Data" Zeug basiert.

Zur Zeit kämpfe ich noch mit installationsproblemen von RStudio unter Debian, dass ganze Internet ist voll von Leuten, die dasselbe Problem haben :-(
Ich krieg RStudio zwar installiert, aber nicht gestartet. Schau ich mir nach dem Aufstehen weiter an.

In der bisher gelesenen Literatur steht unheimlich viel triviales Zeug. Viel geht um reine Formalitäten, also wie man Datensätze standardisiert und bereinigt. Es geht um verbreitete Fehlschlüsse, haut mich alles nicht vom Hocker.

auf lhttps://leanpub.com/ gibts viele freie Bücher zu dem Thema.

Ich könnte mir vorstellen, dass trotz aller Betonung, dass "Korrelation keine Ursache-Wirkung" beschreibt doch viele Fehler in der Richtung gemacht werden. Schaun wir mal.

edit: Rstudio läuft jetzt. Ich Depp hatte den Server installiert anstatt die Desktopversion.
"Die Lehre vcn Marx ist allmächtig, weil sie wahr ist" (Lenin)

"Ideologiekrtiker setzen alle Hebel in Bewegung, um die Leute davon abzubringen, an eine jüdisch-bolschewistische Weltverschwörung zu glauben; wir derweil arbeiten an eben dieser." (Marlon Grohn)
Benutzeravatar
fehlgeleitet
Ausgetreten|Ausgetreten|Ausgetreten
Beiträge: 2774
Registriert: 15. November 2015, 18:04

Re: Busting Big Data

Beitrag von fehlgeleitet »



Data-Mining auf Spiegel.de

Amateurspionage vom heim PC ;-D
"Die Lehre vcn Marx ist allmächtig, weil sie wahr ist" (Lenin)

"Ideologiekrtiker setzen alle Hebel in Bewegung, um die Leute davon abzubringen, an eine jüdisch-bolschewistische Weltverschwörung zu glauben; wir derweil arbeiten an eben dieser." (Marlon Grohn)
Benutzeravatar
fehlgeleitet
Ausgetreten|Ausgetreten|Ausgetreten
Beiträge: 2774
Registriert: 15. November 2015, 18:04

Re: Busting Big Data

Beitrag von fehlgeleitet »

So habe den R-Einführungs-Kurs abgeschlossen.

Erster Eindruck: "R" ist eine Art emacs für Tabellen. Also eine vollwerige Programmiersprache, die ein wenig an Lisp errinert. Es gibt zahlreiche Pakete, die Funktionen liefern den Code insgesamt recht übersichtlich zu machen, wenn man die Pakete alle kennt. Ansonsten happy-manual reading. Wobei man R nicht vorwerfen kann, besonders konterintuitiv zu sein. R ist sogar recht tolerant was Fehler im Code angeht und viele Funktionen sind recht einfach zu bedienen, wenn man erstmal weiß wie sie heißen. Aber das weiß man eben nicht immer :-)

Die Fummelei trieb mich gelegentlich zur weißglut, aber das hat das herumdoktorn in tabellen eben so an sich. Wenigstens existieren viele Funktionen, um sehr verschiedene Dateitypen auszulesen, so dass das Abspeichern eines Datensatzes in der Regel ein Einzeiler ist.

R ist so langsam wie man es von einer Interpretersprache erwartet. Phyton ist wesentlich schneller und allgemeiner einsatzfähiger. R ist wirklich dazu da, auf einer professionellen Ebene Statistik mit großen Datenmengenzu betreiben, für alle anderen Zwecke gibt es sicherlich bessere Lösungen. Auch die Echtzeitbearbeitung von Daten ist etwas, was man besser Phyton überlässt - R ist einfach zu schwerfällig und hat zu viele Vorraussetzungen. Auf einem Microcontroller beispielsweise ist Phyton kein Problem, aber R benötigt ein ganzes Betriebssystem.
"Die Lehre vcn Marx ist allmächtig, weil sie wahr ist" (Lenin)

"Ideologiekrtiker setzen alle Hebel in Bewegung, um die Leute davon abzubringen, an eine jüdisch-bolschewistische Weltverschwörung zu glauben; wir derweil arbeiten an eben dieser." (Marlon Grohn)
Benutzeravatar
Bwana Honolulu
Hausmeistens|Hausmeister|Hausmeisterin
Beiträge: 12202
Registriert: 8. September 2010, 10:10
Disorganisation: Aktion 23, Zimmer523, GEFGAEFHB, ddR, Fractal Cult, EHNIX, The ASSBUTT
Wohnort: leicht verschoben
Pronomen: er/ihm
Kontaktdaten:

Re: Busting Big Data

Beitrag von Bwana Honolulu »

Naja, Python ist ja auch eigentlich 'ne Scirptsprache, aber das, was du da auf 'ne Microcontroller ausführst, ist einfach 'ne spezialisierte und relativ hochoptimierte Implementierung davon. Von daher etwas unfair, das mit so 'ner Vanilla-Version von R zu vergleichen.

Hattest du mit Lisp im Studium zu tun oder hattest du dich damit im Zuge von dem KI-Kram mal beschäftigt? Ich weiß es gerade nicht mehr...
Wenn ich schon der Affe bin, dann will ich der Affe sein, der dem Engel auf's Maul haut. XD
‒✴△♀ ✴ө△ʘ!
Seine Quasarische Sphärizität, der Bwana Honolulu,
Überbefehlshabender des Selbstmordkommandos Ω,
Herrscher über alles, alles andere und wieder nichts,
Urgroßpapapapst und Metagottkaiser in Zimmer523,
Grand Admirakel der berittenen Marinekavallerie zur See,
Reichsminister für Popularpodicifikation,
Hüter des Heiligen Q.
Benutzeravatar
fehlgeleitet
Ausgetreten|Ausgetreten|Ausgetreten
Beiträge: 2774
Registriert: 15. November 2015, 18:04

Re: Busting Big Data

Beitrag von fehlgeleitet »

Bwana Honolulu hat geschrieben:Naja, Python ist ja auch eigentlich 'ne Scirptsprache, aber das, was du da auf 'ne Microcontroller ausführst, ist einfach 'ne spezialisierte und relativ hochoptimierte Implementierung davon. Von daher etwas unfair, das mit so 'ner Vanilla-Version von R zu vergleichen.

Hattest du mit Lisp im Studium zu tun oder hattest du dich damit im Zuge von dem KI-Kram mal beschäftigt? Ich weiß es gerade nicht mehr...
ich hatte im Studium scheme, dass ist ein Lisp-Dialekt

edit: außerdem ist R auch lahmer als phyton wenn man es auf nem normalen Rechner nutzt.
"Die Lehre vcn Marx ist allmächtig, weil sie wahr ist" (Lenin)

"Ideologiekrtiker setzen alle Hebel in Bewegung, um die Leute davon abzubringen, an eine jüdisch-bolschewistische Weltverschwörung zu glauben; wir derweil arbeiten an eben dieser." (Marlon Grohn)
Benutzeravatar
fehlgeleitet
Ausgetreten|Ausgetreten|Ausgetreten
Beiträge: 2774
Registriert: 15. November 2015, 18:04

Re: Busting Big Data

Beitrag von fehlgeleitet »

Eine Sache ist mir mit dem Data Science inzwischen klar geworden: Wenn man keine Ahnung von dem Fachgebiet hat, aus dem die Daten stammen, kann man mit den Daten auch nicht viel anfangen.

Sagen wir, ich habe einen Haufen Daten über Krankenhäuser und will aus diesen Daten herauskriegen, was das beste Krankenhaus sein mag. Ein naiver Ansatz wäre es, nach der geringsten Sterberate zu suchen, doch dann landet man wahrscheinlch bei einem Schöhnheitschriugen.

Data Science ist eben ein großes Wort für computergestützte Statistik, und wenn du kein Arzt bist dann weißt du mit den Daten von Krankenhäusern nicht viel anzufangen außer ein paar arithmetische Operationen durchzuführen, sagen wir Mittelwert und Varianz auszurechnen, was für sich genommen jedoch relativ wertlos ist.

Wie eine KI auf Basis dieser Daten Wissenschaft betreiben soll, wie es sich zum Beispiel das Pentagon vorstellt, ist mir völlig schleierhaft
"Die Lehre vcn Marx ist allmächtig, weil sie wahr ist" (Lenin)

"Ideologiekrtiker setzen alle Hebel in Bewegung, um die Leute davon abzubringen, an eine jüdisch-bolschewistische Weltverschwörung zu glauben; wir derweil arbeiten an eben dieser." (Marlon Grohn)
Benutzeravatar
Cpt. Bucky Saia
Warlord der Herzen|Warlord der Herzen|Warlady der Herzen
Beiträge: 6831
Registriert: 9. September 2010, 09:36
Disorganisation: Comapony Kabale, Starfish Cabal, Company, D.A.D.
Wohnort: eine alte Haunebu IV Flugscheibe

Re: Busting Big Data

Beitrag von Cpt. Bucky Saia »

Hat ich aber irgendwo auch schon mal erwähnt das man nicht genug variablen kennt um effektiv mit großen Daten zu arbeiten.
"Wir sind nicht der Abschaum. Wir sind der schillernde, toxische Schleim der auf dem Abschaum schwimmt ..."
Seine Spektralität Cpt. Bucky "Saia" Sternentänzer
alias Papst Cerrynt Eiledol von Welodd alias Nede E Lym von Leng alias Baktus Paradonti alias Dr. Dromis Seth, Master Phool im Outer Space, (Mitbe)Gründer der Univers-City of Sockovia, Moonman Winter Dream, aus der dritten Vergangenheit, General Error der Invasionstruppen, Captain der ersten erisischen Kompanei westlich von Osten, Hüter des hailigen GNARV und anderer nutzloser Dinge, Dunkelelfischer Bischof von Betty, Vorstand der Company auf Lebenszeit, Ernenner des Fonsis auf Zeit, der während eines Bades ehrenhaft erleuchtete, Beschützer des rauchenden Orakels am Stiel, exzellenter Züchter der feinsten Flugaffen nördlich von Reykjavík, Eiliger Hailigenpfleger der Aktion 23, (Er)Finder des Starfish Mythos, Transluzenter Geheimniskrämer und unter der Hand Händler, Schieberkönig der Unwissenden, Verfasser von nicht geschriebenen Werken, autorisierter Verkäufer von "Das LichtTM" und "SeelenheilTM", eingeweihter Oberanti der D.A.D. sowie Pharao Hypothep alias Pharao Pontifex zu Popanz von Paranoia Panoptikum, Bürokrat im Büro für Zweckentfremdung, Anwender von Methoden, Knazler und freier Beratzer auf Schloß Gammelot in Mottrop´s Tradition, Vorsichtsratsaufstand im Konglomerat, Eidechsenkönig und Universalgott Nr. 5
Benutzeravatar
fehlgeleitet
Ausgetreten|Ausgetreten|Ausgetreten
Beiträge: 2774
Registriert: 15. November 2015, 18:04

Re: Busting Big Data

Beitrag von fehlgeleitet »

Microsoft Vorlesung über den mathematischen Kern von Data Science, ich arbeite das in den nächsten Tagen durch.

"Die Lehre vcn Marx ist allmächtig, weil sie wahr ist" (Lenin)

"Ideologiekrtiker setzen alle Hebel in Bewegung, um die Leute davon abzubringen, an eine jüdisch-bolschewistische Weltverschwörung zu glauben; wir derweil arbeiten an eben dieser." (Marlon Grohn)
Benutzeravatar
fehlgeleitet
Ausgetreten|Ausgetreten|Ausgetreten
Beiträge: 2774
Registriert: 15. November 2015, 18:04

Re: Busting Big Data

Beitrag von fehlgeleitet »

https://www.heise.de/tp/features/EU-wil ... 10322.html

Es häufen sich die Berichte das sich die großen Erwartungen von Data Science/Machine Learning nicht erfüllen.

Statt der Prüfung einer sinnvollen Theorie artet Machine Learning immer mehr in eine Art wildes herumprobieren aus, dass man kaum noch als wissenschaftlich bezeichnen kann. Diese Info habe ich von einem Dozenten, der Machinelearning an der Uni liest. :-)
"Die Lehre vcn Marx ist allmächtig, weil sie wahr ist" (Lenin)

"Ideologiekrtiker setzen alle Hebel in Bewegung, um die Leute davon abzubringen, an eine jüdisch-bolschewistische Weltverschwörung zu glauben; wir derweil arbeiten an eben dieser." (Marlon Grohn)
Benutzeravatar
Bwana Honolulu
Hausmeistens|Hausmeister|Hausmeisterin
Beiträge: 12202
Registriert: 8. September 2010, 10:10
Disorganisation: Aktion 23, Zimmer523, GEFGAEFHB, ddR, Fractal Cult, EHNIX, The ASSBUTT
Wohnort: leicht verschoben
Pronomen: er/ihm
Kontaktdaten:

Re: Busting Big Data

Beitrag von Bwana Honolulu »

Hatten wir nicht letztens auch 'nen Artikel hier, wo's darum ging, daß man transparentere KIs zu entwickeln versucht, deren Entscheidungen für Menschen besser nachvollziehbar sind, weil halt manche KIs sogar super funktionieren, aber keine weiß, warum?
Wenn ich schon der Affe bin, dann will ich der Affe sein, der dem Engel auf's Maul haut. XD
‒✴△♀ ✴ө△ʘ!
Seine Quasarische Sphärizität, der Bwana Honolulu,
Überbefehlshabender des Selbstmordkommandos Ω,
Herrscher über alles, alles andere und wieder nichts,
Urgroßpapapapst und Metagottkaiser in Zimmer523,
Grand Admirakel der berittenen Marinekavallerie zur See,
Reichsminister für Popularpodicifikation,
Hüter des Heiligen Q.
Antworten