21 July 2011

Kann Google+ meine 'unbewußten' Gedanken antizipieren?

Oder haben Sie es auch etwas kleiner?


Nach einer langen und durch ihre Dichte beeindruckenden Diskussion, wie ich sie im Internet selten erlebt habe, will ich nicht die philosophischen Höhen erneut erklimmen und die großen Fragen der Menschheit nicht um eine weitere Frage ergänzen, sondern wie immer aus den Niederungen der angewandten Technik einige Aspekte aufzeigen.

Der Auslöser war ein Artikel von Frank Schirrmacher in der FAZ "Digitales Gedächtnis - Wir brauchen eine europäische Suchmaschine" der in Google+ von Christoph Kappes aufgegriffen wurde "Da es gern viele unterschiedliche Interpretationen". Es wurden im Laufe dieser Diskussion viele Aspekte aufgegriffen, die kontrovers diskutiert wurden. So erlaube ich mir auch einen Aspekt "Was weiß Google von mir" herausgreifen.



Welche Daten hat Google?
Da ich mit Google nur über das Internet verkehre, ist dies vorerst eine kleine Liste von Datentypen:

  • Name, Anschrift, eMail-Adresse, Telephonnumer, Sprache (Grundkoordinaten)
  • Selbst eingegebene Zahlen, Worte, Texte (jeweils mit Datum)
  • Bilder
  • Musik, wenn ich welche mache 
  • Klicks auf Listen (Suche)

Datentypen können in einer Exceltabelle in den Kolumnen eingegeben werden und dann werden in den Reihen die Worte, Texte, Bilder abgelegt. Jeder Mensch hat so seine eigene Excelseite, die fest mit seinem Namen verbunden ist. Man kann diese Tabelle jetzt schon befragen und bekommt heraus, dass ich in meinen Suchanfragen seit 10 Jahren 50x nach dem Wort "Bach" gesucht habe. (Als kleiner Tip am Rande: Vergangenheitsbewältigung) Ich kann auch fragen: Wie oft habe ich am 13.3.2003 das Wort "Tankstelle" eingegeben.

Meine Daten alleine machen wenig Sinn. Spannender wird die Geschichte, wenn ich weiß, das für jeden Nutzer eine solche Seite angelegt wird. Jetzt kann ich fragen: Wie viele Nutzer haben am 13.3.2003 das Wort "Bach" eingetippt. Oder an welchem Tag war das Wort "Tankstelle" am häufigsten abgefragt.

Aber Google hat noch mehr:

  • Geographische Koordinaten von Standorten
  • Vektorkarten 
  • Bücher
  • Bilder
  • Bewegungsprofile von Handys (Menschen)
  • ... 
Da Google meine Daten hat können diese Daten mit anderen Daten verbunden werden. So ist meine Adresse bekannt und Google kann auf seiner Karte zeigen wo ich wohne. Da diese Adresse in räumliche Koordinaten umgewandelt werden, kann Google fragen, welche anderen Nutzer im Umkreis von 100 Metern von mir wohnen und kann weiter fragen, ob einer dieser Anwohner auch schon mal am 13.3.2003 nach einer Tankstelle gesucht hat. ... Diese Relationen zwischen verschiedenen Daten können erstellt werden, aber es bedarf eines Menschen diese Frage zu stellen, die Daten abzufragen und auszuwerten. Wenn diese Abfrage einmal gemacht wurde, kann diese das nächste Mal auch automatisch erstellt werden.


Was weiß Google von mir?

Google sitzt auf einer Unmenge von Daten über mich, die mit den anderen Datensätzen beliebig verknüpft werden können. Dies ist aber noch kein Wissen. Das Wissen kommt erst über die Verknüpfung der einzelnen Daten. Diese Verknüpfungen können nur mit dem "Weltwissen" des Programmierers sinnvoll erstellt werden.

Hier treten die ersten Schwierigkeiten auf. Bleiben wir bei dem Wort "Bach". Es kann den kleinen Fluss bedeuten, es kann eine Person namens Bach sein, es kann ein Komponist aus der Familie Bach sein, ...
Die Exceltabelle hat keinen Hinweise auf die Bedeutung dieses Wortes.

Ebenso ist es mit dem Wort "Tankstelle". Ging es um Wasser für die Dampfmaschine, um Benzin, um den Preis oder um Aral? Wenn ich bei der Suche nach Tankstelle wiederholt auf einen Link klicke, der billiges Diesel anbietet, könnte man vermuten, daß ich billig tanken will. Dies ist aber eine Vermutung, kein Wissen.

Noch schwieriger wird es mit Texten, die ich z.B. bei gMail eingegeben habe, und die Google anonymisiert, scannt. Bei einfachen Texten oder standardisierten Texten (EU-Verträgen) mag es noch möglich sein, daß ein Programm einen Text versteht. Verstehen heißt, daß nicht nur das Wort verstanden, sondern daß der Satz, der Absatz der Text richtig im Kontext des Sachgebietes interpretiert wird. Dies kann der Mensch, da er über die Jahre ein strukturiertes Wissen aufgebaut hat. Mit jedem Wort und Satz, den erliest macht er sofort eine Verbindung zu seinem bisherigen Wissen und kann das Gelesene richtig einordnen verstehen. Wenn er ein Wort nicht kennt - versteht er den Satz nicht, weil er keine Verbindung mit seinem Wissen herstellen kann. Er muss dann das neue Wort erst mit seinem Wissen verknüpfen, und dann geht es weiter.

Und genau an dieser Stelle scheitert Google und der Rest der Maschinen: Diese strukturierte Weltwissen mit allen seinen notwendigen Feinheiten im einen Text zu verstehen gibt es nicht. Denken wir nur an den Literaturunterricht und die vielfältigen Möglichkeiten der Interpretation und die Auswahl einer sinnvollen Interpretation. (Mein Beispiel gilt immer noch: Man nehme einen beliebigen Text und lasse ihn von Google übersetzen und wieder zurückübersetzen und lese diesen Text auf Verständlichkeit.)

So bleibt die Beantwortung der Frage sehr offen. Google hat meine Daten, kann diese in einfache Relationen zu anderen Daten setzen und mir eine Antwort geben. So ist die Lösung der Aufgabe: "Sage mir, wieviel kostet das Benzin an der Tankstelle auf der anderen Straßenseite." primitiv.

  • Ermittle den Standort des Handys
  • Übersetze in Koordinaten
  • Mache eine Umkreissuche nach Tankstelle
  • Wenn Tankstelle innerhalb 100 m suche die Hompage
  • Sieh auf der Homepage nach dem Benzinpreis
  • Schicke diesen ans Handy
Kein Hexenwerk. 

Google kann über meine Daten Verknüpfungen machen: Ich gehöre zu den 20% der Menschen, die schon mal nach Bach gesucht haben, aber auch dies ist noch kein Wissen.

Wie ist mein Google Profile zu bewerten?


Zugegeben: Es ist schon eine ganze Masse an Einzelfakten, die im Laufe eines Internetlebens zusammenkommen. Und wenn ein intelligenter Mensch sich über meine Daten beugt, kann er mit seinem Wissen sicherlich ein Profil erstellen, daß den Teil meiner Person reflektiert, den ich im Internet preisgegeben habe. Aber die Maschine alleine wird dies, außer bei der Analyse von Trivialitäten im Sinne von 99% der Fliegen mögen Scheiße ...  nicht gelingen. Unter Trivialitäten verstehe ich auch Produktvertrieb.

Ein ganz anderer Punkt sollte uns viel mehr zu denken geben, der von Google nicht bedient wird: Informationssammlungen der Bürgerämter, Sozialbehörden, Ärzte, Banken (vergl. dazu mein Blogbeitrag: Q: Am I an Individual or a Datapool for Information?) Hier liegen die wirklich harten Fakten über uns, die in einem Profil zusammengefasst beängstigend sind. Und hier will ich gar nicht über die Stasi-Akten reden.)

Weiß Google mehr über mich als ich selbst?

Nein,

  • da ich nur einen Teil meines Daseins im Netz verbringe
  • da Google es nicht gelingt mein Weltwissen entsprechend zu repräsentieren und meine Texte entsprechend zu interpretieren
Ja,
  • da Google meine Äußerungen in Relation zu anderen Menschen setzen kann, die ich nicht kenne
Aber diese Interpretation interessiert mich nur am Rande. Und wenn, dann nur um ein Stück Selbstbeweihräucherung zu betreiben. 


Google und mein Unterbewußtsein

Jetzt wird es schwierig: Da ich nur ein Mensch bin und zu einem Großteil biologisch gesteuert, kann Google um 11.00 Uhr annehmen, daß ich um 12.00 Hunger bekomme. Und prompt hat Google recht, da mein Magen rebelliert. Aber das war dann nicht das Unterbewußtsein. Google plaziert seine Mobile Pizzawerbung und mein Unterbewußtsein rebelliert, weil ich so Zeugs nicht mag.

Will sagen: Auf einer "trivialen" Werbeebene mag eine geschickte Auswertung mich hineinlegen. Aber Google wird es nicht gelingen mich zu überzeugen, daß es schön ist 6 Stunden in Bayreuth zu sitzen.

Eine etwas andere Antwort : Q: Will Data mining in Bazaars and Cathedrals read our Mind?

Man sieht, ich drücke mich vor der Beantwortung. Da müssen andere Personen ran.

PS: Die Darstellung der Daten von Google wird sich selbstverständlich auf unsere Sichtweise auswirken. Wenn Blutwurst nicht mehr gefragt wird, wird Blutwurst nicht mehr angeboten. Dann hilft auch mein Heisshunger nichts. Ich bekomme keine Blutwurst mehr und muss Leberwurst essen.

PPS: Für Googles Weltwissen: Ich mag weder Blut- noch Leberwurst.

Stay Tuned!