Viele haben heute „smarte Lautsprecher“ wie Alexa, Google Home, Apple HomePod oder vergleichbare Geräte stehen. Oder sie sprechen im Auto mit dem Assistenten, mit Alexa, Siri, Cortana oder Google Assistant. Und im Smartphone sind auch welche eingebaut. Doch was viele nicht wissen: Gelegentlich hören Menschen aus Fleisch ab, was wir mit den Assistenten gesprochen haben – teilweise auch ungewollt aufgenommene Sprachfetzen. Apple hat jetzt angekündigt, das einzustellen.

Wichtig zu wissen: Wenn das jeweilige Schlüsselwort fällt – also je nach Hersteller „Alexa“, „Google“, „Siri“, „Cortana“ oder was auch immer –, geht alles, was danach gesprochen wird, an einen Server des jeweiligen Anbieters. Also zu Google, Amazon, Apple, Microsoft.

Denn hier wird mit KI versucht, blitzschnell das Gesprochene zu interpretieren: Eine Frage, eine Anweisung, ein Wunsch? Es ist nicht einfach, gesprochene Befehle zu verstehen, deswegen geht alles zu Servern und wird nicht im Gerät erledigt. Die Antwort kommt dann zurück. Nur: Das klappt nicht immer.

Es gibt häufig Probleme. Um herauszufinden, woran es liegt, dass die KI-Software nicht richtig versteht, hören gelegentlich echte Menschen in die Audioaufnahmen hinein – und versuchen so, der Maschine das Zuhören beizubringen.

Wer hört denn da genau zu – und was hören sie an?

Ausgewählt zum Probehören durch Menschen werden Gesprächsfetzen, die Schwierigkeiten bei der Analyse gemacht haben. Etwa, weil genuschelt wurde, weil mehrere Leute gleichzeitig geredet haben, ein Akzent oder Dialekt dabei war – oder einfach, weil aus Versehen etwas aufgezeichnet wurde, was gar nicht für die Assistenten gedacht war.

Echte Menschen können das dann viel besser verstehen. Sie machen sich Notizen und sollen so helfen, die KI-Systeme zu verbessern. Es sind Mitarbeiter der jeweiligen Unternehmen, also Amazon, Google, Apple und Co. – oder Mitarbeiter von Unternehmen, die dafür bezahlt werden, also in externen Firmen. Wer das genau macht, weiß man nie. Aber alle Unternehmen machen solche Stichproben.

 

Und die wissen dann und hören dann, was jemand sagt oder fragt?

Im Grunde schon. Allerdings versichern Apple, Amazon und Google, dass die Sprachfetzen anonymisiert sind. Das heißt, die Abhörexperten wissen nicht, von wem sie da etwas hören. Ob das stimmt, können wir nicht wissen und auch nicht kontrollieren. Außerdem gibt es Situationen, da erschließt sich schon aus dem aufgezeichneten Gespräch, wer redet, mit wem oder über wen. Da hilft die ganze mögliche Anonymisierung nichts.

Apple setzt Abhören vorerst aus

Apple hat das stichprobenartige Abhören durch echte Mitarbeiter vorerst eingestellt. Google ebenso vor einigen Tagen – allerdings nur in der EU, wo strengere Datenschutzrichtlinien bestehen.

Der Hintergrund: Bislang war den meisten unbekannt, dass es zu stichprobenartigem Abhören durch Menschen kommt. Den meisten ist es – verständlicherweise – unangenehm zu wissen, dass möglicherweise echte Menschen Anweisungen oder versehentlich aufgezeichnete Gespräche aufzeichnen.

Das ist jetzt bekannt geworden – und viele User haben sich beschwert. Vor allem, weil über diesen Sachverhalt gar nicht aufgeklärt wird. Apple will aber nicht vollständig darauf verzichten: Künftig werden die User informiert – und können sich entscheiden, ob sie ggf. zur Verbesserung des Services ein Abhören durch echte Menschen zustimmen wollen.

Alles gut jetzt bei Google und Siri?

Immerhin haben Google und Apple reagiert – und unternehmen etwas. Das finde ich positiv. Amazon zeigt sich wie immer unbeeindruckt und macht mit dieser Praxis erst mal weiter. Allerdings wird sich das nicht mehr lange durchhalten lassen: Die Aufmerksamkeit nimmt zu. Immer mehr Menschen wird klar, dass die Digitalen Assistenten ein Sicherheitsrisiko für die Privatsphäre darstellen. Ganz sicher werden auch die Vorschriften verschärft. „Sicher“ ist kein Digitaler Assistent. Denn die Anweisungen werden dauerhaft auf Servern gespeichertm teilweise auch versehentlich aufgezeichnete Gesprächsfetzen.

Da stellt sich natürlich jeder die Frage: Kann ich das denn unterbinden, etwa wenn ich mit meinem Chef spreche oder als Journalist ein vertrauliches Interview führe?

Die Antwort: Jein. Wer die Assistenten nutzt, muss immer damit rechnen, dass das gesprochene Wort auf Server geschickt und gespeichert wird. Wer Diskretion will: Stecker ziehen – ausschalten.

Und bei Siri und Co. auf dem Smartphone: Hier die Funktion deaktivieren, dass sie auf Schlüsselwort reagieren. Besser, man drückt den entsprechenden Button.