Zum Inhalt springen

Debatte um Sprachassistenten Wie arbeitet jemand, der Siri-Aufnahmen auswertet?

Die gängige Praxis von Firmen wie Google, Apple und Amazon, Aufzeichnungen der Sprachassistenten von Menschen prüfen zu lassen, sorgt für Diskussionen. Hier erzählt ein solcher Prüfer von seinem Job - und davon, was er hört.
Wenn Siri mit einem Befehl wie "Code eingeben" nichts anfangen kann, weil die Software das deutsche Wort "Kot" versteht, wird nachgebessert - das ist der Job von Ulrich Kaufmann

Wenn Siri mit einem Befehl wie "Code eingeben" nichts anfangen kann, weil die Software das deutsche Wort "Kot" versteht, wird nachgebessert - das ist der Job von Ulrich Kaufmann

Foto: Alexander Heinl/ dpa

"Ich glaube nicht, dass das anonymisiert werden muss", schreibt Ulrich Kaufmann per Mail. "Ich erzähle ja nichts, was als Internum zu betrachten ist." Wir haben uns trotzdem entschieden, seinen echten Namen zu seinem Schutz nicht zu nennen, denn Kaufmann arbeitet in einem Bereich, über den im Moment viel diskutiert wird: Er wertet Aufzeichnungen von Apples Sprachassistent Siri aus.

Neben Apple haben auch Google, Amazon und Microsoft eingeräumt, dass sie Spracheingaben ihrer Nutzer von meist externen Dienstleistern auswerten lassen. Dabei geht es darum, zu kontrollieren, ob die Spracherkennungssoftware der Firmen Wörter und Sätze korrekt erkennt und interpretiert. Genau das ist auch die Arbeit, für die Kaufmann eingestellt wurde.

Seinen Arbeitsalltag beschreibt er so: "Ich sitze jeden Tag in einem Großraumbüro mit Kopfhörern vor dem Computer und höre mir Sprachaufzeichnungen an. Ist das, was ich höre, nicht verständlich, wird es als solches kategorisiert." Er verzeichne auch, wenn etwas zufällig oder in einer anderen als der eingestellten Sprache aufgenommen wurde oder wenn ein Teil abgeschnitten wurde. "Wenn alles okay ist, schaue ich mir an, was die Software, zuständig für die schriftliche Erfassung und Wiedergabe, daraus gemacht hat."

Bis zu 1600 Aufnahmen pro Schicht

Mit seinem Job sei er zufrieden, sagt er, seit zehn Monaten mache er das nun schon. Das Dienstleistungsunternehmen bezeichnet er als fairen Arbeitgeber, "der gerade seinen Personalstamm ausbaut und feste Arbeitsverträge vergibt." Das sei ungewöhnlich. "Auch sonst geht man dort eher respektvoll mit uns um."

Dafür werde allerdings auch Leistung verlangt: "Ich schaffe in sechs bis sieben Stunden zwischen 1200 und 1600 Aufnahmen." Kaufmann muss also drei bis fünf Aufnahmen pro Minute bearbeiten. Vieles davon ist Kleinkram: "Das meiste, was man so hört, sind kurze Befehle: 'Mach das Licht im Wohnzimmer auf 50 Prozent', 'Mach die Garage auf', 'Google Tiaprofensäure', "Führe mich in die Bäckerstraße 125 in Buxtehude', 'Spiel GZSZ', 'Geh auf YouTube'."

Wenn mal etwas schiefgeht

Manchmal bekommt er dabei auch Amüsantes zu hören: "Die Kinder sind das Beste. Sie blödeln mit Siri rum, was man in unserer Software schnell als 'unverständlich' wegdrücken kann. Oder sie stellen richtige Fragen: Was bedeutet Metronom? Wo ist Thailand? Was heißt 'Ich liebe dich' auf Chinesisch? Oder sie kommunizieren mit ihren Freunden, wollen was Digitales spielen, Musik hören. Und die ganz Kleinen kommunizieren direkt mit Siri."

Natürlich höre er, so Kaufmann, auch immer wieder Dinge, die Nutzer Siri offensichtlich gar nicht anvertrauen wollten: "Siri kann sich durchaus zufällig aktivieren, was nicht so oft passiert, aber doch häufig. Man sagt 'Hey, der Schiri war gestern krank' oder 'Diese Ringel da aus Teig' und schon aktiviert sich Siri". Das komme vor allem dann vor, wenn die Nutzer mit Akzent oder im Dialekt sprächen.

Die Reaktionen auf solche Fehlauslösungen seien allerdings auch sehr unterschiedlich: "Oft lachen sich die Leute kaputt, wenn sie merken, dass Siri sich aus Versehen eingeschaltet hat. Manche Männer beschimpfen sie dann. Meist aber wohl nur scherzhaft. Vielleicht, um Stress abzubauen." Manche würden sich aber auch richtig ärgern. Solchem Ärger aber könne man eben nur mit seiner Arbeit begegnen: Indem er Fehler entdecke und korrigiere, könne Siri immer besser werden.

Manche Nutzer gehen aber offenbar auch sehr sorglos mit Siri um, würden der Software "auch ganze Kreditkartenangaben, mit Nummern, Ablaufdatum, Sicherheitsnummer und Namen" anvertrauen. Auch habe er schon ärztliche Diagnosen, Berichte von OPs gehört oder Anwälte, die Siri ihre Schriftsätze diktieren.

Aufnahmen ohne Kontext

Den Vorwurf, er und seine Kollegen hörten Siri-Nutzer quasi ab, weist Kaufmann aber vehement von sich. Er wisse er ja nicht, wer was gesagt hat, alles sei "strikt anonym". Doch er sagt auch: "Alles Menschliche kommt bei Siri an, im Guten wie im Schlechten, sozusagen." Weinende Kinder oder Dirty Talk - Siri bekommt demnach viel zu hören.

Oft sei in den Proben aber nicht einmal zu erkennen, um was es in den Aufnahmen geht. Die Software, mit der er arbeiten müsse, spiele ihm einfach eine Aufzeichnung nach der anderen vor. "Die Einträge kommen komplett ohne Kontext und sind meist kurz."

Seine Aufgabe sei es dann, die korrekten Namen von Songs, Interpreten und Webseiten, die Siri möglicherweise falsch erkannt hat, herauszufinden. Meist würden er und seine Kollegen dafür einfach bei Google nachschauen. Als Beispiel nennt er den Satz "Und du musst noch den Code eingeben", den Siri zunächst als "Und du muss doch den Kot eingeben" interpretiert hat. Diesen Fehler habe er korrigiert. Seither kann Apples künstliche Intelligenz das Wort Code auch im Deutschen so interpretieren, wie es gemeint ist.

"Warum eigentlich jetzt dieser Aufschrei?"

Angesichts der vielen Berichte zu dem Thema, die jetzt in den Medien auftauchen, fragt Kaufmann: "Warum eigentlich jetzt dieser Aufschrei? Das Ganze gibt es seit Langem, man wusste das doch. Wir sind hier Hunderte, aus allen möglichen Ländern und Sprachen." Er habe jedenfalls "keine Möglichkeit, die Daten der Personen zu erfahren, deren Sprachaufnahmen ich anhöre."

Konkret beschäftigt ihn aber noch mehr, wie es mit seinem Job jetzt weitergeht. Schließlich hat Apple angekündigt, von Siri angefertigte Sprachaufnahmen seiner Nutzer vorerst nicht mehr von Auftragnehmern auswerten lassen. Der Konzern will seine Nutzer künftig ausdrücklich um eine Erlaubnis zum nachträglichen Anhören von Mitschnitten durch Mitarbeiter bitten. Dafür ist aber ein Softwareupdate nötig, das gerade entwickelt wird.

"Ich habe vorerst ein bezahltes langes Wochenende vor mir, nach dem wir alle bis auf Weiteres nach Hause geschickt werden", beschreibt er seine Situation. Er hoffe jedenfalls, dass Apple seine Ankündigung bald wahrmacht, die Nutzer künftig zu fragen, ob ihre Sprachaufzeichnungen analysiert werden dürfen. "Dann geht es hier weiter, hoffe ich. Sonst bin ich wieder mal arbeitslos."