Amazon Echo Dot ist ein digitaler Assistent der Firma Amazon. Er spricht Englisch und Deutsch, ist seit zwei Jahren in den USA erhältlich und seit Ende Oktober auch in Deutschland. Hier der gekürzte offizielle Verkaufstext:
Amazon Echo Dot ist ein sprachgesteuertes Gerät mit einem kleinen integrierten Lautsprecher … Echo Dot hört Sie von der anderen Seite des Raumes, sogar in lauter Umgebung oder wenn Musik läuft. Wenn Sie Echo benutzen möchten, sagen Sie einfach das Aktivierungswort „Alexa” und Echo reagiert. Amazon
Ich nutze bisher keine digitalen Assistenten, weil ich noch keinen Bedarf dafür verspürt habe. In der letzten Zeit wurden Sprachassistenten wie Google Home, Siri und Cortana oft als “das tolle, neue Ding” vorgestellt und machten mich natürlich auch neugierig. Meine Versuche mit Siri auf dem iPhone waren eher ernüchternd. Die Spracherkennung funktioniert gut, aber irgendwie komme ich mit “Handbedienung” viel besser klar. Das geht mir auch mit jeglicher Art von Fahrassistenten und automatischen Steuerungen so. Wenn ich derjenige bin, der die Reaktionen programmiert oder konfiguriert, macht mir so etwas sogar Spass. Wenn ich mich auf existierende Systeme verlassen soll, überkommt mich oft ein merkwürdiges Gefühl trügerischer Sicherheit. Ich weiss ja prinzipiell, wie sowas oft unter Zeit- und Kostendruck entwickelt wird … und das macht mein Vertrauen darin nicht größer.
Als ich im Oktober in Frankfurt war, bin ich viel Fahrrad gefahren und habe das Telefon zur Navigation genutzt. Da ich die Hände nicht vom Lenker nehmen konnte, war es das erste Mal, dass ich mir ernsthaft vorstellen konnte, eine Sprachsteuerung und Kopfhörer zu nutzen.
DBHackathon
Gestern und vorgestern hatte ich die Möglichkeit im Rahmen des #dbhackathon der Deutschen Bahn in der Mindbox in Berlin 24 Stunden mit Alexa und dem Amazon Echo Dot zu “spielen”. Die Deutsche Bahn ist recht aktiv im Open Data Umfeld und versucht gewissermassen ihre eigenen Daten aus den Fängen des eigenen Konzerns zu befreien. Die bereits befreiten Daten werden dann bei so einem Hackathon interessierten Menschen zum kreativen Tun vorgeworfen und nach 24 Stunden kamen 19 wirklich interessante Projekte heraus.
Wow – 19 Projekte sind in 24 Stunden entstanden und werden jetzt vorgestellt #dbhackathon pic.twitter.com/Qf3D5haogY
— hagengraf (@hagengraf) December 17, 2016
Ich habe die 24 Stunden genutzt um “Alexa zu daten” und zu gucken, wie wir miteinander klar kommen. Diese emotionale Wahrnehmung von digitalen Assistenten ist auch so ein Ding. In dem Moment, wo eine weibliche Stimme wie Alexa dich freundlich anspricht, dir etwas Nützliches sagt und auch auf Nachfragen durchaus hilfreiche Dinge anbietet, hat das “Gespräch” natürlich auch eine emotionale Ebene.
Mein Ziel war es für Alexa einen sogenannten Skill zu “programmieren”, der einen Bezug zum existierenden Bahnhofsfoto Projekt hat und ich dachte an so etwas wie
“Alexa, von welchen Bahnhöfen in meiner Nähe gibt es eigentlich noch keine Fotos im Projekt?”
Vor dem Hackathon nahm ich an einem Alexa Workshop von @lizmyers teil, die bei Amazon als Evangelist arbeitet und in rührend freundlicher, motivierender und sehr amerikanischer Art (not in a bad sense ;) ) die grundsätzlichen Strukturen hinter Alexa erläuterte. Sie arbeitet in Berlin an der Eindeutschung von Alexa und spricht auch Deutsch. Nach nur zwei Registrierungen und dem Hinterlegen persönlicher Kredikarteninformationen konnten wir Alexa einen ersten Skill beibringen.
Ein Skill ist so etwas wie eine App oder ein Programm. Es hat einen Namen und lässt Alexa etwas tun. Alle Skills können aus einem Store geladen werden, ähnlich den bekannten App Stores. Da wir eine Vorstellungsrunde hatten und die Menschen meist stutzen, wenn ich sage: “Ich wohne in Fitou” erstellte ich als ersten Skill etwas Wissenswertes über Fitou. Den Skill ruft man mit einem Launch Wort auf, so wie man ein Programm startet. In Deutschland ist das beispielsweise starte [Skill Name]. Der ganze Dialog geht dann
- Ich: Alexa, starte Fitou
- Alexa: Was möchtest du wissen?
- Ich: Erzähle mir etwas über Fitou
- Alexa: Fitou in ein kleines Dorf in Südfrankreich
Hört sich einfach an, bedarf allerdings zahlreicher Schritte, diesen kleinen Skill zu erstellen.
Als nächste Verbesserung gibt es Slots. Ein Slot ist eine Variable in einem Satz, also beispielsweise
- Ich: Alexa, starte Drupal
- Alexa: Was möchtest du wissen?
- Ich: Was macht das Drupal Modul Media?
- Alexa: Das Modul Media speichert Dateien.
Das Ansprechen von Alexa ist wie das Bedienen einer Website Navigation. Du kannst völlig planlos etwas sagen, so wie du planlos etwas klicken kannst. Um an dein Ziel zu kommen oder auch nur um unterhalten zu werden, ist es hilfreich einen ungefähren Weg zu kennen und noch viel hilfreicher, zu wissen was dahinter steckt.
Das Alexa Projekt ist für mich vergleichbar mit dem Stand von Websites vor 15-20 Jahren. Programmierer probieren Sachen aus, Marketing Leute wollen dir Dinge verkaufen, Künstler und Kinder zweckentfremden die Technik um auf völlig andere Dinge hinzuweisen oder Spass zu haben, die Gegner der Technik rufen das Ende der Welt aus und meistens findet die Porno Industrie einen ersten Weg um Geld zu verdienen. In diesem Fall bleibt Porno vermutlich draussen, da alle im Store veröffentlichten Skills von Amazon überprüft werden.
Slots und externe Datenquellen
In der Art, wir du nun Slots und externe Datenquellen zu einem Skill bündelst liegt das “Geheimnis”. Wenn du es gut machst, ist es wie eine gute Benutzeroberfläche auf deinem Apple Computer oder ein elegantes Design bei Luxusgegenständen. Natürlich kannst du auch die Aldi Variante, einfallslose Call Center Dialoge oder das Äquivalent einer langsamen, überladenen und schwer bedienbaren Website erstellen. Insofern ist Alexa erstmal ganz normal, was mich beruhigt. Sie stürzt auch mal ab :)
Die Entwicklungsumgsumgebung
Im Workshop haben wir Amazon AWS Lambda, ein Service, der node.js Code ausführt und das Alexa Skill Center benutzt. Danach habe ich noch Amazon S3Bucket und Amazon DynamoDB genutzt. Es geht aber wohl auch, den Programm Code, den dein Skill braucht, auf dem eigenen Server zu hosten.
Die Bedienung dieser Amazon Services im Browser ist ok, aber nicht besonders intuitiv und teilweise einfach umständlich. Beispielsweise kann Quellcode, der mehr als eine Datei nutzt, kann nicht online bearbeitet werden. Man muss ihn exportieren, lokal ändern, zippen und das Archiv dann wieder hochladen.

Open Data
Interessant wird es, wenn man Alexa mit offenen, externen Datenquellen verbindet, die sie dann abfragen und das Ergebnis in ein Gespräch einbauen kann. Während des DBHackathons sind beispielsweise Anwendungen entstanden, die Call-a-Bike Daten auswerten:
- Alexa, wieviele Fahrräder sind in der Nähe?
- Alexa, wo ist das nächste Fahrrad?
Mit den Fahrstuhldaten lässt sich die Frage beantworten
- Sind die Fahrstühle im Bahnhof [Name] in Betrieb?
Je mehr derartige Daten bereitstehen, desto besser kann Alexa darauf antworten. Anwendungen, die diese Daten nutzen, funktionieren natürlich auch auf einer Website oder innerhalb einer App, es ist aber schon faszinierend, wie anders der persönliche Eindruck ist, wenn dir jemand etwas erzählt. Ich weiss nicht, ob es daran liegt, dass das für mich relativ neu ist oder ob das mit der Zeit nachlässt.
Beim oben beschriebenen, wirklich extrem einfachen Drupal Beispiel fand ich es faszinierend, wie positiv Leute darauf reagiert haben, die das Beispiel einfach nur gehört haben. Prinzipiell koennte Alexa also auch Drupal Workshops machen, die mit Echtzeit Informationen aus der Community angereichert werden könnten. Gerade diese Eignung für “Schulungen bei Bedarf” hat mich positiv überrascht, weil ich das anfangs gar nicht auf dem Schirm hatte.
Ich habe jetzt auch einen Amazon Echo Dot
Man kann das Gerät in Deutschland nicht kaufen sondern muss sich für einen anmelden. Momentan gibt es wohl keine Geräte. Gaby Becker vom Bahnhofsprojekt hat mir spontan ihren Amazon Echo Dot ausgeliehen, vermutlich auch in der Hoffnung, dass doch noch ein Bahnhofsfoto Skill dabei herauskommt :)
Ich bin da ganz zuversichtlich und bedanke mich herzlich.
Datenschutz Katastrophe
Ein Amazon Echo Dot hat sieben Mikrofone, die ständig im Raum lauschen. Falls jemand Alexa sagt, reagiert das Gerät. Dieses Verhalten ist die Horrorvorstellung eines jeden auch nur einigermaßen an Privatsphäre interessierten Menschen. Als wenn das nicht bereits genug wäre, werden die Daten natürlich auch bei Amazon gespeichert um die Qualität von Alexa zu verbessern. Ob Daten abgehört und an Dritte weitergegeben werden, weiß keiner. Amazon äußert sich nicht offiziell dazu. Ich weiss das und stehe dem sehr kritisch gegenüber. Ich werde das Gerät zunächst nur einschalten, wenn ich etwas dafür programmiere.
Kam hier mal etwas dabei raus? Bin auch gerade dran mir Amazon Skills Kit anzuschauen. Der offizielle Bahnskill scheint wohl bisher auch noch nicht ganz ausgereift zu sein, da er nur ICE Verbindungen ausgibt.
Gruß
Sven
Ich habe zwei Skills in den deutschen Store gestellt und die müssten auch freigeschaltet sein (“Bahnhof” und “Fitou”). Eben habe ich leider keine Zeit weiter zu machen. Aber neugierig bin ich schon.
Hi Hagen, deine beiden Skills sind verfügbar. Jedoch fehlt jegliche Beschreibung, was genau damit bezweckt werden soll/kann. Ist das beabsichtigt?
Oh, das ist ja toll. In erster Linie waren das “nur” so Probierprojekte. Wie hast du die Skills gefunden?
Ganz einfach über die Suche für Alexa Skills ;)
Hey, cool – dann muss ich daran weiterarbeiten. Was wünscht du dir als Feature?