Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots
Berlin, 12.07.2016
Suchmethoden im Überblick Keyword-basierte Suche Exakte Suche nach Textketten Suche nach „abfall“ wird übersetzt in „*abfall*“ und findet z.B. – Abfallgebühr – Bioabfall – Gartenabfall aber leider auch z.B. „abfallende Teile“ und leider nicht „Register zur Entsorgung von Abfällen“ (wird aber oft durch phonetische Suche ergänzt)
Semantische Suche
„machine learning“ Suche
Nutzung von „Hintergrundwissen“ (z.B. Thesauri, semantische Netze, Ontologien), um Suche zu verbessern
Lerndaten bringen der Maschine stochastische Zusammenhänge bei, die dann auch bei ganz anderen Suchanfragen funktionieren
Bei EA sind das z.B. die Synonyme im LeiKa-Plus (als Thesaurus), womit dann bei „abfall“ auch „Hausmüll“ gefunden wird
Nutzerverhalten „schult“ die Suchmaschine kontinuierlich Beispiele für „machine learning“ – Google (Suche) – Amazon (Suche und Produktempfehlung) publicplan & d-NRW 2016
Was kann „machine learning“?
Unstrukturierte Daten erkennen und analysieren
Komplexe Fragen verstehen
Antworten und Lösungen präsentieren
Natürlich-sprachige Fragen beantworten
Echte Informationen aus Dokumenten extrahieren und verstehen
Erkenntnisse, Muster und Verbindungen in Daten erkennen publicplan & d-NRW 2016
Wie läuft „machine learning“ ab? … am Beispiel EA 2.0 1. LeiKa-Katalog laden (992426382828|Abfallentsorgung) 2. LeiKa-Synonyme aus LeiKa-Plus laden 3. D115-Top100 laden 4. Listen der Bundesländer laden, die bereits LeiKa-Code mit Dienstleistungstext verbunden haben 5. (automatische Kodierung von Leistungen für verbliebene Bundesländer) 6. Nachkorrigierte Listen der Bundesländer laden 7. (aus Nutzerverhalten lernen) publicplan & d-NRW 2016
DEMO http://leikamagic.test.publicplan.de
publicplan & d-NRW 2016
Zusammenfassung „machine learning“ Vorteile
Nachteile
Ist mindestens so gut wie „keyword search“ und „semantic search“ (aber i.d.R. sogar besser)
Muss „benutzt“ werden, um besser zu werden (und damit auch zu funktionieren)
„versteht“ natürlich sprachige Anfragen (kein Verwaltungsdeutsch notwendig)
Macht daher nur „zentral“ betrieben Sinn
Erfordert relativ wenig Verwaltungsarbeit vorab (es müssen keine Thesauri, semantischen Netze oder Ontologien gebaut werden) publicplan & d-NRW 2016
Dialogische Suche / Chatbot Eine Suchmaschine mit „machine learning“ kann auch Suchdialoge unterstützen, um alle für eine vollständige Suchabfrage notwendigen Informationen beim Benutzer zu erfragen (LeiKa-Code und Ort/AGS). Ebenso sind Audioeingaben in entsprechende Dialoge übersetzbar (wie bei Google‘s Suchmaske).
publicplan & d-NRW 2016
DEMO http://leikamagic.test.publicplan.de/bot.php
publicplan & d-NRW 2016
Zusammenfassung „Chatbot“ Vorteile
Nachteile
Multichannel – Im eigenen Portal zu integrieren – In allen gängigen Messengern – In allen Social Media-Plattformen (Facebook, Twitter, …) Mehrsprachigkeit Für viele Szenarien schnell zum Ziel Näher am Bürger/Unternehmen als eine normale Internetseite Laut IT-Experten die Ablösung der AppTechnologie
Muss „benutzt“ werden, um besser zu werden (und damit auch zu funktionieren) Macht daher nur „zentral“ betrieben Sinn
publicplan & d-NRW 2016
Thank
!
Kontakt d-NRW Besitz-GmbH & Co. KG Rheinische Straße 1 44137 Dortmund Telefon +49 231 222438-10
[email protected]
www.d-nrw.de
Kontakt publicplan GmbH Bilker Str. 29 40213 Düsseldorf Telefon +49 211 635501-80
[email protected] publicplan & d-NRW 2016
www.publicplan.de
YOURLOGO
Wie funktioniert „machine learning“? Phase 1
Phase 2
Daten laden Unstrukturiert: Internetseiten, Dokumente Strukturiert: Zuständigkeiten, Offene Daten
Phase 3
Lernen Lernen eines Themas durch Laden von Trainingsdatensätzen (Frageund Antwortpaare; manuelles Lernen oder automatisches Lernen)
Aktualisierung Beim Laden neuer Daten werden diese automatisch “verstanden”.
Wie funktioniert dann die Suche? 1. Neben klassischen Suchanfragen warden auch muttersprachliche Fragen akzeptiert und “verstanden”. 2. Der Suchindex wird klassisch durchsucht. 3. Auf Basis der Lerndaten wird ein individueller Scoring-Algorithmus ermittelt. 4. Alle möglichen Treffer werden mit dem Scoring gewichtet und gefiltert. publicplan & d-NRW 2016