Suchtechnologie und Chatbots. Berlin,

Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots Berlin, 12.07.2016 Suchmethoden im Überblick Keyword-basierte Suche  Exakte Suche...
1 downloads 1 Views 1MB Size
Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots

Berlin, 12.07.2016

Suchmethoden im Überblick Keyword-basierte Suche  Exakte Suche nach Textketten  Suche nach „abfall“ wird übersetzt in „*abfall*“ und findet z.B. – Abfallgebühr – Bioabfall – Gartenabfall  aber leider auch z.B. „abfallende Teile“  und leider nicht „Register zur Entsorgung von Abfällen“  (wird aber oft durch phonetische Suche ergänzt)

Semantische Suche

„machine learning“ Suche

 Nutzung von „Hintergrundwissen“ (z.B. Thesauri, semantische Netze, Ontologien), um Suche zu verbessern

 Lerndaten bringen der Maschine stochastische Zusammenhänge bei, die dann auch bei ganz anderen Suchanfragen funktionieren

 Bei EA sind das z.B. die Synonyme im LeiKa-Plus (als Thesaurus), womit dann bei „abfall“ auch „Hausmüll“ gefunden wird

 Nutzerverhalten „schult“ die Suchmaschine kontinuierlich  Beispiele für „machine learning“ – Google (Suche) – Amazon (Suche und Produktempfehlung) publicplan & d-NRW 2016

Was kann „machine learning“?

Unstrukturierte Daten erkennen und analysieren

Komplexe Fragen verstehen

Antworten und Lösungen präsentieren

Natürlich-sprachige Fragen beantworten

Echte Informationen aus Dokumenten extrahieren und verstehen

Erkenntnisse, Muster und Verbindungen in Daten erkennen publicplan & d-NRW 2016

Wie läuft „machine learning“ ab? … am Beispiel EA 2.0 1. LeiKa-Katalog laden (992426382828|Abfallentsorgung) 2. LeiKa-Synonyme aus LeiKa-Plus laden 3. D115-Top100 laden 4. Listen der Bundesländer laden, die bereits LeiKa-Code mit Dienstleistungstext verbunden haben 5. (automatische Kodierung von Leistungen für verbliebene Bundesländer) 6. Nachkorrigierte Listen der Bundesländer laden 7. (aus Nutzerverhalten lernen) publicplan & d-NRW 2016

DEMO http://leikamagic.test.publicplan.de

publicplan & d-NRW 2016

Zusammenfassung „machine learning“ Vorteile

Nachteile

 Ist mindestens so gut wie „keyword search“ und „semantic search“ (aber i.d.R. sogar besser)

 Muss „benutzt“ werden, um besser zu werden (und damit auch zu funktionieren)

 „versteht“ natürlich sprachige Anfragen (kein Verwaltungsdeutsch notwendig)

 Macht daher nur „zentral“ betrieben Sinn

 Erfordert relativ wenig Verwaltungsarbeit vorab (es müssen keine Thesauri, semantischen Netze oder Ontologien gebaut werden) publicplan & d-NRW 2016

Dialogische Suche / Chatbot  Eine Suchmaschine mit „machine learning“ kann auch Suchdialoge unterstützen, um alle für eine vollständige Suchabfrage notwendigen Informationen beim Benutzer zu erfragen (LeiKa-Code und Ort/AGS).  Ebenso sind Audioeingaben in entsprechende Dialoge übersetzbar (wie bei Google‘s Suchmaske).

publicplan & d-NRW 2016

DEMO http://leikamagic.test.publicplan.de/bot.php

publicplan & d-NRW 2016

Zusammenfassung „Chatbot“ Vorteile

Nachteile

 Multichannel – Im eigenen Portal zu integrieren – In allen gängigen Messengern – In allen Social Media-Plattformen (Facebook, Twitter, …)  Mehrsprachigkeit  Für viele Szenarien schnell zum Ziel  Näher am Bürger/Unternehmen als eine normale Internetseite  Laut IT-Experten die Ablösung der AppTechnologie

 Muss „benutzt“ werden, um besser zu werden (und damit auch zu funktionieren)  Macht daher nur „zentral“ betrieben Sinn

publicplan & d-NRW 2016

Thank

!

Kontakt d-NRW Besitz-GmbH & Co. KG Rheinische Straße 1 44137 Dortmund Telefon +49 231 222438-10 [email protected]

www.d-nrw.de

Kontakt publicplan GmbH Bilker Str. 29 40213 Düsseldorf Telefon +49 211 635501-80 [email protected] publicplan & d-NRW 2016

www.publicplan.de

YOURLOGO

Wie funktioniert „machine learning“? Phase 1

Phase 2

Daten laden Unstrukturiert: Internetseiten, Dokumente Strukturiert: Zuständigkeiten, Offene Daten

Phase 3

Lernen Lernen eines Themas durch Laden von Trainingsdatensätzen (Frageund Antwortpaare; manuelles Lernen oder automatisches Lernen)

Aktualisierung Beim Laden neuer Daten werden diese automatisch “verstanden”.

Wie funktioniert dann die Suche? 1. Neben klassischen Suchanfragen warden auch muttersprachliche Fragen akzeptiert und “verstanden”. 2. Der Suchindex wird klassisch durchsucht. 3. Auf Basis der Lerndaten wird ein individueller Scoring-Algorithmus ermittelt. 4. Alle möglichen Treffer werden mit dem Scoring gewichtet und gefiltert. publicplan & d-NRW 2016