Industrie
 Fachbereich Industrie

Effiziente Datenerfassung durch Spracherkennung

Spracherkennung steigert die Produktivität im Bereich Datenerfassung, Steuerung von Systemen in der Qualitätssicherung, Logistik, Labordatenerfassung, Produktion und vielen anderen Einsatz­bereichen.


Spracherkennung in der Industrie

SmartVoice

Die Spracherkennungslösung SmartVoice gehört zum Bereich der kommandobasierten Sprachsteuerungen. Diese Art der Texterfassung bzw. Datenerfassung ist vor allem da nützlich, wo man keine Hände frei hat und auf seine Sprache angewiesen ist. SmartVoice arbeitet mit einem speziell für den Einsatz in der Datenerfassung entwickelten Sprach­erkenner von Nuance.

Im Gegensatz zur Spracherkennungslösung Dragon® NaturallySpeaking, welche für die Umsetzung von Diktaten entwickelt wurde, arbeitet dieser Erkenner sprecherunabhängig, das heisst es ist kein Training eines Sprecherprofils durch den Benutzer notwendig. Das ist vor allem wichtig in Einsatzbereichen in denen der Sprecher häufiger wechselt.

Vorgehen: Sollen in einem Unternehmen Daten per Spracheingabe erfasst werden, werden die zu erkennenden Wörter vorab definiert oder während der Laufzeit des Programms dynamisch (z.B. durch Datenbankabfragen oder hinterlegte Listen) erstellt. Das hat zur Folge, dass nur solche Wörter im Vokabular bereitgestellt werden, die auch erkannt werden sollen. Damit wird eine sehr hohe Erkennungsgenauigkeit gewährleistet. Das Verhalten des Spracherkenners kann durch eine genaue Parametrisierung an das Einsatzgebiet optimal angepasst werden.

Weitere Informationen

Beispiel: In der Retourenerfassung des Schwab Versands gibt es durch die Förderbänder ein relativ lautes Hintergrundgeräusch. Ein spezieller Parameter kann so eingestellt werden, dass der Spracherkenner nur dann mit der Erkennung beginnt, wenn der Sprecher in das Mikrophon spricht, da dann der Wert des Hintergrundgeräusches überschritten wird. Dadurch kann der Erkenner unterscheiden, wann tatsächlich Sprache über das Mikrofon aufgenommen wird.

Zu jedem einzelnen Wort bzw. jeder Äusserung, die im Vokabular definiert wird, kann einzeln bestimmt werden, was im Falle einer Erkennung geschehen soll. Folgende Möglichkeiten stehen zur Verfügung:

  • Übergabe des erkannten Wortes an die Zielapplikation
  • Übergabe einer beliebigen Tastaturfolge inkl. Sondertasten an die Zielapplikation
  • Übergabe einer Kombination aus Zeichen- und Tastaturfolge an die Zielapplikation
  • Ausführen eines Skriptes mit der Abfolge mehrer Anweisungen
  • Ausführen eines SQL Kommandos in eine Datenbank (Access, SQL Server, Oracle etc)

Weitere Funktionsmerkmale:

  • sprecherunabhängiges Spracherkennungssystem (Einzelworttraining möglich)
  • Vokabularwechsel zur Laufzeit, z.B. bei Fensterwechsel in der Zielapplikation
  • geringer Ressourcenverbrauch des Erkenners (ab 300 MHz CPU)
  • eigene Wörterbücher mit speziellen Aussprachevarianten möglich
  • unempfindlich gegen hohen Hintergrundgeräuschpegel

Praxisbeispiele

Spracherkennung im Logistikunternehmen

Der Warenrücklauf der Schwab Versand GmbH in Hanau bei Frankfurt gleicht einem emsigen Bienenstock: Zurückgesandte Pakete in allen möglichen Grössen und Formen gleiten auf Förderbändern durch die Halle, wollen gesichtet, sortiert und weitergeleitet werden. Mehr als 270 000 Rückläufe wickeln die Mitarbeiter der Abteilung Tag für Tag auf diese Weise ab.

Seit Dezember 2004 erleichtern ihnen dabei Headsets die Arbeit: Statt mit der Tastatur stellen die Mitarbeiter nun bei der Sichtung der eingehenden Ware ihre Diagnose mit rund 25 prägnanten Begriffen, beispielsweise «Webfehler» bei Textilien. Die Bewegung der Förderbänder steuern sie mit Befehlen wie «weiter» oder «manuell». «Durch die Headsets haben wir beide Hände frei, müssen uns bei der Diagnose nicht mit dem Computer befassen und arbeiten insgesamt sehr viel schneller», sagen die Beurteilerinnen des Versandhauses.

Die Produktivität der Abteilung hat sich seit der Einführung der Spracherkennung merklich gesteigert. Inzwischen hat auch der Mutterkonzern Otto Versand das System nach Testläufen für die eigene Reklamationsabteilungen übernommen.

In den Versandhäusern wird die individuell angepasste Spracherkennungslösung SmartVoice eingesetzt.

Typische weitere Anwendungen sind die Kommissionierung von Lagerbeständen oder das schnelle Sortieren von Post per Spracheingabe. Die Post Liechtenstein hat so bereits über 1 Million Sendungen per Sprache verarbeitet. Im Prototypenbau der Volkswagen AG sprechen Qualitätsprüfer ihre Bewertungen in ihre Headsets und haben so auch während einer Inspektion im Fahrzeuginneren beide Hände frei.

Anwenderbericht Liechtensteinische Post AG (PDF)


Produktinformationen

Spracherkennungslösung SmartVoice

Gerne beraten wir Sie bezüglich einer auf Ihr Umfeld angepassten Lösung.

SmartVoice (PDF)