In unserem letzten Blog haben wir die Konzepte vorgestellt, auf denen Spracherkennung basiert. Heute möchten wir darauf eingehen, was beim Einsatz von Spracherkennung zu beachten ist, um hervorragende Ergebnisse zu erreichen.
Die erfolgreiche Anwendung von Spracherkennung stellt einen Schlüssel zur Digitalisierung der Medizin dar. Spracherkennung ermöglicht einen unmittelbaren Geschwindigkeitsvorteil. Da meist deutlich schneller gesprochen, als getippt oder geschrieben werden kann. Dementsprechend sind Zufriedenheit und Arbeitstempo hoch, wenn an dem diktierten Text wenig Korrekturen erfolgen müssen.
Hierfür sind folgende Regeln zu beachten:
1. Anpassung der Erkennung
Auch bei einer technisch exzellenten Funktionsweise des verwendeten Spracherkennungssystems gelten die folgenden Paradigmen:
- Audio
- Extraktion
- Vergleich
- Ergebnis
Für eine optimale Funktion der Systeme ist eine Ausrichtung an gegenwärtig verwendeter Sprache erforderlich. Eine grundsätzliche Anpassung findet prinzipiell durch den Hersteller im Hintergrund statt, z.B. Updates, gebührenpflichtige Anpassung. Im Sinne einer derartigen Anpassung ist die Auswahl sogenannter „Fachvokabulare“ zu verstehen. Der Nutzen spezialisierter Vokabulare wird zum einen durch die allgemeine Verbesserung der Spracherkennungssysteme gemindert. Und zum anderen durch die weiterbestehende Notwendigkeit der Individualisierung. Das oft propagierte Einlesen großer Textmengen zur Anpassung setzt voraus, dass aus der geschriebenen Form eines Begriffes auf die gesprochene Form des Begriffes geschlossen werden kann. Dies ist in der Medizin oft nicht der Fall.
Daher kommt der individuellen Anpassungsfähigkeit der Software eine große Bedeutung zu. Je nach verwendetem System erfolgt eine Anpassung durch Korrektur mit der Tastatur. Zusätzlich durch das Hinzufügen geschriebener Wörter und durch das Hinzufügen vorgesprochener Wörter.
2. Art der Erkennung
Mit einer Kombination dieser Möglichkeiten und Steuerung der Korrekturvorgänge durch Sprache werden mit modernsten Systemen wie dem Dragon Medical Server von Nuance in kürzester Zeit individuell perfekte Ergebnisse auf zahlreichen Endgeräten erzielt. Das Sprechen von Trainingstexten ist obsolet. Des Weiteren hat der Dialekt des Sprechers einen weitaus geringeren Einfluss auf das Erkennungsergebnis als die korrekte Grammatik des gesprochenen Textes. Zu einer effektiven Anpassung zählen auch das individualisierte Aufrufen von Textblöcken oder Kommandos zur Textformatierung oder Steuerung des Endgerätes.
Aus der Individualität von Sprache heraus folgt, dass sich Nutzer und Nutzerin zum Erreichen bester Funktionalität gegenüber dem Spracherkennungssystems identifizieren müssen. Diese Anmeldung am Spracherkennungssystem führt zur Auswahl eines sogenannten Sprachprofils. An Arbeitsplätzen mit einer hohen Zahl von Nutzern sollte der Wechsel des Sprachprofils möglichst schnell erfolgen können. Dies ist insbesondere dann der Fall, wenn der Ort der Erkennung nicht lokal auf dem Gerät erfolgt, in das gesprochen wird, sondern auf einem Server oder in der Cloud.
3. Ort der Erkennung
Spracherkennung setzt leistungsfähige IT-Hardware voraus. Beispielsweise erfolgt Spracherkennung im Rahmen der allgemeinen Nutzung auf mobilen Endgeräten in der Regel auf US-amerikanischen Servern. Hingegen führen die derzeit am meisten verbreiteten Systeme im medizinischen Bereich die Erkennung mit lokaler Hardware durch. Dies beeinträchtigt das Erkennungsergebnis – auch bei grundsätzlich steigender Leistungsfähigkeit der Hardware. Störender im klinischen Alltag ist allerdings die Einschränkung der Funktionalität. Mobilität oder individuelle Anpassungsvorgänge an verschiedenen Endgeräten etwa stehen gar nicht oder nur engeschränkt zur Verfügung.
Mit der fortschreitenden Digitalisierung der Medizin und dem zunehmenden Einsatz mobiler Endgeräte erlangt der Ort der Erkennung somit eine immer größere Bedeutung. Die Verarbeitung der Sprachdaten auf US-amerikanischen Servern ist im medizinischen Bereich entweder nicht wünschenswert oder nicht zulässig. Daher erscheinen lokale oder regionale Cloud-Lösungen die derzeit beste Lösung zu sein, um individualisierte Spracherkennung auf beliebigen Endgeräten verfügbar zu machen.
4. Zeitpunkt der Erkennung
Jedoch die größte Veränderung im klinischen Prozess stellt die sofortige Verfügbarkeit des Textes dar. Großer Nutzen wird durch eine gute Abstimmung eines Spracherkennungssystems mit den Belangen der klinischen Anwender hinsichtlich Dokumenten-Workflow, Formatierungen oder Einfügen Befunde Dritter erzielt.