Jede Minute zählt: Zeitersparnis durch Spracherkennung in der Medizin

Zeitersparnis durch Spracherkennung Nuance Dragon Medical
Digitalisierung: Zeitersparnis durch Spracherkennung

Die Digitalisierung der Medizin beinhaltet die Notwendigkeit, klinische Informationen digital verfügbar zu machen. Das muss sowohl am Patientenbett als auch bei der mobilen Visite oder beim Hausbesuch gelingen. Daher ist Spracherkennung eine sinnvolle und notwendige Ergänzung der Dokumentationsprozesse und wir erreichen eine enorme Zeitersparnis durch Spracherkennung. Exzellente Lösungen beinhalten heute KI-basierte hochmoderne Technologien wie Maschinelles Lernen. Dies geschieht in sogenannten Neuronalen Netzen mit Hilfe komplexer statistischer Modelle. Moderne Spracherkennungssoftware wie Dragon Medical von Nuance hat dank dieser Technologien eine sehr hohe Erkennungsgenauigkeit und ist intuitiv anzuwenden. Damit gewinnt Spracherkennung außerhalb von Nischen eine immer größere Bedeutung.

Enorme Zeitersparnis bei der medizinischen Dokumentation

Elektronische Krankenakten lassen sich einfacher ausfüllen, die medizinische Dokumentation besser automatisieren und Qualitätsstandards einhalten. Zudem unterstützen intelligente Assistenz- und Beratungssysteme die klinische Arbeit immer öfter. Ärzte und Krankenschwestern sparen durch Spracherkennung und sofortige Befundverfügbarkeit Zeit. Davon profitieren vor allem die Patienten. Die sofortige Verfügbarkeit von cloud-basierter Spracherkennung stellt einen schnellen und effizienten Weg zur Digitalisierung von Informationen dar. Sie ermöglicht bessere Prozesse und mehr Zeit für Patienten.

Die Grundlagen der Spracherkennung

Spracherkennung ist die elektronische Umwandlung von Sprache in Text. Sie arbeitet auf einer einheitlichen Grundlage, die vier wesentliche Elemente umfasst:

  1.  Eine Sensorik erfasst Schallwellen (Audio)
  2.  Eine Analytik setzt diese Schallwellen in charakteristische digitale Muster um (Extraktion)
  3.  Diese Muster gleichen sprachlichen Informationen ab, die im Computer hinterlegt sind (Vergleich)
  4.  Eine abschließende grammatikalische Interpretation (Ergebnis)

Aus diesem grundsätzlichen Ablauf ergeben sich wichtige Konsequenzen. Diese sind für den klinischen Einsatz und insbesondere für den meist intuitiv stattfindenden Vergleich mit einem menschlichen Hörer essenziell. Bereits ein defektes Mikrofon stört den Prozess. Während ein menschlicher Hörer hierüber Rückmeldung geben kann, ist dies einem Spracherkennungssystem nicht möglich.

Die Paradigmen der Spracherkennung
Spracherkennung erkennt nur bereits Bekanntes

In der klinischen Nutzung besteht oft die Erwartung, dass das System Namen von Patienten erkennt. Jedoch ist die Voraussetzung, dass der jeweilige Name der Software bereits bekannt ist. Aber dieses Dilemma ist nur durch einen erheblichen technischen Aufwand oder durch den Benutzer des Systems selbst lösbar.

    1. Das System „erkennt“, um welchen Patienten es geht und verwendet diesen Namen vorübergehend für die Erkennung. Voraussetzung ist der Zugriff der Spracherkennung auf das Krankenhausinformationssystem beziehungsweise auf eine Patientenliste.
    2. Der Benutzer fügt dem System den Namen hinzu. Hierdurch entsteht im Spracherkennungssystem eine Ansammlung von Namen, die möglicherweise durch den Benutzer in Zukunft gar nicht mehr benötigt werden. Die Anwesenheit nicht benötigter Annahmen erschwert dann den Abgleich.
    3. Der Benutzer verwendet den Namen nicht, sondern diktiert stattdessen z.B. „der Patient“ oder „die Patientin“.
Spracherkennung schreibt auf, was gesagt wurde

Damit ein korrekter Text entsteht, müssen sämtliche Satzzeichen in der richtigen Reihenfolge und zum richtigen Zeitpunkt diktiert werden. Das Diktat von „in Klammern“ führt zum geschriebenen Text in Klammern. Um einen Abschnitt zu umklammern muss an der richtigen Stelle „Klammer auf“ und „Klammer zu“ diktiert werden

Spracherkennung bedeutet nicht Sprachverständnis

Im folgenden sind diese Funktionsebenen in der Anwendung abzugrenzen:

  1. Sprache wird in Text umgewandelt. Dies ist Spracherkennung im ursprünglichen Sinn.
  2. Sprache wird für Kommandos und Steuerung eines Computers oder einer Maschine verwendet und nicht aufgeschrieben.
  3. Sprache wird semantisch oder mittels künstlicher Intelligenz analysiert.

Man erwartet diese letzte Ebene intuitiv von einem Menschen. Jedoch findet die klinische Anwendung von Spracherkennung zur Zeit vorwiegend in Ebene I oder Ebene II statt. In Zukunft entstehen fließende Übergänge zwischen den Ebenen.

Abschließend sei gesagt, die erfolgreiche Anwendung von Spracherkennung stellt einen Schlüssel zur Digitalisierung der Medizin dar. Zudem ist der Erfolg eine immense Zeitersparnis durch Spracherkennung. Das beruht darauf, dass meist deutlich schneller gesprochen, als getippt oder geschrieben werden kann. Dementsprechend sind Ärzte hoch zufrieden, wenn sie den diktierten Text wenig korrigieren müssen.

Wir erläutern was dabei zu beachten ist in Teil 2 unseres Blogeintrags ‚Spracherkennung in der Medizin‘.

Jetzt runterladen und lesen!

Künstliche Intelligenz für die medizinische Dokumentation: Dokumentationsprozesse optimieren und beschleunigen und damit die Patientenbetreuung und -zufriedenheit verbessern.

Mehr Informationen

Über Milko Jovanoski

Milko Jovanoski ist seit 2012 bei Nuance Healthcare, wo er zunächst für das Partner und Produkt Marketing in Europa zuständig war. Seit 2015 ist er als International Marketing Manager Healthcare für den gesamten Bereich Marketing in den Regionen EMEA, APAC und LatAM verantwortlich. Herr Jovanoski verfügt über langjährige Erfahrung mit Spracherkennung und war vor seiner Tätigkeit bei Nuance in verschiedenen Managementpositionen in Sales & Marketing in Healthcare-IT tätig. Milko Jovanoski verfügt über einen Executive Master of Business Administration von der Fachhochschule in Chur, Schweiz.