Bereits der altägyptische Wundenbuch-Papyrus ist ein Beispiel dafür, dass eine gute medizinische Dokumentation die Qualität einer medizinischen Dienstleistung erhöht: mit ihr lassen sich die Struktur-, Prozess- und Ergebnisqualität verbessern. Zur Abrechnung einer Leistung dient die medizinische Dokumentation zunächst der Bereitstellung von strukturierten oder kodierten Informationen, die eine klinische Situation im Rahmen eines Vergütungssystems wie DRG (Diagnosis Related Groups) oder EBM (Einheitlicher Bewertungsmaßstab) repräsentieren soll. Wenn die Vergütung einer medizinischen Leistung zunehmend an der Ergebnisqualität orientiert wird, ist eine sorgfältige und zeitnahe digitale medizinische Dokumentation mehr denn je Voraussetzung für medizinischen und ökonomischen Erfolg.
Digitalisierung: Zeitersparnis durch Spracherkennung
Die Digitalisierung der Medizin beinhaltet die Notwendigkeit, klinische Informationen digital verfügbar zu machen. Das muss sowohl am Patientenbett als auch bei der mobilen Visite oder beim Hausbesuch gelingen. Daher ist Spracherkennung eine sinnvolle und notwendige Ergänzung der Dokumentationsprozesse und wir erreichen eine enorme Zeitersparnis durch Spracherkennung. Exzellente Lösungen beinhalten heute KI-basierte hochmoderne Technologien wie Maschinelles Lernen. Dies geschieht in sogenannten Neuronalen Netzen mit Hilfe komplexer statistischer Modelle. Moderne Spracherkennungssoftware wie Dragon Medical von Nuance hat dank dieser Technologien eine sehr hohe Erkennungsgenauigkeit und ist intuitiv anzuwenden. Damit gewinnt Spracherkennung außerhalb von Nischen eine immer größere Bedeutung.
Enorme Zeitersparnis bei der medizinischen Dokumentation
Elektronische Krankenakten lassen sich einfacher ausfüllen, die medizinische Dokumentation besser automatisieren und Qualitätsstandards einhalten. Zudem unterstützen intelligente Assistenz- und Beratungssysteme die klinische Arbeit immer öfter. Ärzte und Krankenschwestern sparen durch Spracherkennung und sofortige Befundverfügbarkeit Zeit. Davon profitieren vor allem die Patienten. Die sofortige Verfügbarkeit von cloud-basierter Spracherkennung stellt einen schnellen und effizienten Weg zur Digitalisierung von Informationen dar. Sie ermöglicht bessere Prozesse und mehr Zeit für Patienten.
Die Grundlagen der Spracherkennung
Spracherkennung ist die elektronische Umwandlung von Sprache in Text. Sie arbeitet auf einer einheitlichen Grundlage, die vier wesentliche Elemente umfasst:
- Eine Sensorik erfasst Schallwellen (Audio)
- Eine Analytik setzt diese Schallwellen in charakteristische digitale Muster um (Extraktion)
- Diese Muster gleichen sprachlichen Informationen ab, die im Computer hinterlegt sind (Vergleich)
- Eine abschließende grammatikalische Interpretation (Ergebnis)
Aus diesem grundsätzlichen Ablauf ergeben sich wichtige Konsequenzen. Diese sind für den klinischen Einsatz und insbesondere für den meist intuitiv stattfindenden Vergleich mit einem menschlichen Hörer essenziell. Bereits ein defektes Mikrofon stört den Prozess. Während ein menschlicher Hörer hierüber Rückmeldung geben kann, ist dies einem Spracherkennungssystem nicht möglich.
Die Paradigmen der Spracherkennung
Spracherkennung erkennt nur bereits Bekanntes
In der klinischen Nutzung besteht oft die Erwartung, dass das System Namen von Patienten erkennt. Jedoch ist die Voraussetzung, dass der jeweilige Name der Software bereits bekannt ist. Aber dieses Dilemma ist nur durch einen erheblichen technischen Aufwand oder durch den Benutzer des Systems selbst lösbar.
- Das System „erkennt“, um welchen Patienten es geht und verwendet diesen Namen vorübergehend für die Erkennung. Voraussetzung ist der Zugriff der Spracherkennung auf das Krankenhausinformationssystem beziehungsweise auf eine Patientenliste.
- Der Benutzer fügt dem System den Namen hinzu. Hierdurch entsteht im Spracherkennungssystem eine Ansammlung von Namen, die möglicherweise durch den Benutzer in Zukunft gar nicht mehr benötigt werden. Die Anwesenheit nicht benötigter Annahmen erschwert dann den Abgleich.
- Der Benutzer verwendet den Namen nicht, sondern diktiert stattdessen z.B. „der Patient“ oder „die Patientin“.
Spracherkennung schreibt auf, was gesagt wurde
Damit ein korrekter Text entsteht, müssen sämtliche Satzzeichen in der richtigen Reihenfolge und zum richtigen Zeitpunkt diktiert werden. Das Diktat von „in Klammern“ führt zum geschriebenen Text in Klammern. Um einen Abschnitt zu umklammern muss an der richtigen Stelle „Klammer auf“ und „Klammer zu“ diktiert werden
Spracherkennung bedeutet nicht Sprachverständnis
Im folgenden sind diese Funktionsebenen in der Anwendung abzugrenzen:
- Sprache wird in Text umgewandelt. Dies ist Spracherkennung im ursprünglichen Sinn.
- Sprache wird für Kommandos und Steuerung eines Computers oder einer Maschine verwendet und nicht aufgeschrieben.
- Sprache wird semantisch oder mittels künstlicher Intelligenz analysiert.
Man erwartet diese letzte Ebene intuitiv von einem Menschen. Jedoch findet die klinische Anwendung von Spracherkennung zur Zeit vorwiegend in Ebene I oder Ebene II statt. In Zukunft entstehen fließende Übergänge zwischen den Ebenen.
Abschließend sei gesagt, die erfolgreiche Anwendung von Spracherkennung stellt einen Schlüssel zur Digitalisierung der Medizin dar. Zudem ist der Erfolg eine immense Zeitersparnis durch Spracherkennung. Das beruht darauf, dass meist deutlich schneller gesprochen, als getippt oder geschrieben werden kann. Dementsprechend sind Ärzte hoch zufrieden, wenn sie den diktierten Text wenig korrigieren müssen.
Wir erläutern was dabei zu beachten ist in Teil 2 unseres Blogeintrags ‚Spracherkennung in der Medizin‘.