Leading-Edge Spracherkennungstechnologie aus Sachsen (Neural Speech)
Projekt
Überblick
Hauptsprache
- eng
Interdisziplinäres Projekt
- false
Internationale Kooperation
- false
Projektname
- Leading-Edge Spracherkennungstechnologie aus Sachsen (Neural Speech)
Projektstatus
Projekttyp
ZAFT-Anbindung
- false
Beschreibung
-
Ziel im Forschungs- und Entwicklungsvorhaben Neural Speech ist die Entwicklung eines initialen automatischen Spracherkennungssystems (ASR-Systems) sowie ASR-Technologien, die eine automatisierte Anpassung des
ASR-Systems an verschiedene Nutzeranforderungen und Plattformen ermöglichen. Konkret erforschen die Linguwerk GmbH (Linguwerk} und die Hochschule für Technik und Wirtschaft in Dresden (HTW) folgende ASR-Technologien:• Algorithmische ASR-Basistechnologie: Bibliothek von Basisalgorithmen, die ASR-spezifisch sind und die algorithmische Grundlage für das gesamte ASR-System und seine zugehörigen Module bilden.
• ASR-Engine-Technologie: State-of-the-Art-Erkennungstechnologie, die sprach-, plattform- und domainspezifische Anpassungen ermöglicht und somit hohe Flexibilität bietet.
• ASR-Toolset: Eine komplexe Sammlung von Tools (Toolchain ), mit der ASR-Modelle flexibel erzeugt und ASR-Systeme optimal sprach-, plattform- und domainspezifisch konfiguriert und adaptiert werden können. Bei der notwendigen Automatisierung der Einzeltools werden in erhöhtem Maße Machine-Learning-Technologien verwendet.
• ASR-Korpusmanagement: ASR-Datenmanagement-Technologien, die akquirierte Rohdaten in normalisierte Daten für Modelltraining, -entwicklung und -evaluation Machine-Learning-basiert umwandeln.
• ASR-Customization -Technologie: Interface auf Basis von ASR-Technologie, die es Anwendern ohne ASR-Expertise ermöglicht, Anpassungen des ASR-Systems selbst vorzunehmen.Letztlich entsteht eine weltweit einzigartige ASR-Technologie, die es auch Anwendern ohne ASR-Expertise ermöglicht, ein an die eigenen Bedürfnisse angepasstes ASR-System selbst zu entwickeln.
Forschungsschwerpunkte Neural Speech HTW sind:• Erforschung neuartiger algorithmischer und Machine-Learning-gestützer Ansätze zur Feature-Extraktion, geeignet für LVCSR
• Erforschung neuartiger Ansätze ASR-Modellierung und -Training (Machine-Learning-Ansätze)- Schwerpunkt akustische Modellierung
• Erforschung neuartiger Ansätze zur Automatisierung von Machine-Learning-basierten Trainings- und Modellierungsverfahren - Schwerpunkt akustische Modellierung sowie zusammen mit Linguwerk den Schwerpunkt lexikalische Modellierung
• Erforschung der Möglichkeiten der automatisierten domainspezifischen Anpassung der Decoder Engine
Datum/Uhrzeit-Intervall
- April 29, 2019 - Dezember 31, 2022
Zugehörigkeit
Organisationen
- Faculty of Electrical Engineering Organisation
Finanzierungsinformationen
Drittmittel
- false
Industrie
- false
Privat
- false
Öffentlich
- false