Leading-Edge Spracherkennungstechnologie aus Sachsen (Neural Speech) Projekt uri icon

Hauptsprache

  • eng

Interdisziplinäres Projekt

  • false

Internationale Kooperation

  • false

Projektname

  • Leading-Edge Spracherkennungstechnologie aus Sachsen (Neural Speech)

ZAFT-Anbindung

  • false

Beschreibung

  • Ziel im Forschungs- und Entwicklungsvorhaben Neural Speech ist die Entwicklung eines initialen automatischen Spracherkennungssystems (ASR-Systems) sowie ASR-Technologien, die eine automatisierte Anpassung des
    ASR-Systems an verschiedene Nutzeranforderungen und Plattformen ermöglichen. Konkret erforschen die Linguwerk GmbH (Linguwerk} und die Hochschule für Technik und Wirtschaft in Dresden (HTW) folgende ASR-Technologien:

    • Algorithmische ASR-Basistechnologie: Bibliothek von Basisalgorithmen, die ASR-spezifisch sind und die algorithmische Grundlage für das gesamte ASR-System und seine zugehörigen Module bilden.
    • ASR-Engine-Technologie: State-of-the-Art-Erkennungstechnologie, die sprach-, plattform- und domainspezifische Anpassungen ermöglicht und somit hohe Flexibilität bietet.
    • ASR-Toolset: Eine komplexe Sammlung von Tools (Toolchain ), mit der ASR-Modelle flexibel erzeugt und ASR-Systeme optimal sprach-, plattform- und domainspezifisch konfiguriert und adaptiert werden können. Bei der notwendigen Automatisierung der Einzeltools werden in erhöhtem Maße Machine-Learning-Technologien verwendet.
    • ASR-Korpusmanagement: ASR-Datenmanagement-Technologien, die akquirierte Rohdaten in normalisierte Daten für Modelltraining, -entwicklung und -evaluation Machine-Learning-basiert umwandeln.
    • ASR-Customization -Technologie: Interface auf Basis von ASR-Technologie, die es Anwendern ohne ASR-Expertise ermöglicht, Anpassungen des ASR-Systems selbst vorzunehmen.

    Letztlich entsteht eine weltweit einzigartige ASR-Technologie, die es auch Anwendern ohne ASR-Expertise ermöglicht, ein an die eigenen Bedürfnisse angepasstes ASR-System selbst zu entwickeln.
    Forschungsschwerpunkte Neural Speech HTW sind:

    • Erforschung neuartiger algorithmischer und Machine-Learning-gestützer Ansätze zur Feature-Extraktion, geeignet für LVCSR
    • Erforschung neuartiger Ansätze ASR-Modellierung und -Training (Machine-Learning-Ansätze)- Schwerpunkt akustische Modellierung
    • Erforschung neuartiger Ansätze zur Automatisierung von Machine-Learning-basierten Trainings- und Modellierungsverfahren - Schwerpunkt akustische Modellierung sowie zusammen mit Linguwerk den Schwerpunkt lexikalische Modellierung
    • Erforschung der Möglichkeiten der automatisierten domainspezifischen Anpassung der Decoder Engine

Datum/Uhrzeit-Intervall

  • April 29, 2019 - Dezember 31, 2022

Drittmittel

  • false

Industrie

  • false

Privat

  • false

Öffentlich

  • false