VerSpiFah

Project management Prof. Dr.-Ing. Mohammed Krini
Research areas Intelligent Systems
Project duration 2018-10-01 - 2021-12-31
Share
- URL
- Mail
- Facebook
- X

Intelligent Mobility Artificial Intelligence and Data Science Intelligent Sensors and Signals

Verbesserte Sprachkommunikation in fahrenden Fahrzeugen. Entwicklung fortschrittlicher Methoden zur Sprachsignalverbesserung.

Förderung

Hintergrund

InterCom-Systeme werden unter anderem dazu eingesetzt, die Sprachkommunikation im Fahrzeuginnenraum zu verbessern. Ein solches System ist in der Lage, Sprachsignale von sprechenden Fahrgästen aufzuzeichnen, in Echtzeit zu verarbeiten und wiederzugeben, um die Sprachqualität und Sprachverständlichkeit für die zuhörenden Fahrgäste im Fahrzeug zu verbessern.

Akustische Rückkopplungen machen das System instabil, da sich die Mikrofone nahe bei den Lautsprechern befinden. Akustische Gegebenheiten und Störgeräusche sind weitere wichtige zu lösende Herausforderungen, um einerseits die Sprachverständlichkeit und Sprachqualität bei lauten Geräuschen zu erhöhen und andererseits zu bewirken, dass das InterCom-System Geräusche nicht verstärkt. Mit der Entwicklung geeigneter Algorithmen können diese Schwierigkeiten gelöst werden.

Ziele

Das InterCom-System arbeitet in einer geschlossenen elektroakustischen Schleife. Mikrofone nehmen die Sprachsignale auf und geben sie über die Lautsprecher in der Nähe der zuhörenden Passagiere wieder. Die Rückkopplungsschleife kann zu anhaltenden Schwingungen führen, die sich in störenden Pfeiftönen äußern. Die Bedingungen für die Wiedergabe eines Sprachsignals über Lautsprecher sind aufgrund der hohen Korrelation zwischen dem direkten Sprachsignal und der Lautsprecherausgabe schwierig. Dies erfordert neue modellbasierte Ansätze zur Identifizierung von Rückkopplungspfaden unter schwierigen Bedingungen für die Rückkopplungskompensation und Rückkopplungsunterdrückung.

Darüber hinaus wird die Sprachkommunikation in einem fahrenden Auto durch verschiedene Arten von Geräuschen (stationäre und instationäre Geräusche) beeinträchtigt. Bei starken oder impulshaften Geräuschen sind klassische Filterverfahren nicht zufriedenstellend. Leistungsfähigere Verfahren des maschinellen Lernens zur Sprachsignalverbesserung werden daher erforscht und künftig in dem System eingesetzt, mit dem zusätzlichen Ziel, stark gestörte Sprachkomponenten zu rekonstruieren.

Methoden

Spektrale und cepstrale Kurzzeitanalyse
Statistische Schätzverfahren
Modellbasierte Filter
Adaptive Filter
Maschinelles Lernen und neuronale Netze (z.B. Recurrent Neural Networks (RNN), Convolutional Neural Networks (CNN))

Kontakt

Projektleitung

Prof. Dr.-Ing. Mohammed Krini
Professor Fakultät Ingenieurwissenschaften und Informatik
1. Würzburger Straße 45
  Room C01/24/204
  63743 Aschaffenburg
2. mohammed.krini(at)th-ab.de
3. +49 6021 4206 517
Write a mail