Vergrößerung der Datengrundlage in Netz-Encodern
Die eingebauten NetEncoders können auf unterschiedliche Weise Vergrößerungen der Datengrundlage online durchführen, bevor sie Rechenfunktionen ausführen. Die Datenvergrößerung ist nützlich, um die effektive Größe eines Datensatzes zu erhöhen, um trainierte Modelle robuster gegen Überanpassung zu machen oder um einige spezifische Aspekte der Daten mit Invarianz zu versehen.
Erstellen Sie ein Testsignal und zeichnen Sie es auf.
Erstellen Sie einen Encoder, der jedes Trainingsbeispiel um eine Menge reduziert, die zufällig aus einer gleichmäßigen Verteilung zwischen ± entnommen wird. Dies kann dazu beitragen, dass ein Modell unabhängiger von der Lokalität eines Audioereignisses wird.
Erstellen Sie einen Encoder, der die Amplitude seiner Eingänge zufällig anpasst, indem Sie jedes Beispiel mit einem konstanten Faktor multiplizieren, der zufällig aus einer gleichmäßigen Verteilung entnommen wird.
Erstellen Sie einen Encoder, der jedem Beispiel Rauschen aus einem bestimmten Modell (hier eine Sinuswelle) hinzufügt, wobei ein Rauschpegel aus einer gleichmäßigen Verteilung zwischen 0 und 0,1 abgetastet wird..
Erstellen Sie einen Encoder, der jedes Trainingsbeispiel mit einem anderen Signal unter Verwendung eines zufällig abgetasteten Mischpegels verwirrt. Dies ist nützlich, um die Auswirkungen verschiedener Aufnahmeumgebungen zu simulieren, z.B. durch Hinzufügen von Hall.
Bei Verwendung eines der "AudioMelSpectrogram"- oder "AudioMFCC"-Encoder kann der Abstand der Mitten der Filterbänke, die zur Zusammenfassung des Leistungsspektrums verwendet werden, zufällig verzerrt werden, um die Wirkung unterschiedlicher Stimmbandlängen in der menschlichen Sprachproduktion zu simulieren. Erstellen Sie einen Encoder mit der "VTLP"-Vergrößerung der Daten, bei der der Warpfaktor aus einer gleichmäßigen Verteilung zwischen 0,5 und 2 zufällig abgetastet wird.