HITSZ IoT

0%

There are 15 posts in total. Please find the blog you want to see.

MS-VBRVQ: Multi-Scale Variable Bitrate Speech Residual Vector Quantization

DTMSE: Masked Language Model Based on Discrete Tokens for Multi-Channel Speech Enhancement

FSformer: Sparsely and Effectively Learning Key Features for Multi-channel Speech Enhancement

PriorSinger: Singing voice synthesis diffusion model with prior condition cross attention

Hybrid Feature Global Attention Network for Noisy-reverberant Speech Enhancement

CSTF-SENet: A Single-Channel Speech Enhancement Model with Cross-Scale Temporal-Frequency Transformer

Hybrid Lightweight Attentive Fourier Network for Multichannel Speech Enhancement

FSTF-AN: Fused Sparse Temporal-Frequency Attentive Network for Multi-channel Speech Enhancement

SF-AN: A Lightweight Shuffle Fourier Attention Network for Multi-channel Speech Enhancement

Two-stage UNet with Channel and Temporal-Frequency Attention for Multi-Channel Speech Enhancement

Supervised Attention Multi-Scale Temporal Convolutional Network for Monaural Speech Enhancement in Real Scenarios

Dual branch deep interactive UNet for monaural noisy-reverberant speech enhancement