Category: Sound

Page 1/2

Unsupervised Audio-Caption Alignment via Correspondence Learning

Computer Science, Sound

Unsupervised Audio-Caption Alignment via Correspondence Learning

January 5, 2024

Enhancing Speaker Recognition with Gradient Weighting and Noise Suppression

Computer Science, Sound

Enhancing Speaker Recognition with Gradient Weighting and Noise Suppression

January 5, 2024

Generating Music Tracks with Unified Representation and Diffusion Framework: A Comparative Study

Computer Science, Sound

Generating Music Tracks with Unified Representation and Diffusion Framework: A Comparative Study

January 5, 2024

Efficient Assessment of Student Music Performances Using Deep Neural Networks

Computer Science, Sound

Efficient Assessment of Student Music Performances Using Deep Neural Networks

January 4, 2024

Enhancing Speech Emotion Recognition with Pretrained Models

Computer Science, Sound

Enhancing Speech Emotion Recognition with Pretrained Models

December 27, 2023

Voice Conversion Techniques: An Overview

Computer Science, Sound

Voice Conversion Techniques: An Overview

December 27, 2023

Self-Supervised Learning for Speech Recognition: A Comparative Study

Computer Science, Sound

Self-Supervised Learning for Speech Recognition: A Comparative Study

December 27, 2023

Designing Artificial Reverberation Networks with Control of Scattering and Early Reflections

Computer Science, Sound

Designing Artificial Reverberation Networks with Control of Scattering and Early Reflections

December 22, 2023

Unifying Embeddings for Face Recognition and Clustering

Computer Science, Sound

Unifying Embeddings for Face Recognition and Clustering

December 22, 2023

High-Fidelity Neural Audio Compression: A Comparative Study of Recent Methods

Computer Science, Sound

High-Fidelity Neural Audio Compression: A Comparative Study of Recent Methods

December 21, 2023

Improving Audio-Visual Speech Recognition with HuBERT: A Data-Driven Approach

Computer Science, Sound

Improving Audio-Visual Speech Recognition with HuBERT: A Data-Driven Approach

December 21, 2023

Comparing Deep Learning Models for Music Classification: A Comprehensive Study

Computer Science, Sound

Comparing Deep Learning Models for Music Classification: A Comprehensive Study

December 21, 2023

Rap Music Evolution: From Early 2000s to Global Dominance

Computer Science, Sound

Rap Music Evolution: From Early 2000s to Global Dominance

December 21, 2023

Recognizing Underwater Acoustic Signals with Multilevel Cascading and Anonymization

Computer Science, Sound

Recognizing Underwater Acoustic Signals with Multilevel Cascading and Anonymization

December 20, 2023

Speech Separation Techniques: Transformer, Attention, and Deep Learning

Computer Science, Sound

Speech Separation Techniques: Transformer, Attention, and Deep Learning

December 19, 2023

Improving Speech Emotion Recognition with Ablation Studies and Multi-Scale DNNs

Computer Science, Sound

Improving Speech Emotion Recognition with Ablation Studies and Multi-Scale DNNs

December 19, 2023

Semantic VAD: Low-Latency Voice Activity Detection for Speech Interaction

Computer Science, Sound

Semantic VAD: Low-Latency Voice Activity Detection for Speech Interaction

December 19, 2023

Accelerating Progress in Spoofed and Deepfake Speech Detection

Computer Science, Sound

Accelerating Progress in Spoofed and Deepfake Speech Detection

December 15, 2023

CHiME Speech Separation and Recognition Challenges: A Comprehensive Overview

Computer Science, Sound

CHiME Speech Separation and Recognition Challenges: A Comprehensive Overview

December 15, 2023

Unifying Streaming and Non-Streaming ASR with Cascaded Encoders

Computer Science, Sound

Unifying Streaming and Non-Streaming ASR with Cascaded Encoders

December 15, 2023