Multimodal Emotion Recognition on RAVDESS Dataset Using Transfer Learning

. 2021 Nov 18;21(22):7665. doi: 10.3390/s21227665

FER	Facial Emotion Recognition
SER	Speech Emotion Recognition
RAVDESS	The Ryerson Audio-Visual Database of Emotional Speech and Song
ST	Spatial Transformer
CNN	Convolutional Neural Network
MTCNN	Multi-task Cascaded Convolutional Networks
Bi-LSTM	Bi-Directional Short-Term Memory networks
GAN	Generative Adversarial Networks
embs	embeddings
fc	fully-connected
SVC	Support Vector Machines/Classification
VAD	Voice Activity Detector
TL	Transfer-Learning
CI	Confidence Interval
CV	Cross-Validation