音频的比赛主要有两个大的方向
一是视觉类方法,通过梅尔谱识别
二是自然语言处理方法,尤其涉及人类语音识别
wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations
Last updated 3 days ago