Audio Course documentation
코스에 대한 이해도를 체크해보세요
0단원. 코스에 오신 것을 환영합니다!
1단원. 오디오 데이터 다루기
2단원. 오디오의 응용에 대한 소개
3단원. 오디오용 트랜스포머 아키텍처
코스 이벤트
코스에 대한 이해도를 체크해보세요
1. 샘플링 속도는 어떤 단위를 사용합니까?
2. 큰 오디오 데이터셋을 스트리밍한다면 어느 시점부터 이를 사용할 수 있습니까?
3. 스펙트로그램이란 무엇인가요?
4. 원시 오디오 데이터를 Whisper에 적합한 로그-멜 스펙트로그램으로 변환하는 가장 쉬운 방법은?
A.
librosa.feature.melspectrogram(audio["array"])B.
feature_extractor = WhisperFeatureExtractor.from_pretrained("openai/whisper-small")
feature_extractor(audio["array"])C.
dataset.feature(audio["array"], model="whisper")5. 🤗 허브에서 데이터셋을 불러오는 방법은?
A.
from datasets import load_dataset
dataset = load_dataset(DATASET_NAME_ON_HUB)B.
import librosa
dataset = librosa.load(PATH_TO_DATASET)C.
from transformers import load_dataset
dataset = load_dataset(DATASET_NAME_ON_HUB)