티스토리 뷰
CNN에 꼭 개나 고양이, 사람 얼굴 사진만 집어넣어야 할까?
소리. 소리도 CNN에 집어넣을 수 있다.
세상에... 정말 대단한 발상이 아닐 수가 없다.
그런데 어떻게 소리를 학습한다는 말일까?? 귀가 달렸나?
그것은 바로 스펙트로그램이라는 이미지를 이용하는 방법이다.
스펙트로그램이 뭐냐 하면 소리나 파동을 시각화 하기 위해 만들어진 그래프이다.
CNN은 이미지를 input으로 받는다.
-> 소리를 스펙트로그램으로 시각화한다
-> 스펙트로그램을 이미지 input으로 넣는다
-> 사람의 목소리를 예측할 수 있다....!!!!!!!!!!!!!!!!
눈으로 볼 수 없는 음성이나 파동도 시각화 할 수 있는 그래프만 존재한다면 이미지로 변환하여 학습할 수 있다는 것이다.
허거덩... 이게 정말 혁명 아닐까
조금 소름끼쳤다. 먼 미래에 스카이넷이 지배하게될 세상은 정말 무서울지도 모르겠다.
아무튼
매트랩으로 사운드파일을 읽어오는 방법은 audioread()를 이용하면 된다
[y, Fs] = audioread("test.mp3");
y는 오디오 데이터, Fs는 샘플 레이트(Hz) 이다.
plot으로 그려보면 아래와 같고,
plot(y(:, 1));
스펙트로그램으로 그려보면 아래와 같다
pspectrum(y(:, 1), Fs, "spectrogram");
이 정체모를 그래프 양옆에 범례랑 타이틀을 다 떼버리고 그래프 부분만 남겨둔 채로 CNN에 집어넣으면 학습이 되는 것이다.
hold on
axis off
colorbar off
title("")
hold off
정말 딥러닝 기술이 방대한 분야에 사용될 수 있을 것 같다.
괜히 AI열풍이 아니구나 생각이 들었다.
'학교공부 > 인공지능' 카테고리의 다른 글
매트랩으로 배우는 인공지능 - 10 | 순차 데이터와 RNN&LSTM (0) | 2021.11.23 |
---|---|
매트랩으로 배우는 인공지능 - 8 | Regression (0) | 2021.11.17 |
매트랩으로 배우는 인공지능 - 7 | Training Option (0) | 2021.10.11 |
매트랩으로 배우는 인공지능 - 6 | CNN 레이어 상세 (0) | 2021.10.06 |
매트랩으로 배우는 인공지능 - 5 | Training from scratch (0) | 2021.09.30 |
댓글