본문 바로가기

신입생세미나_2024_1학기

2024-04-04 신입생 세미나_Hearing, Auditory Models, and Speech Perception 1/2

질문

1. auditory mechanism 설명해보기

 
2. non-uniform spectral analysis가 뭐죠?
3. critical band가 무엇인가요?
4. critical bandwidth랑 frequency resolution 간 관계 설명해보기
5. 한 critical band 안에 두 개의 톤이 있다면 어떤 소리가 masking 되는 건가요?

  • critical bandwidth가 왜 이렇게 설정됐는지 궁금...

6. 파란색으로 표시된 점선이 뭔가요?

  • 귓바퀴 떼고 잰 거일수도... resonance 보정

7. frequency 축이 uniform 하지 않는 이유
8. frequency와 octave 간 관계

  • pitch와 octave 간 관계 → 이건 책에 없으니 스킵

9. pitch 설명해보기 / pitch를 높인 것, 낮춘 것은 무슨 의미인가요?

10. bark scale이 뭔가요?

  • ideal한 filter bank 24개

11. 각각의 청각 기관이 어떻게 기능하는지 설명해보기

12. critical band는 인간의 어떤 청각 기관을 모델링한것인가요?

  • 달팽이관 안의 기저막

13. 음성 신호는 몇 khz로 샘플링 해야할까요?

  • 샘플링 이론 상 앨리어싱 방지하려면 가장 높은 주파수가 8khz이니 16khz로 샘플링해야 함

14. 저주파 대역만 분석하는 게 optimal 할까?
15. pitch가 절반이 되고 2배가 되는 게 어떤 의미인가요? 1 mel 이 어느 정도로 받아들이면 되는지 감이 안 잡힘.. 두 소리가 100mel 차이면 어느정도로 차이가 나는가? 사람이 인지하는  2배 차이가 어느정도로 차이가 나는 것인지?

  • pitch-octave 간 관계는 자주 나옴
  • pitch-mel 간 관계는 명확하지 않아 궁금..