음성인식 api 뉴톤에서 정확치 않은 발음은 어떻게 처리하는지 문의드립니다

seokjoo.yi · 9월 14, 2018, 1:21오전

안녕하세요.
뉴톤 API를 통해 STT를 구현하려고 합니다.

그런데, 발음이 잘못되거나 어눌한 경우에는 어떻게 처리가 되는지 궁금합니다.
예를 들어 사과를 "사꽈"라고 발음을 하면 이것은 사용자가 잘못 발음한 것이라고 판단을 해서 "사과"라고 바꾸어 주는 것인가요? 즉, 음성모델과 언어모델을 통해 서버에서 잘못된 발음과 가장 유사한 텍스트를 검색하여 그 텍스트를 내보내는 것인지요. 그리고 그 검색 결과에 대한 신뢰도가 리턴 값인 confidence(정수 값) 로 리턴되는 것인지 궁금합니다.

답글 주시면 고맙겠습니다~
감사합니다.

anon37122555 · 10월 17, 2018, 2:23오전

안녕하세요.

카카오 음성 기술에 관심가져 주셔서 감사합니다.

인식은 알고계신데로 언어모델 사전에서 가장 높은 확률의 네트웍으로 텍스트를 찾게되는 과정입니다.
신뢰도는 기계적으로 계산되어서 나오는 값이기 때문에 꼭 정확한 값은 아니니 참조하시기 바랍니다.