stt를 이용해 긴 문장을 메모하는 기능을 만들고 싶은데요. 두가지 궁금한 점이 있습니다.
-
음성으로 말하다가 잠깐 멈추면 음성인식이 바로 종료되는데 이 시간을 좀 더 늘리는 방법은 없나요?
-
말하는 것이 아니라 녹음되어 있는 파일을 이용해서 텍스트로 변환시켜줄 수도 있나요?
stt를 이용해 긴 문장을 메모하는 기능을 만들고 싶은데요. 두가지 궁금한 점이 있습니다.
음성으로 말하다가 잠깐 멈추면 음성인식이 바로 종료되는데 이 시간을 좀 더 늘리는 방법은 없나요?
말하는 것이 아니라 녹음되어 있는 파일을 이용해서 텍스트로 변환시켜줄 수도 있나요?
안녕하세요.
카카오 음성 인식 api 를 사용해 주셔서 감사합니다.
뉴톤 openapi 음성 인식의 경우 최대 14초 까지만 인식이 가능하구요.
일반적인 발화의 경우 14초 이전에 음성의 끝점이 잡혀 인식된 최종결과가 나오고 종료되게 됩니다.
현재 제공되는 api로는 안드로이드, ios 마이크 사용하는 방식만 가능하구요.
파일로도 인식가능한 api 는 추후 제공될 계획이 있으니 계속 관심가져 주시면 감사하겠습니다.