음성 api 웹 실시간 음성 받아오기

웹에서 음성 api를 이용하여 유저의 실시간 마이크 음성을 받아와, 파형화 하고 싶습니다.(시각)

이때, 별도의 사용자 제스처 없이 실시간 유저 음성 인입이 가능할까요?
유저의 음성을 받아올 때 유저입장에서 웹 마이크 권한 확인까지만 하고, 버튼클릭 등의 제스처 없이 실시간으로 유저 음성을 받아오길 원합니다.
웹 오디오 api는 사용자제스처가 없으면 지원되지 않아서(크롬의 자동재생 제한) 차선책을 찾던 중 카카오 음성 api를 발견하게 되었습니다.

제가 원하는 것은

  1. 페이지 로드 후 별도의 사용자 제스처 없이, 사용자가 말하기 시작하면 실시간으로 음성을 받아오고 싶습니다.
  2. 음성의 텍스트를 화면에 받을 필요 없이 1의 기능만 필요할 경우, 음성 api를 사용하면 개발이 가능할지
    입니다.

수고 많으십니다! 답변 부탁드릴게요.

안녕하세요.

음성 인식 api 는 카카오 서버에서 음성 인식 기능만 제공하는 것으로,
아쉽지만 웹 브라우저에서 마이크를 키는 것과는 관련이 없습니다.

사용자가 말하기 시작하는 것(bpd)을 판단하는 것도 별도의 음성 기술이 필요합니다.