아하 로고
검색 이미지
전기·전자 이미지
전기·전자학문
전기·전자 이미지
전기·전자학문
노란누에137
노란누에13723.04.20

음성인식 기술의 원리는 뭔가요?

하이 빅스비 기가지니 등등 음성인식으로 편리하게 원하는 정보를 가져올수 있는데요 어떤원리로 스마트폰이나 기기에 적용된건지 궁금합니다

  • 안녕하세요. 류경범 과학전문가입니다.

    음성 인식 기술은 기본적으로 음성에 대한 파형을 분석합니다.

    그리고 음성을 1/1000초 단위로 음성을 작게 잘라 각 단위마다 개별로 숫자 같은 신호로 인식을 합니다.

    이 숫자들은 바로 말하는 시점에서의 성대와 성도의 상태를 나타내는 숫자들이며, 발성시점의 성대 진동 횟수와 입 모양을 그릴 수 있는 숫자들은 바로 해당음이 되기에 이것들 조합하여 음성인식 시스템에 미리 입력해둔 DB에서 데이터를 찾아 맞는 단어 등을 조합하는 것입니다.


  • 안녕하세요. 김학영 과학전문가입니다. 음성인식은 먼저 1/1000초 단위로 음성을 작게 잘라 그 파형을 신호 처리를 통해 10개 이상의 숫자로 변환합니다. 이 숫자들은 성대 진동 횟수, 입모양에 따라 결정되는데, 이러한 데이터들이 특정 패턴으로 인식되어 언어를 처리합니다.


  • 안녕하세요. 김경태 과학전문가입니다.

    음성 신호를 입력으로 받아들이고, 컴퓨터가 통계 분석을 통해 가장 적합한 결과를 선택합니다. 이때, 컴퓨터는 수많은 음성 데이터를 학습하고 분석하여, 음성 인식 정확도를 높이게 됩니다


  • 안녕하세요. 설재훈 과학전문가입니다. 음성신호를 문장형태로 전처리 및 특징 추출 작업을 통해 음성신호에서 노이즈는 제거하고 특성을 추출하여, 문장을 구성하는데 필요한 원소의 형태로 특징들을 인식 원소들을 조합하여 문장의 형태로 표현 하죠


  • 안녕하세요. 박재민 과학전문가입니다.


    음성인식의 원리는 크게 두 가지로 나뉩니다.

    첫째, 음성 신호를 디지털 신호로 변환하는 전처리과정이 있습니다. 둘째, 변환된 디지털 신호를 인식하는 음성인식과정이 있습니다. 이를 위해 머신 러닝 기술인 딥러닝 알고리즘이 사용됩니다.