(논문명) Biomimetic and Flexible Piezoelectric Mobile Acoustic Sensors with Multiresonant Ultrathin Structures for Machine Learning Biometrics - <Science Advances>

달팽이관 내 기저막을 모사한 모바일 압전 음성 센서의 원리 (이건재 교수 제공)달팽이관의 초입인 기저부는 공간이 좁아 고주파수의 소리를 감지하며, 첨부로 갈수록 저주파수의 소리를 감지하기에 최적화되어있다.
달팽이관 내 기저막을 모사한 모바일 압전 음성 센서의 원리 (이건재 교수 제공)
달팽이관의 초입인 기저부는 공간이 좁아 고주파수의 소리를 감지하며, 첨부로 갈수록 저주파수의 소리를 감지하기에 최적화되어있다.

 

    우리 학교 신소재공학과 이건재 교수 연구팀이 소형화된 공진*형 유연 압전** 음성 센서를 개발했다. 이 음성 센서는 정확도가 매우 높은 초고감도의 인공지능에 기반한 화자 식별 및 음성 보안 기술을 구현할 수 있으며, 연구팀은 이 센서를 스마트폰과 인공지능 스피커 등의 전자기기에 탑재해 제품화하는 데도 성공하였다. 해당 연구는 한국연구재단의 휴먼플러스 인공지능 센서 센터의 지원을 받아 수행됐으며, 지난 2월 12일 국제 학술지 <사이언스 어드밴시스(Science Advances)>에 게재됐다.

 

공진현상을 이용해 민감도 높여

    기존에 널리 사용되어 오던 음성 인식 센서인 정전 용량형 마이크로폰 센서는 두 전도성 판으로 이루어진다. 소리가 공기를 통해 전파되면 판이 진동하며 축전기의 전기 용량이 변화하고, 이를 감지하여 소리를 전기 신호로 바꾸는 원리이다. 이러한 정전 용량형 마이크로폰 센서는 특정 주파수의 음성에서 판이 크게 진동하는 것을 방지하기 위해, 소자의 공명 진동수가 가청 주파수 영역을 훨씬 벗어난 큰 값을 가지도록 한다. 하지만 이럴 경우 소리에 의한 판의 진동을 큰 폭으로 키울 수 없기 때문에 센서의 감도가 낮다는 한계가 있었다.

    2018년도에 연구팀이 세계 최초로 개발한 공진형 유연 압전 음성 센서는 특정 주파수 영역에서 센서의 막이 큰 폭으로 진동하는 공진현상을 활용해 전기신호를 만들어낸다. 음성 센서의 공진 주파수를 사람 목소리 대역으로 설계하면, 음성에 의해 센서의 막이 진동하게 될 때 공진 현상이 일어나 민감도 높은 전압 신호를 얻을 수 있다. 그러나 높은 민감도를 얻기 위해 필요한 공진형 센서의 크기가 커 상용되는 전자회로나 모바일용 제품에 적합하지 않고, 이를 보완하기 위해 센서의 크기를 줄이게 되면 압전 효과가 감소하면서 전압이 떨어지며 공진 주파수도 사람 목소리 대역을 벗어나는 문제가 있었다.

 

인간의 달팽이관 구조를 모사한 센서

    연구팀은 이 문제를 해결하기 위해, 인간 달팽이관의 기저막을 모사한 유연 압전 음성 센서를 개발하였다. 달팽이관의 기저막은 사다리꼴 구조로, 달팽이관의 초입인 기저부에서 첨부로 갈수록 공간이 넓어져 더 낮은 주파수의 소리를 감지할 수 있다. 연구팀은 수 마이크로미터의 매우 얇고 유연한 무기물 압전 막을 이용하여 사람의 귀를 모사했으며, 여러 공진 채널을 구현해 소리를 초고감도로 식별할 수 있는 센서를 개발하였다. 이전에도 사람의 귀를 본뜬 센서는 존재했지만, 해당 연구는 센서 소형화에 요구되는 공진 주파수 및 대역폭 조절 이론을 통해 유연한 압전막, 초박형 폴리머 기판을 이용한 세계 최초 구현이라는 점에서 의의가 있다.

 

화자 식별 및 음성 보안 기술 적용

    생체를 모사한 유연 압전 음성 센서는 신호 대 잡음 비가 우수하고 원거리 인식이 가능하다는 강점이 있다. 또한 다수의 채널을 보유하고 있어 적은 데이터양으로도 화자 식별 정확도에 있어서 강점을 보인다. 2018년 고안된 센서에 비해 크기도 획기적으로 감소했기 때문에 상용 전자 회로와 시스템적으로 통합될 수 있어 자체적으로 음성 신호를 분석하는 스마트폰 및 AI 스피커 등에 활용될 전망이다. 이 센서는 상용 전자 회로와 시스템적으로 통합한 후 무선 통신으로 서버에 음성 데이터를 송신하여 신호를 분석 및 학습한다. 이 새로운 음성 데이터가 입력되었을 시 알고리즘을 기반으로 기존 학습 화자의 특성과 얼마나 유사한지 계산하여 화자를 식별한다.

 

    이번 논문에 제1저자로 참여한 왕희승 박사 과정은 “공진형 유연 압정 음성 센서의 크기를 더욱 소형화하기 위한 연구를 진행 중이며, 반도체 공정 및 대량 생산과 특성을 균일하게 생산하기 위한 공정 또한 모색 중”이라고 말했다. 더 나아가, “스마트폰 및 AI 스피커 활용을 위해 다른 연구팀과 협업하는 등 해당 기술의 활용을 위해 적극적으로 노력할 것”이라며 앞으로의 연구 방향을 밝혔다.

 

공진* : 특정 주파수 영역에서 센서가 큰 진폭으로 진동하는 현상.
압전** : 압력을 가했을 때 전기적인 신호가 자발적으로 생성되는 현상.

저작권자 © 카이스트신문 무단전재 및 재배포 금지