TAGS
소리
소음
보다 정확하고 넓은 범위를 인지하는 사운드 AI기술을 구축
소리의 비언어적인 부분까지 감지할 수 있는 인공지능을 만들고자 코클리어닷에이아이와 셀렉트스타가 함께 하였습니다. 주택가, 음식점, 지하철역, 지하철 안 등 장소에 따른 소음과, 지하철 안내 방송 소리, 자동차 경적 소리, 발걸음 소리 등 이벤트에 따른 소음을 수집하여 보다 정확하고 넓은 범위를 인지하는 사운드 AI기술을 구축하기 위해 노력했습니다.
About
사람처럼 자연스러운 청각 인지능력
셀렉트스타는 더욱 스마트한 인공지능을 위한 고품질 학습 데이터를 제공합니다. 본 데이터셋은 셀렉트스타가 주최한 인공지능 데이터셋 지원사업의 일환으로, 코클리어닷에이아이과 협업하여 무료로 구축하였습니다.
코클리어닷에이아이는 음성인식을 넘어 우리 주변에 있는 다양한 소리들을 모두 알아들을 수 있는 사운드 AI기술을 만듭니다. 인공지능이 사람처럼 자연스러운 청각인지능력을 가질 수 있도록하고, 이를 통해 사람들이 안전하고 자동화된, 그리고 편리하고 개인화된 일상 생활을 누릴 수 있도록 만드는 연구기반 스타트업입니다.
코클리어닷에이아이는 미국전기전자공학회 (IEEE)가 주최하는 세계 최대의 환경음 분석대회인 DCASE에서 2년 연속 우승, NVIDIA 본사가 선정한 자동화 시스템 분야 Top 4 AI 스타트업 선정, 한국 기업으로는 유일한 2018 Slush 100 Top 15선정, NVIDIA GTC Silicon Valley 및 SXSW 강연 등 관련 분야에서 업계를 선도하는 업체입니다.
데이터셋 스펙
오픈 데이터셋으로 '장소 소음'을 공유합니다.
교통 관련 소음
ex. 자동차 경적 소리, 자동차 문 여닫는 소리, 지하철 도착하는 소리 등
- 총 6,292건
장소 소음
ex. 주택가, 음식점, 지하철역, 지하철 안 등
- 총 13,300건
기타 소음
ex. 웅성거리는 소리, 음악 소리 속 대화 소리, 걸음 소리, 달릴 때 나는 발소리 등
- 총 8,000건
데이터 수집 및 가공 방법
음성 데이터 수집은 셀렉트스타의 모바일 크라우드소싱 플랫폼인 캐시미션의 음성 수집 기능을 통해 진행했습니다.
셀렉트스타에서 진행한 데이터
- 카테고리별 세부 검수 기준 설정을 위한 PoC 진행
- 정확도 높은 데이터 수집 및 검수 방법 설계
ex. 그 자리에서 녹음된 파일만 제출될 수 있도록 새로운 기능 구현, 유저 가이드 작성 등 - 카테고리별 예상되는 코너케이스 정의
- 데이터 수집 및 검수
Data Collection
셀렉트스타의 크라우드소싱 플랫폼 '캐시미션(앱)'에서 크라우드 유저들이짧은 소음 수집하기, 긴 생활소음 수집하기 미션을 직접 참여하여 데이터의 수집 및 가공을 진행했습니다.
캐시미션 가이드 다운로드 : PDF
- 캐시미션에서 짧은 소음, 긴 생활소음 수집
다양한 장소에서 일어나는 특징적인 소음을 녹음, 우리 일상생활에서 들을 수 있는 다양한 소리를 녹음
Sample Data
음악 속 대화소리
- 지하철 문 닫히고 출발 소리
시동거는 소리
차 문 여닫는 소리
음악 흥얼거리는 소리
활용분야
음성 기반 AI 서비스 연구 및 개발
CC BY-SA
복사, 배포 및 재가공 또는 2차 저작물을 만들 수 있으며, 반드시 저작자 및 출처를 표기하고 동일한 라이센스를 적용해야합니다.
https://creativecommons.org/licenses/by-sa/3.0/deed.en