배경소음 데이터셋

소리의 비언어적인 부분까지 감지할 있는 인공지능 데이터셋

TAGS
소리
소음
보다 정확하고 넓은 범위를 인지하는 사운드 AI기술을 구축

소리의 비언어적인 부분까지 감지할 수 있는 인공지능을 만들고자 코클리어닷에이아이와 셀렉트스타가 함께 하였습니다. 주택가, 음식점, 지하철역, 지하철 안 등 장소에 따른 소음과, 지하철 안내 방송 소리, 자동차 경적 소리, 발걸음 소리 등 이벤트에 따른 소음을 수집하여 보다 정확하고 넓은 범위를 인지하는 사운드 AI기술을 구축하기 위해 노력했습니다.

About

사람처럼 자연스러운 청각 인지능력

셀렉트스타는 더욱 스마트한 인공지능을 위한 고품질 학습 데이터를 제공합니다. 본 데이터셋은 셀렉트스타가 주최한 인공지능 데이터셋 지원사업의 일환으로, 코클리어닷에이아이과 협업하여 무료로 구축하였습니다.

코클리어닷에이아이는 음성인식을 넘어 우리 주변에 있는 다양한 소리들을 모두 알아들을 수 있는 사운드 AI기술을 만듭니다. 인공지능이 사람처럼 자연스러운 청각인지능력을 가질 수 있도록하고, 이를 통해 사람들이 안전하고 자동화된, 그리고 편리하고 개인화된 일상 생활을 누릴 수 있도록 만드는 연구기반 스타트업입니다.

코클리어닷에이아이는 미국전기전자공학회 (IEEE)가 주최하는 세계 최대의 환경음 분석대회인 DCASE에서 2년 연속 우승, NVIDIA 본사가 선정한 자동화 시스템 분야 Top 4 AI 스타트업 선정, 한국 기업으로는 유일한 2018 Slush 100 Top 15선정, NVIDIA GTC Silicon Valley 및 SXSW 강연 등 관련 분야에서 업계를 선도하는 업체입니다.

데이터셋 스펙

오픈 데이터셋으로 '장소 소음'을 공유합니다.

  • 교통 관련 소음

    ex. 자동차 경적 소리, 자동차 문 여닫는 소리, 지하철 도착하는 소리 등

    - 총 6,292건

 

  • 장소 소음

    ex. 주택가, 음식점, 지하철역, 지하철 안 등

    - 총 13,300건

 

  • 기타 소음 

    ex. 웅성거리는 소리, 음악 소리 속 대화 소리, 걸음 소리, 달릴 때 나는 발소리 등

    - 총 8,000건

데이터 수집 가공 방법

음성 데이터 수집은 셀렉트스타의 모바일 크라우드소싱 플랫폼인 캐시미션의 음성 수집 기능을 통해 진행했습니다.

셀렉트스타에서 진행한 데이터

 

  • 카테고리별 세부 검수 기준 설정을 위한 PoC 진행
  • 정확도 높은 데이터 수집 및 검수 방법 설계
    ex. 그 자리에서 녹음된 파일만 제출될 수 있도록 새로운 기능 구현, 유저 가이드 작성 등
  • 카테고리별 예상되는 코너케이스 정의
  • 데이터 수집 및 검수

Data Collection

셀렉트스타의 크라우드소싱 플랫폼 '캐시미션(앱)'에서 크라우드 유저들이짧은 소음 수집하기, 긴 생활소음 수집하기 미션을 직접 참여하여 데이터의 수집 및 가공을 진행했습니다.

download 캐시미션 가이드 다운로드 : PDF

  • 캐시미션에서 짧은 소음, 긴 생활소음 수집

    다양한 장소에서 일어나는 특징적인 소음을 녹음, 우리 일상생활에서 들을 수 있는 다양한 소리를 녹음

'캐시미션(앱)'에서 ‘긴 생활소음 수집하기’ 14개의 소리 카테고리 선택 화면 / '캐시미션(앱)'에서 ‘짧은 소음 수집하기’ 11개의 소리 카테고리 선택 화면 / '캐시미션(앱)'에서 '짧은 소음 수집하기'를 통해 수집된 데이터의 품질과 정확도 검사 진행 화면
'캐시미션(웹)'에서 전문 가이드 팀이 작성한 크라우드 유저들의 미션 이해를 돕기 위한 가이드_ ‘긴 생활소음 수집하기’

Sample Data

  • 음악 속 대화소리

  • 지하철 문 닫히고 출발 소리

  • 시동거는 소리

  • 차 문 여닫는 소리

  • 음악 흥얼거리는 소리

활용분야

음성 기반 AI 서비스 연구 및 개발

CC BY-SA 

복사, 배포 및 재가공 또는 2차 저작물을 만들 수 있으며, 반드시 저작자 및 출처를 표기하고 동일한 라이센스를 적용해야합니다.
https://creativecommons.org/licenses/by-sa/3.0/deed.en

배경소음 데이터셋

소리의 비언어적인 부분까지 감지할 있는 인공지능 데이터셋