Open Datasets
for Data-Centric AI
The Data for Smarter AI
인공지능 데이터셋 지원사업
AI 산업의 발전을 위해 셀렉트스타가 무료로 데이터셋을 제공합니다.
셀렉트스타는 AI 산업의 발전에 기여하고자 자체적으로 ‘인공지능 데이터셋 지원 사업’을 진행하고 있습니다.
다양한 기업들과 여러 대학 연구실에서 지원 사업에 참여하여, 셀렉트스타를 통해 무료로 데이터셋을 구축하였고,
더 나은 AI를 위해 더 많은 이들에게 양질의 데이터를 제공하고자 ‘OPEN DATASETS’를 통해 데이터를 공개하게 되었습니다.
WHAT IS OPEN DATASETS
DATA is Food for AI
“좋은 데이터를 수집하고 가공하는 것이 AI를 만드는 과정의 80%를 차지한다. 이는 데이터가 인공지능의 Core Part임을 의미한다.”
Andrew Ng _ Founder & CEO of Laning.AI
80% PREP
20% PREP
Source and prepare high quality ingredients
Source and prepare high quality data
Cook a meal
Train a model
YOUTUBE_A Chat with Andrew on MLOps: From Model-centric to Data-centric AI
인공지능에게는 ‘데이터'가 가장 중요합니다.
좋은 인공지능을 개발하기 위해서는 인공지능을 학습시킬 수 있는 고품질의 데이터가 필요합니다.
데이터 품질이 인공지능의 성능을 좌우합니다.
유명한 알파고도 수많은 데이터에 의해 탄생했습니다. 바둑 6~9단의 16만개 게임에서 3천만 수를 가져와 정책망을 학습시켜 탄생한 인공지능입니다.
데이터로 완성된 ‘알파고'
다양한 인공지능 분야에 맞춘 데이터.
얼굴로 나이와 성별을 판별하는 인공지능을 위해서는 수많은 얼굴 사진 데이터가 필요하고,
음성인식 개발을 위해서는 다양한 나이와 성별 지역에 따른 사람들의 목소리 데이터가 필요합니다.
인공지능을 더욱 똑똑하게 만들어주는 인공지능 학습(머신러닝)에 활용할 수 있는 수많은 데이터를 모아 놓은 것이 바로 Dataset입니다.
인공지능의 생명을 불어넣어 줄 ‘데이터셋'
WHO WE ARE
대한민국 대표 ‘AI 학습 데이터 플랫폼' 기업으로,
“데이터는 셀렉트스타”
Founded in Nov. 2018
0
Processed Data
0M+
22년 11월 기준
Clients
0+
Crowd Workers
0K+
15만여 명의 작업자를 보유한 크라우드소싱 플랫폼 '캐시미션'을 통해 AI 개발에 필수적인 학습 데이터를 빠르고 정확하게 제공합니다.
2018년 설립 이래 삼성, LG, 네이버, 카카오 등 많은 대기업을 비롯하여, 약 230개의 유수의 고객사를 보유, 연 매출 61억원(‘20년 기준), 누적 투자 44억원 및 Forbes 30 Under 30 선정 등 가장 빠르게 성장하고 있는 스타트업 중의 하나입니다.
Data-centric AI, 셀렉트스타와 시작하세요
KAIST 박사진이 개발한 수학적 알고리즘을 기반으로 정확한 데이터 전수 검수를 제공합니다.
전문 가이드라인 팀 운영을 통해 AI 성능에 직결되는 데이터 작업의 일관성을 확보하며,
많은 작업자들의 데이터 수집 참여와 함께 유사한 데이터 수집을 딥러닝 기반으로 필터링하여 데이터의 다양성을 보장합니다.