본문 바로가기

데이터 라벨링 재택 부업, 어떤 일? 수입은 얼마나? 총정리

손해보며 일하지 말자 2020. 9. 19.

재택근무에 대한 관심이 높아지는 지금, 데이터 라벨링이 점점 부업으로 각광받고 있는 추세입니다. 언택트에 재택으로 가능한 부업이다 보니 특히 사람들의 관심이 몰리고 있는 모양입니다.

 

과연 데이터 라벨링은 어떤 일인지, 본업 이후 짬나는 시간을 이용해 충분히 해볼 수 있는 부업인지, 수입은 어느 정도 나오는지에 대해 알아보도록 하겠습니다. 

 

데이터 라벨링이란?

데이터 라벨링이란 AI의 성능향상을 위해 정성(수치가 아닌) 데이터를 인공지능이 인식할 수 있도록 재가공하는 작업입니다. 

 

이렇게 말해 놓으니 다소 어렵게 들리는데요, 풀어 이야기하면 이렇습니다. 

 

 

인공지능을 위한 학습지를 만드는 일

데이터 라벨링이란 인공지능을 위한 일종의 학습자료를 만드는 일입니다. 

 

다들 아시다시피 우리가 현실에서 주로 다루는 문자(자연어)나 사진을 인공지능이 바로 인식하고 이해하기란 불가능합니다. 아무리 인공지능이라해도 컴퓨터에 불과할뿐이니까요. 

 

게다가 성능이 아무리 좋다 할지라도 최소한 어느 정도의 학습 자료가 있어야 그를 토대로 인지능력을 획득할 수 있습니다. 

 

그런데 이때 컴퓨터가 학습할 수 있는 자료는 누가 만들어야 할까요? 컴퓨터가 컴퓨터를 위한 학습자료를 만들 수는 없을테니, 바로 사람이 그 작업을 하게됩니다. 

 

인공지능이 곰과 곰인형을 구분하려면

학습자료란 별 것 아닙니다. 예컨대 곰과 곰인형 사진이 있다면 사람이 곰에는 ‘곰’ 라벨을, 곰인형에는 ‘곰인형’ 라벨을 붙여주는 식입니다. 다양한 곰과 곰인형 사진에 라벨이 붙고, 그를 통해 컴퓨터가 둘의 차이를 반복 학습한다면 나중에는 라벨 없이도 컴퓨터가 곰과 곰인형의 차이를 구분할 수 있게되는 것이지요. 마치 아이가 새로운 물건을 구별하게 되는 방식과 같습니다. 

 

인공지능의 정확한 인지/판단 능력을 위해서는 양질의 자료가 다수 필요합니다. 그래서 학습 데이터가 충분히 필요하고, 그걸 만들게되는 것이 바로 데이터 라벨링을 부업으로 삼는 사람들입니다. 

 

 

해외에선 이미 진행 중

이러한 데이터 라벨링의 시초라고 할 수 있는 것은 2005년 아마존에서 개설한 메커니컬터크(Mechanical Turk)입니다. 시작은 온라인 크라우드 소싱 중개소였습니다.  처음에는 이미지에 태그를 붙이거나 엑셀 시트에 연락처를 입력하는 일 등이 대부분이었으나, 점차 데이터 라벨링에 관한 작업들이 늘어났습니다. 예컨대 옷 사진에 색깔 라벨링을 붙이는 일 같은 것이었죠. 

 

론칭 2년차인 2007년까지 100개국 이상에서 10만 여명의 노동자를 끌어 모았고, 2011년 1월에는 190개국 50만 명 이상의 긱 노동자가 메커니컬 터크에서 수익을 가져갔습니다. 

 

아마존 메커니컬 터크

한국서 스타트업로 각광... 정부도 지원하는 비즈니스

한국에서도 이러한 데이터 라벨링 소싱 기업들이 하나 둘씩 생겨나고 있는 추세입니다. AI 학습 데이터 플랫폼 기업이라는 명함을 달고 있는 ‘크라우드웍스’를 비롯해 테스트웍스, 에이모(AIMMO) 등의 스타트업 업체가 앞다투어 등장하고 있습니다. 데이터 크라우드 소싱이라는 이름으로 새로운 비즈니스의 장이 열린 셈입니다. 

 

매일경제의 기사에 따르면, 크라우드웍스는 2017년 8,000만원 규모의 매출로 시작했으나 2020년에는 6월 기준 100억원 이상의 매출을 올린 것으로 알려졌습니다. 또한 크라우드웍스에 데이터 라벨러로 등록한 긱 노동자의 수도 무려 15만 5,000명 이상이라고 합니다. 

 

또한 데이터 라벨링은 정부에서 추진하는 디지털 뉴딜 정책의 지원마저 받는 비즈니스입니다. 인공지능 고도화 및 일자리 창출을 위한 데이터 댐 구축 과정에 데이터 라벨링이 필연적으로 들어가기 때문입니다. ‘AI 학습용 데이터 구축사업’이란 이름으로 정부 예산이 2,925억 원 투입되기도 했습니다. 이 금액은 곧 데이터로 환산되게 될 텐데요, 그말인즉  그 지원금이 바로 데이터 라벨러에게 임금으로 투입될 돈이라는 뜻입니다.

 

 

데이터 라벨링, 부업으로 가능해?

데이터 라벨링이 무엇인지, 그리고 얼마나 각광받고 있는 사업인지를 살펴 보았으니 부업으로 적합한 일인지를 한 번 체크해볼 필요도 있겠죠. 

 

일단 데이터 라벨링의 가장 큰 장점은 출퇴근이 필요없다는 것입니다. 컴퓨터나 스마트폰 한대만 있다면 재택근무 뿐만 아니라 카페에서, 지하철에서도 가능합니다. 언택트 시대의 아르바이트라 할 수 있습니다.

 

또한 시간에 구애받지도 않습니다. 일반 직장과 달리 업무시간이 정해져있지 않으니 언제든 스스로가 편한 시간에 일하면 됩니다. 

 

참여할 수 있는 프로젝트가 있기만하다면, 내 시간과 상황이 편할때 작업에 참여해서 하고 싶은 만큼 근무하고 그만큼 댓가를 받으면 되는 구조인 것입니다. 

 

출처: 크라우드웍스

 

크라우드웍스에서 공개한 자료에 따르면, 작업시간이 2시간 미만이라고 답한 데이터 라벨러의 수가 81.4%에 달했습니다. 큰 시간을 들이지 않고 작업이 가능하다는 것이죠. 

 

또한 데이터라벨링은 노동에 큰 기술이 필요하지 않다는 것도 장점입니다. 업무를 위해 새로운 기술을 학습할 필요 없이 바로 작업에 투입될 수 있다는 것이죠. 아무런 경력도 스펙도 요구하지 않습니다. 저숙련 노동인만큼 접근성이 높은 부업입니다. 

 

 

수입은 얼마나

그렇다면 정말 중요한 것은 수입이겠습니다. 

 

데이터 라벨링은 가용한 프로젝트에 따라 작업에 참여할 수 있기 때문에 수입이 고정적이지는 않은 것으로 알려져 있습니다. 

 

크라우드웍스와 블로터 간의 인터뷰 내용에 따르면, 숙련자 기준 최저시급 수준은 충족시킨다고 합니다. 

 

아마존에서 운영하는 메커니컬 터크의 경우 평균 시간 당 약 $7.25의 임금을 받는 것으로 알려졌습니다. 약 9천원에 달하는 금액입니다. 

 

직업으로서 가능성도 있어

하지만 벌써 오랜기간 운영되어온 아마존의 메커니컬터크에는 데이터라벨링을 주업으로 삼는 노동자들도 존재합니다. 

 

새라 케슬러가 쓴 책 ‘직장이 없는 시대가 온다’에 따르면 메커니컬터크 노동자 중 35%가 메커니컬 터크를 주 수입원으로 삼는다고 답했습니다. 

 

책에서 사례로 언급한 한 캐나다 여성은, 메커니털터크에서의 데이터 라벨링 작업을 더욱 효율적으로 진행할 수 있는 방법을 찾아냈습니다. 마우스 클릭으로 라벨링 분류 작업을 하던 것을 키보드로 바꾸는 식이었습니다. 이러한 몇 가지 효율 개선으로 메카니컬터크만을 통해 실직한 남편을 대신해 가족을 부양할 수 있는 수입을 얻었습니다. 

 

실제, 데이터 라벨러가 부업을 넘어 직업이 될 수 있다고 보는 시선들이 있습니다. 현재로선 비록 부업 수준에 머물러 있지만, 산업이 더욱 커짐에 따라 새로운 작업으로서 자리잡을 수 있다는 것입니다. 

 

물론 직업으로서 데이터라벨러가 단순 데이터에 라벨을 붙이는 것일만을 반복하지는 않을 것으로 보입니다. 데이터 라벨링을 꾸준히 진행해온 이력을 바탕으로 데이터 라벨링의 결과를 평가하는 검수자의 역할을 맡는 것입니다. 

 

이러한 역할을 맡게될 경우, 단순 데이터 라벨링을 하던때보다 훨씬 더 큰 소득을 올릴 수 있게 됩니다. 실제 크라우드웍스에서도 이러한 제도를 도입하고 있고, 검수자 중 우수자에 한하여 계약직으로 채용 역시 이루어지고 있다고 합니다. 

 

 

마치며

재택근무와 긱 경제가 점점 더 트렌드화하고 있는 현 시점입니다. 데이터 라벨링과 같은 새로운 비즈니스 기회가 점점 생겨나고 있습니다. 우리도 이에 발맞춰 새로운 일들을 찾아보는 것이 좋을지도 모르겠습니다.

댓글