본문 바로가기

지식공유공간

취준생 용돈벌이 및 직장인 부업 - 데이터라벨링 2편 (클리브웍스)

반응형

 

안녕하세요.

오늘은 지난 2편에 이어

직장인분들이 용돈벌이로 잠깐하시거나,

학원비나 교재비 등이 필요한 대학생분들이 필요할 때만 하실 수 있는 작업중 하나를 소개해드리려고 합니다.

그것은 바로 클리브 웍스의 "영상 음성 정제"작업 인데요.

음성 데이터 라벨링 정제에 대해서 간략히 소개해드리고,

클리브웍스에서 현재 모집중인 작업에 대해서도 말씀드리겠습니다.

 

음성 데이터 정제(데이터라벨링)이란?


음성 데이터 라벨링 및 정제는 머신러닝 프로젝트에서 핵심적인 작업 중 하나입니다. 정확하고 깨끗한 데이터는 머신러닝 모델의 성능에 직결됩니다. 이에 대한 설명과 유용한 기술을 살펴보겠습니다.

 

 

1. 음성 데이터 라벨링

음성 데이터 라벨링이란 각 오디오 클립에 대한 정보를 부여하는 과정입니다. 이 과정은 각 클립이 어떤 내용을 담고 있는지를 명확하게 정의하는 것으로, 감정, 대화 내용, 환경 소리 등 다양한 정보를 포함할 수 있습니다.

주요 단계:

- 클래스 정의: 각 클래스(예: 어떤 사람의 목소리, 배경 소음 등)를 정의하고 라벨을 부여함.
- 데이터 수집: 라벨링을 위한 데이터를 수집하고 준비함.
- 라벨링 도구 활용: 라벨링 도구를 사용하여 음성 데이터에 라벨을 부여함.

 

2. 음성 데이터 정제

음성 데이터 정제는 수집된 데이터를 정확하고 일관된 형태로 가공하는 과정입니다. 이는 머신러닝 모델의 학습을 효과적으로 돕기 위한 중요한 단계입니다.

주요 기술 및 방법:

- 노이즈 제거: 배경 소음이나 불필요한 음원을 제거하여 클립의 가독성을 높입니다.
- 오디오 정규화: 오디오 크기를 조절하여 음성의 일관성을 유지합니다.
- 스펙트럼 분석: 주파수 스펙트럼을 분석하여 유용한 정보를 추출합니다.

 

3. 데이터 품질 관리

데이터 품질 관리는 라벨링 및 정제 과정에서 항상 고려되어야 합니다. 이를 통해 모델의 성능을 높이고 예측의 신뢰성을 높일 수 있습니다.

주요 점검 사항:

라벨 일관성: 라벨이 일관되게 부여되었는지 확인합니다.
데이터 균형: 각 클래스의 데이터가 균형있게 분포되어 있는지 확인합니다.
마무리

음성 데이터 라벨링과 정제는 머신러닝 프로젝트에서 높은 품질의 모델을 구축하기 위해 필수적인 작업입니다. 정확한 라벨링과 깨끗한 데이터는 모델의 성능을 높이는 핵심 요소입니다. 이러한 작업에 충분한 시간을 투자하여야 프로젝트의 성공 확률이 높아지므로, 데이터 라벨러분들의 참여가 필수적인 것입니다.

 

무슨 말씀인지 잘 모르시겠죠?

외국어로된 음성을 AI가 인식할 수 있도록 회사의 가이드에 맞게 저희는 잘 작업해주시면 됩니다.

현재 클리스웍스에서는 한국어, 영어, 일본어, 중국어 각 언어에 맞게

음성 정제 작업 프로젝트 작업자를 모집하고 있는데요.

 

세부 내용은 아래와 같습니다.

 

🌸업무 내용
- 한국어/영어/중국어/일본어 영상을 듣고, 말하는 음성을 한 문장씩 적는 업무
- 제공된 작업 지침에 따라 작업해 주세요

🌸자격 요건 
- 각 언어별 자격증 소지자 혹은 회화가능자 (관련 서류 제출 필요) 
- 외국인인 경우 F2, F4, F5, F6비자 소지자 (프로필에 비자 제출 필수)
- 한국어 정제의 경우, 한국인이거나 학력 증명서로 자격 인증

🌸단가 
- 10/16(월) 14시 단가 상승 반영 예정
- 한국어: 600원/분 (평균 건당 6,000원)
- 영 어: 1,500원/분 (평균 건당 15,000원)
- 중국어: 1,500원/분 (평균 건당 15,000원)
- 일본어: 1,500원/분 (평균 건당 15,000원)
- 평균 1건 당 10분짜리 영상 작업물 배부 (단가는 영상 분당 책정) 
- 10/16(월) 14시 이전 검수 완료 건은 해당하지 않음

🌸모집 기간
- 10/16(월) ~ 10/30(월)

🌸정산일
- 매월 15일, 말일
- 본인 등록한 계좌로 입금 예정
- 정산일이 주말 및 공휴일인 경우, 전날 입금
- 자세한 정산 내용은 클리브웍스 카카오톡 채널 소식 및 클리브웍스 홈페이지 공지 참고
- 해외송금은 불가하므로 한국의 은행 계좌 필요

🌸접수 방법
- 클리브웍스 홈페이지 지원

(하단의 링크 클릭⬇⬇⬇⬇👆👆👆)


https://cliveworks.co.kr/ 접속 후 회원가입 -> 프로필 등록(해당 언어 자격증 첨부) -> 관리자 승인 -> 작업 시작 
- PC 크롬 권장 (PC 크롬에 최적화되어있음)

🌸작업 과정
- 작업 제출 -> 검수 -> 재작업(검수 후 수정사항 발생시) -> 제출 -> 완료
- 페널티 제도 운영 (자세한 사항 카카오톡 [클리브웍스 채널]-[소식]에서 확인)
- 숙련도에 따라 개인 작업량 다수 할당 가능
- 하루 제한량 없이 계속 작업 가능 
 
🌸문의사항
- 카카오톡 ‘클리브웍스‘ 채널로 문의
- 작업 지침 및 정산 공지 또한 해당 채널에서 확인 가능
http://pf.kakao.com/_ZxoBIxj 

🌸주의 사항 (⭕️필독⭕️)
- 작업은 음성 정제(한,영,중,일) 중 1가지만 선택해서 작업 가능
- 번역과 동시 작업 불가능
- 번역 작업자는 구인하지 않음
- 작업 시작 후, 작업 변경 불가능
- 회원 가입 시, 휴대폰 본인 인증 명의와 등록 계좌 명의가 동일해야 함
- 가입 및 작업 신청 후, 관리자의 판단에 따라 작업 신청 승인됨 
- 카카오톡 클리브웍스 채널 [소식] 수시 업로드 예정이므로 확인 필요 
- 작업은 PC 크롬에 최적화 되어 있으므로 크롬 사용 권장
- 작업 승인 후, 작업은 홈화면 – 참여작업을 눌러 작업 시작해야 함
- 카카오톡 채널 클리브웍스 소식 및 클리브웍스 홈페이지 공지사항 필독

 

감사합니다.

관심 있는 분들께서는 마음껏 지원해주세요^^