본문 바로가기

지식공유공간

직장인 부업 데이터라벨링 프로젝트 추천(메트릭스편)

반응형

 

안녕하세요.

오늘도 지난편에 이어서 데이터라벨링 프로젝트를 소개해드리려고합니다.

오늘은 데이터 라벨링 프로젝트 중

(주)메트릭스에서 모집중인 "한국어 멀티세션 대화 수집" 프로젝트를 간단히 소개해드리겠습니다.

 

 

안녕하세요, (주)메트릭스입니다! 

저희는 고도화된 한국어 챗봇을 개발하기 위해 다양한 분야에서 데이터 라벨링 프로젝트를 진행하고 있습니다. 이번에는 멀티세션 대화 데이터셋을 구축하는 프로젝트에 대해 소개해 드리겠습니다.

 

1. 활동소개

 

 이번 프로젝트에서는 시간 간격이 있는 여러 개의 세션에서 두 명의 참여자가 부여받은 페르소나와 대화 토픽을 기반으로 자유로운 일상 대화 텍스트를 수집합니다. 이를 통해 참여자 정보, 대화 주제, 대화방 정보, 시간 간격, 페르소나 정보 등을 포함한 다양한 정보를 얻는데요. 또한, 데이터의 5%는 주제와 관련된 질문-대답이 추가된 전문대화로 구성되어 있습니다. 이 부분은 2세션으로만 구축되었어요.

 

2. 구축목적


우리의 목적은 한국어 챗봇 기술을 고도화하기 위함입니다. 특히, 과거 대화를 기억하고 반영하는 멀티세션 대화를 구축하여 더욱 자연스러운 대화를 가능케 하는 것이 목표입니다.

 

3. 학습모델 개발


 우리는 현재 세션의 대화를 나눌 때, 사용자와 과거 세션의 정보를 활용하여 답변을 생성하는 대화 모델을 개발했습니다. 이를 위해 한국어 데이터로 사전학습된 ETRI T5 모델을 사용하고, 대화 데이터를 이용해 미세 조정을 거쳐 이전 세션 대화를 활용한 답변을 생성할 수 있게 되었습니다.

이를 통해 높은 수준의 상호작용이 가능한 챗봇을 개발하는 데 한층 더 나아가고자 합니다. (주)메트릭스는 앞으로도 더 많은 혁신적인 프로젝트들로 여러분을 찾아갈 것입니다. 함께 미래를 만들어가는 여정에 함께해주셔서 감사합니다!

 

 

 즉,  2명이서 한 조로 구성을 해도 좋고, 혼자서 질문자 및 전문답변자 역할을 둘다 수항하시면서 프로젝트를 진행하셔도 무방합니다. 가족끼리나 친구끼리 하셔도 좋구요. 알바몬에서 "멀티세션 대화" 라고 검색하시면, 아마 지원 가능하실 건데, 대화 한세트 생성하는데 건당 3천원이라고 하니, 소소하게 쉬는시간이나 자투리 시간을 활용하시면서 참여하셔도 좋을 것 같네요! 

 

 광고로 올리는 글은 아니고, 순수하게 여러 데이터 라벨링 프로젝트 소개차 올려드리는 글이니, 링크는 따로 첨부하지 않겠습니다. 관심이 있으신 분들은 알바몬에서 " 멀티세션 대화"검색 후 , (주)매트릭스에서 올려준 공고를 통해서 지원하시면 좋을 것 같습니다.

 

 그럼, 이미 여러 프로젝트에 참여중인 데이터라벨러 분들이나, 향후 이쪽에 관심 있으신분들께 도움이 되셨길 바라며,

오늘 포스팅은 여기에서 마치겠습니다.

감사합니다!