메뉴 건너뛰기

통합검색 입력 폼
잡코리아 주요 서비스
끝이 다른 시작 JOBKOREA 알바의 상식 albamon


게임뉴스 상세

스마일게이트AI센터 악플· 혐오 발언 데이터셋 공개

작성자
관련사이트 더게임스
작성일
2022-01-20

스마일게이트AI센터(센터장 한우진)는 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.

센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다. 수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며 약 55만여개의 데이터를 기반으로 1만 개의 데이터셋을 구축했다.

특히 데이터셋 구축 과정에서 ‘여성가"’ ‘성소수자’ ‘남성’ ‘인종국적’ ‘연령’ ‘지역’ ‘종교’ ‘기타혐오’ 등 8개의 대상으로 범주화했다. 또 혐오 발언 분류를 위한 기준 모델을 공개했으며 이를 통해 혐오 발언 추출이 가능하다.

데이터셋은 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 "사 등 여러 분야에서 대상을 둘러싼 혐오 발언 여부를 파악할 수 있다. 세터는 향후 지속적인 R&D를 실시하며 확보된 기술력을 바탕으로 혐오 표현을 보다 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화 할 계획이다. 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지를 통해 이달 중 공개될 예정이다.

[더게임스데일리 신석호 기자 stone88@tgdaily.co.kr]



배너



퀵메뉴