본문 바로가기

광고

광고닫기

광고

본문

광고

오피니언 칼럼

인공지능은 무얼 먹고 사나? [아침햇발]

등록 2023-03-08 05:00수정 2023-03-08 18:31

스케일에이아이(AI), 디파인드에이아이, 사마 같은 거대 데이터 라벨링 회사는 아프리카 국가 등 전세계를 대상으로 플랫폼을 통해 노동자를 모집해 데이터 수집과 태깅 작업을 의뢰한다. 사진은 사마의 직원이 근무하는 모습. 사마 누리집
스케일에이아이(AI), 디파인드에이아이, 사마 같은 거대 데이터 라벨링 회사는 아프리카 국가 등 전세계를 대상으로 플랫폼을 통해 노동자를 모집해 데이터 수집과 태깅 작업을 의뢰한다. 사진은 사마의 직원이 근무하는 모습. 사마 누리집

이봉현 | 경제사회연구원장 겸 논설위원

 

대화형 인공지능(AI) ‘챗지피티’가 신통해 보여서였을까? 컴퓨터 과학을 깊이 모르는 필자는 인공지능이 인터넷에 있는 방대한 정보를 교재 삼아 스스로 똑똑해지는 줄 알았다. ‘기계학습’이니 ‘강화학습’이니 하는 말들도 인공지능이 척척 알아서 배운다는 인상을 줬다. 그런데 자료를 찾아 읽어보니 그런 건 아니었다. 어떤 인공지능이 개발돼 일반인에게 공개할 수준이 되려면 데이터를 통해 ‘한땀 한땀’ 가르치는 사람의 노동이 반드시 필요했다. 데이터를 수집해 인공지능이 알아듣게 가공하고, 알고리즘을 거쳐 나온 답을 평가해 되먹여 주는 일이다. 정제된 데이터가 없는 인공지능은 유능할 수 없었다.

챗지피티도 개발사인 오픈에이아이가 통상적인 챗봇 교육법 외에 알엘에이치에프(RLHF)라는 인간의 피드백을 통한 강화학습 방법을 적용했다. 소셜미디어, 검색, 자율주행, 물류 자동화 등 여러 영역에서 활용되는 알고리즘도 사람이 가공한 방대한 데이터를 배워야 돌아간다. 그런 일들 중 데이터 라벨링은 데이터를 수집하고 특정 영역에 태그를 달아 분류하는 일이다. 사진 속 물체가 고양이인지 개인지 이름을 달아 반복학습을 시키면 인공지능의 유추 능력이 커진다. 콘텐츠 모더레이션은 혐오표현 같은 부적절한 데이터를 걸러내고, 인공지능이 낸 답의 적절성을 평가해, 인간이 원하는 패턴을 익히게 하는 일이다. 그러지 않으면 데이터에 얼룩진 인간의 편향을 따라 했던 인공지능 챗봇 ‘이루다’의 문제가 반복된다.

데이터 처리를 사람이 하기에, 인공지능에는 사회의 그늘이 드리워져 있다. 데이터 가공은 메커니컬 터크나 사마 같은 플랫폼업체가 구글, 메타, 아마존 같은 거대 기업에서 하청을 받아 운영하는 크라우드형 플랫폼 노동을 통해 이뤄진다. 이들 업체는 수백만건의 데이터를 몇백건 단위로 잘게 쪼개 플랫폼에 올려놓고 전세계에서 작업자를 모집한다. 인터넷 덕분에 가능해진 이런 대규모 플랫폼 노동이 없었다면 인공지능은 1990년대 수준에서 답보했을 것이란 분석도 있다. 그런데 이 과정에서 노동의 파편화, 노동 조건의 열악화, 제3세계 저임 노동력 착취와 같은 문제가 발생한다.

최근 미국 시사 주간지 <타임>은 오픈에이아이가 챗지피티를 덜 위험하게 하기 위해 아프리카 케냐인들을 활용한 사례를 다뤘다. 2021년 샌프란시스코에 본사를 둔 하청업체 사마를 통해 고용된 케냐 노동자들은 인터넷에서 뽑아낸 수만개의 폭력적인 텍스트를 9시간 단위로 교대 근무하며 라벨링 작업을 했다. 아동 성 학대, 살인, 고문, 수간, 근친상간 등의 내용이 대부분이었다. 챗지피티가 이런 유해한 콘텐츠의 패턴을 학습해서 스스로 걸러내도록 훈련할 목적이었다. 이런 콘텐츠에 지속해서 노출된 일부 노동자는 환각과 트라우마를 호소하기도 했다. 그러고서 케냐 노동자가 받은 임금은 시간당 1.3~2달러였다. 사마 외에도 다양한 온라인 크라우드소싱 플랫폼이 우간다, 케냐, 인도, 베네수엘라 등에서 수백만명의 노동자를 모집해 단조롭고 유해한 데이터 가공이나 평가를 맡긴다.

인공지능의 영역이 확장될수록 이런 노동의 수요는 커간다. 국내에서도 데이터 라벨링을 하기 위해 관련 업체에 등록한 사람이 2021년에 100만명이 넘었다고 한다. 2021년 한국노동연구원 이정희 선임연구위원 등이 조사한 데 따르면, 이들의 80%가 대졸 이상의 학력을 갖고 있고, 절반 넘는 이들은 본업이 있으면서 추가 소득을 위해 데이터 라벨링을 하고 있었다. 보수는 작업당 20원부터 시작해 단계적으로 오르는데, 2021년 당시의 최저임금(시급 8720원)을 확보하기 위해 초보자는 1시간에 436개, 10초에 1.2개꼴로 데이터에 태그를 달아야 했다.

챗지피티는 교육, 예술, 출판 등 다양한 지식 영역에 존재론적 질문을 던졌다. 하지만 인공지능의 토대가 열악한 노동이란 사실은 묻혀 있다. 언젠가 데이터 처리마저 인공지능이 대신할지 모르나, 그 전까지는 ‘디지털 인형 눈알 붙이기’ ‘유령노동’이라 불리는 이런 작업이 계속될 것이다. 물론 이러 일들이 육아·가사·학업 도중에 짬을 내서 수입을 얻으려는 이들에게 유연한 일자리를 제공한다고 볼 수도 있다. 하지만 노동권 보호에서 벗어난 저임금·초단기·단순반복 일자리가 늘어나는 걸 외면하고 인공지능의 가능성만을 말하는 것은 부조리하다. 과학기술이 띄우는 분홍빛 애드벌룬과 함께, 사람에게 드리워진 그늘도 놓치지 않는 균형 잡기가 필요하다.

bhlee@hani.co.kr
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기
언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

광고

광고

광고

오피니언 많이 보는 기사

우리 엄마가 ‘백종원’으로 변했어요~ 1.

우리 엄마가 ‘백종원’으로 변했어요~

귀족 부인 앞에 무릎꿇은 사법 [아침햇발] 2.

귀족 부인 앞에 무릎꿇은 사법 [아침햇발]

[사설] 권력 눈치본 검사들 대놓고 발탁한 검찰 인사, ‘김건희’ 수사 말라는 신호인가 3.

[사설] 권력 눈치본 검사들 대놓고 발탁한 검찰 인사, ‘김건희’ 수사 말라는 신호인가

[사설] 문 정부 대북 정책 “평화 로비”라는 대통령실, 윤 정부는 그간 뭘 한 건가 4.

[사설] 문 정부 대북 정책 “평화 로비”라는 대통령실, 윤 정부는 그간 뭘 한 건가

[사설] 정부 비판 기자회견에 대관 취소한 언론재단 5.

[사설] 정부 비판 기자회견에 대관 취소한 언론재단

한겨레와 친구하기

1/ 2/ 3


서비스 전체보기

전체
정치
사회
전국
경제
국제
문화
스포츠
미래과학
애니멀피플
기후변화&
휴심정
오피니언
만화 | ESC | 한겨레S | 연재 | 이슈 | 함께하는교육 | HERI 이슈 | 서울&
포토
한겨레TV
뉴스서비스
매거진

맨위로
뉴스레터, 올해 가장 잘한 일 구독신청