책소개
AI와 인간의 정서적 소통을 위해서는,
인간 중심의 다양한 AI 인문데이터가 필요하다!
인간과 인간의 의사소통이 언어로 이루어진다면, 인간과 AI의 의사소통은 ‘인문데이터’를 통하여 이루어진다. 우리는 컴퓨터 과학이나 자연언어처리를 위하여 숫자로 이루어진 표준 데이터 세트와 구별하기 위해서 인문데이터를 ‘인문학’의 범주로 분류하였다. 인문데이터는 인공지능 기술 발전이 인간의 가치와 윤리적 기준에 부합하도록 보장하는 기초적인 관점을 제공할 뿐만 아니라, AI가 사회문화적 맥락에 어떠한 영향을 미치는지 조명할 수 있다. 또한 AI 개발에 인간 중심적인 데이터의 속성과 정보를 제공하고, 나아가 AI가 인문학적 주제와 인간 사회에 대한 이해를 돕는 데 기여할 것으로 본다. 이를 통해 기술이 인간과 공감하면서 문화적으로 다양하게 인식되며, 윤리적으로 건전하게 개발될 수 있도록 하는 중추적인 연구 분야로 자리 잡을 것이다.
앞으로 AI가 감정 능력을 지니며 인간과 정서적으로 소통하기 위해서는 다양한 AI 인문데이터의 구축이 필요하다. 이 책에서 제시한 감정 데이터, 비윤리 데이터 등의 AI 인문데이터는 인간과 AI가 상호작용하기 위해서 인간의 감정, 윤리, 경험의 다면성, 복잡성 등을 고려하여 인간 주석자를 통해 구축되었으며, 한국인의 정서에 적합한 데이터를 구축했다는 점에서 의의가 있다.
목차
머리말 ― 인문데이터로 인간 읽기
1장 들어가며
2장 인공지능 인문데이터
1. 인공지능 인문데이터의 정의
2. 인공지능 인문데이터의 특성
(1) 인문데이터의 속성
(2) 인문데이터 구축의 중요성
3장 인공지능 인문데이터 구축의 실제
1. 비윤리 텍스트 데이터
(1) AI 데이터 구축에서 비윤리 텍스트가 가지는 의미
(2) 비윤리 텍스트 말뭉치 구축 동향
(3) 비윤리 텍스트 말뭉치 구축의 실제
2. 감정 온톨로지 데이터
(1) 인공지능과 인간의 감정
(2) 감정 온톨로지 데이터 기획 및 설계
(3) 학문 영역별 감정 온톨로지 데이터 구축
4장 인공지능 인문데이터 분석의 실제
1. 어휘 데이터의 분석
(1) 24개 감정에 기반한 한국어 감정 어휘 사전
(2) 감정 어휘 사전 구축 절차
(3) 감정 어휘 사전을 활용한 감성 분석
2. 음성 데이터의 분석
(1) 제1차 중앙대학교 인문콘텐츠연구소 한국어 음성 감정 데이터베이스
(2) 제2차 중앙대학교 인문콘텐츠연구소 한국어 음성 감정 데이터베이스
(3) 딥러닝 기반 음성 감정 인식
3. 이미지 데이터의 분석
(1) 24개 한국인 감정 기반 얼굴 표정 인식 데이터 세트
(2) 관련 연구
(3) 데이터 세트의 구축
(4) 얼굴 표정 기반 감정 인식 기계학습 모델의 학습과 성능
(5) 결론
4. 인문데이터 구축의 한계와 의의
참고문헌
저자
강우규, 남영자, 정유남, 조희린 (지은이)
출판사리뷰
이 책은 모두 4개 장으로 구성되어 있다. 1장 ‘들어가며’에서는 인간의 마음을 이해하는 AI를 만들기 위해서는 먼저 인간의 본질을 되돌아볼 수 있고 인간 사회에 도움이 될 수 있는 인문데이터를 구축해야 함을 강조하면서 논의의 서막을 연다. 이후 ‘인공지능 인문데이터’에 관한 본격적인 논의가 전개되는데, 2장에서는 인공지능 인문데이터의 정의와 특성에 대해 살펴본다. 3장에서는 ‘인공지능 인문데이터 구축의 실제’를 비윤리 텍스트 데이터와 감정 온톨로지 데이터로 나누어 살펴보고, 4장에서는 ‘인공지능 인문데이터 분석의 실제’를 어휘 데이터의 분석, 음성 데이터의 분석, 이미지 데이터의 분석으로 나누어 논의한다. 끝으로 인문데이터 구축의 한계와 의의를 짚어 본다.
이 책에서는 특히, AI 인문데이터의 구축과 활용의 실제를 살펴보는데, 인간의 마음을 다루는 어휘, 음성, 이미지 형태의 감정 데이터를 중심으로 인간의 복잡한 감정이 AI와 연결되도록 시도하고 있다. 구체적으로 한국어 감정 어휘를 24개의 감정 유형으로 구분하고 사전의 표제어와 용례를 기반으로 감정 어휘 사전을 구축했고, 데이터 설계와 구축 절차를 제공했으며, 딥러닝을 활용한 감성 분석을 제시했다. 이 책에서 제시한 감정 데이터, 비윤리 데이터 등의 AI 인문데이터는 인간과 AI가 상호작용하기 위해서 인간의 감정, 윤리, 경험의 다면성, 복잡성 등을 고려하여 인간 주석자를 통해 구축하였으며, 한국인의 정서에 적합한 데이터를 구축했다는 점에서 큰 의의가 있다.
인공지능인문학 학술총서,
포스트인문학 시대 학제 간 융합으로 인공지능인문학의 ‘지도’를 최초로 제시하다
중앙대학교 인문콘텐츠연구소(소장 이찬규)에서 기획, 연구, 집필하여 태학사에서 출간한 ‘인공지능인문학 학술총서’(전5권)는 인공지능에 대한 모든 인문학적 접근을 망라하고 있다. 인문콘텐츠연구소는 인문사회과학의 관점에서 ‘포스트휴먼 시대 인문학의 가치 고양을 위한 인공지능인문학 구축’이라는 어젠다 아래 연구소 구성원들의 역량을 총집결하여 인공지능에 대한 다채롭고 광범위한 학제적 연구를 지속적으로 수행해 왔는데, 지난 7년간의 연구 성과가 이 총서로 결실 맺은 것이다.
인공지능은 하나의 유행으로 치부될 수 없는 ‘시대적 현상’이다. 이 총서는 개별적 · 시의적 주제에 초점을 맞춰 출간되는 기존의 단기적 성과물들과는 달리, 국내에서는 보기 드물게 인공지능이라는 포괄적 단일 주제에 관해 장기적으로 진행된 연구 프로젝트의 결과물로, ‘인공지능인문학’이라는 하나의 학제를 구성하고자 한 시도의 일환이다. 총서는 인공지능과 관련된 여러 현상뿐만 아니라, 다양한 현상 속 인문학의 정체성과 의미를 다시금 진지하게 묻는다. 인공지능에 대한 인문학적 접근을 통해 인문학 자체의 위상과 역할을 재고하고 새로운 방향을 모색함으로써, 기존의 개별적 연구를 뛰어넘어 ‘인문학으로서 인공지능 연구의 새로운 모델과 사례를 만들어 내는 것’, 이것이 본 총서의 기획 의도라 할 수 있다.
디지털인문학, 환경인문학 등 지금은 포스트인문학(posthumanities) 시대이다. 인문학의 지평 자체가 재편되고 있는 것이다. 포스트인문학이라는 시대적 변화는 인문학이 재편되는 방향과 의의, 특징 등을 한눈에 톺아볼 수 있는 지도를 요구하는데, 이 총서는 국내 자생적 역량으로, 그리고 학제 간 융합으로 인공지능인문학이라는 ‘지도’를 최초로 제시했다는 점에서 지금까지의 다른 연구들과 차별화된다. 중앙대학교 인문콘텐츠연구소에서는 인공지능인문학의 전반적 영역을 분류하고, 각각의 학문적 목적, 다루는 주제, 내용과 방법론 등을 체계적으로 정리하여 이러한 지도를 제시하고 있는데, 인공지능이라는 시대적 주제에 인문학적으로 접근하고자 하는 이들에게 이 다섯 권의 책은 충실한 플랫폼 또는 가이드가 되어 줄 것이다. 이로써 우리는, 우리의 힘으로 명실상부한 포스트인문학을 갖게 되었다.