본 도서는 현재까지 연구된 AI 기술들의 원리를 그림으로 알기 쉽게 정리한 책
이다. 그저 학생들을 대상으로 그림으로 어느 정도의 지식을 간추린 정도가 아닐런지 큰 기대를 하고 본 것은 아니었는데 막상 뚜껑을 열고 깜짝놀랐다.
결론부터 말하자면 이 책은 AI에 대해 관심있는 학생 혹은 교육자라면 누구나 한 번 쯤은 봐야 할 책이라 할 수 있겠다. 나는 AI를 연구하는 사람이기 때문에 수학, 통계, 머신러닝, 딥러닝, 업무 도메인까지 여러 지식을 두루알고 있는데도 이 책을 보고 얻은 것이 많았다.
읽으며 머리속에 떠오르는 복잡한 것들이 나름의 체계로 잘 정리되기도 하였고, 또 AI와 관련된 주제들은 의사 전달이 쉬운편은 아닌데 - 그 원흉은 대부분 활용되는 수학 공식들 때문 - 이 책에서 활용된 그림들은 앞으로의 의사 소통을 위한 방법 중 하나로 활용해도 될 만큼 손색이 없다.
서두에 AI에 관심이 있는 학생들이 볼 것을 종용하였지만 AI에 관심이 없는 학생들도 봤으면 하는 책인데 이유 두가지를 들고 싶다. 하나는 AI는 기존의 수학, 경제학, 의학 등과 같은 부류의 분야가 아니라는데 있다.
AI와 빅데이터라는 트렌드 용어를 살펴보면 그 속에는 융합이라는 단어가 빠지지 않는다. 데이터 사이언티스트라는 신조어로 등장한 직군도 통계학의 스킬을 기반으로, 머신러닝과 서비스 연계를 위한 IT 기술, 비즈니스 안목 혹은 각 분야의 업무 도메인이 융합된 스킬을 가진 직군을 의미한다.
이게 무슨 의미냐면 하나의 Layer
라는 개념이다. 우리가 경제학을 배울때 학교에서 수학과 영어, 사회 등을 배웠듯이 어떤 분야 하나에 필요한 하나의 중요한 요소가 된다는 개념이다. 실제 데이터 사이언티스트 과정을 연구하다보면 배우고 연구해야 할 범위는 상상을 초월하고 심지어 인생 전부를 걸어도 쉽지 않은 경지이다.
따라서 AI는 각 분야마다 필수적인 필요 지식 계층의 한 층을 담당할 것으로 생각하는데 이를 아는 자와 모르는 자의 경쟁은 게임이 안 될 것이다. 바라보는 안목에서 번뜩이는 인사이트 그리고 분석과 적용에 이르기까지 경쟁이 될 수 없는 게임이 된다.
게다가 교육과정에도 변화
가 일어나고 있다. EBS AI 수학 교과서가 등장한 것은 물론 초등학교 학생들의 코딩 교육이 도입되고 있어 학교에서 이미 필수 교육의 위상이 확립되고 있다. 물론 이런 것들을 떠나서 미래 경쟁력을 위해 반드시 알아야 하는 지식이다.
또 다른 하나는 AI에 내포되어 있는 지식 체계
때문이다. AI의 융합이라는 특성상 이미 대다수 기존 분야에서 많은 부분 아이디어를 차용해 왔다. 본 도서에서도 등장하지만 논리, 추론 파트에 등장하는 기법들은 이미 우리가 일상에서 배우고 있는 부분이다.
국어, 언어 영역에서 논리와 추론, 진리표 등을 배우고 있고 책에 등장하는 모델 혹은 알고리즘 기법 중 유전학습 같은 경우는 생물학이나 과학에서 배워온 것들로 그 학문 분야에서 아이디어를 얻은 셈이다.
이처럼 기존 학문에서 배운 혹은 배워야 할 것들 대다수가 이미 AI를 익히는데 필요한 지식이기에 다양한 시너지를 낼 수 있다는 점에서 AI 관심 유무와 상관없이 배우길 권장한다.
이런 측면에서 본 도서는 학생들에게 더할 나위없이 훌륭한 교재라 생각한다. 가장 큰 장점은 AI 연구에 필요한 거의 모든 지식
이 담겨 있다는 것이다. 첫 부분에 등장하는 탐색 혹은 트리 알고리즘들은 컴퓨터 공학과 4년 동안 배우는 알고리즘에 해당한다.
심지어 컴퓨터 공학과 출신으로 실무에 수십 년간 근무한 사람조차도 거의 모든 트리 알고리즘을 명확하게 이해하는 사람이 많지는 않을 것이다. 즉, 그림으로 구성되어 있다는 이유로 대상 독자가 학생이라는 이유로 쉬운 부분만 보여주며 난이도 측면에서 타협을 보는 등의 행위 없이 진솔하게 AI에서 활용되는 지식 모두를 보여주었다는데에 박수를 보내고 싶다.
AI의 실체를 있는 그대로 아는 것이 학생들의 미래 그리고 국가 경쟁력 강화로 이어질 수 있을 것이기 때문이다.
대신 드넓은 범위를 카바하기 위해 저자가 가급적 쉽게 매커니즘을 전달하고자 애쓴 흔적이 역력하다. 그런 저자들의 노력 덕분에 독자들은 AI의 핵심 알고리즘에 어떤 것들이 있는지 상당부분 쉽게 파악할 수 있으며 이 책을 통해 그림으로 얻은 직관이 수학 공식 혹은 나아가 기초 과학으로 이어질 수 있는 연결 고리를 찾는데 많은 도움이 될 것이다.
범위 얘기가 나온김에 아래 그림을 보자. 강화학습
에 활용되는 대표적인 알고리즘 Q-Learning에 대한 설명이다. 그림을 따라가면서 아무 정보도 없는 에이전트(쉽게 말해서 게임속의 하나의 캐릭터라고 생각해도 무방하다.)가 최적의 보상(점수 혹은 아이템이라고 생각하면 된다.)을 얻기 위해 진화하는 과정을 그림으로 핵심만 깔끔하게 전달한다.
그림 하단에는 수식이 등장하는데 단언컨데 이 그림의 매커니즘을 이해하고 나면 크게 두렵지 않은 수식으로 변하게 될 것이다. 이 책이 가지는 또 하나의 장점이 바로 이것이다. 수학에도 관념적인 대수학과 눈으로 확인하여 직관의 도움을 받는 기하학이 있고 양쪽을 오가며 연구가 발전하게 되어 있는데 확실히 교육학을 연구한 저자 분들이라서인지 그런 교육학에서 활용할 수 있는 좋은 학습 기법이 책에 녹아 있음을 알 수 있었다.
다시 원점으로 돌아가서 범위 얘기를 해보겠다. 강화학습은 AI 중에서도 난이도 끝판왕이다. 이미지 인식, 나아가 시계열의 복잡한 모델에 익숙한 전문가 조차도 수식의 복잡함과 매커니즘의 경우의 수에 질리기 쉽다.
쉽게 말하자면 알파고에 쓰인 기술이다. 본 도서의 첫 파트 탐색, 트리가 등장하고 이어서 A*이니 Min-Max니, 그리디 정책이니, 깊이 우선 혹은 너비 우선이 등장하는 이유는 모두 강화학습에서 사칙연산 처럼 쓰이는 재료들이기 때문이다.
보통 AI 전공자를 위한 도서들도 강화학습은 특수 취급하며 내용에 포함시키기를 꺼리는 부분인데 학생들을 혹은 교양 수준의 어른들을 대상으로 하는 책에서 강화학습을 누락시키지 않았다는 용기에 찬사를 보내고 싶다.
내가 아는 한 이 책에서 다루지 않는 유일한 기법은 GAN 정도 인 것 같다. 그 외에 거의 모든 지식들의 매커니즘이 그림으로 잘 표현되어 있다.
마지막으로 교육을 위한 책인 만큼 AI의 윤리를 다뤄주는 부분도 인상 깊었다. 그저 AI가 사람의 일자리를 빼앗고, 인간을 해킹하고 그 정도 수준에 그치는 내용이 아니라 데이터 분포에 불균형이 존재할 때 생기는 문제점 등도 상세히 다루고 있다.
예를 들면 아래 그림은 세계 최고의 미인을 뽑는 AI 알고리즘인데 1등이 대부분 백인으로 나온다. 학습한 데이터의 분포가 백인에 지나치게 편중되어 있기 때문에 나타나는 현상이다. 이런 매커니즘들은 책에도 등장하는 확률, 통계, 분포 부분을 학습하면 알게 될 것이다. 왜 기초를 잘 학습해야 이런 문제들을 피할 수 있는지 생각의 끈이 이어지도록 각 지식들이 유기적으로 잘 어우러져 있다.
현재 학생이라면 초등학생부터 대학생에 이르기까지 반드시 추천하고 싶은 책
이다. 이미 나이가 제법 들어 가능성의 가치가 줄어든 성인도 마찬가지이다. 앞으로 세상은 AI에 의해 크게 변할 것이기에 이에 대비하고 AI 능력을 활용할 수 있는 새로운 세상에의 준비를 위해 이 책을 강력히 추천하는 바이다.
YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.