거스를 수 없는 흐름에 어떻게 대처할 것인가?
지금 우리에게 가장 필요한 것은 ‘AI 리터러시’다!
2022년 11월 30일은 인류사를 결정지은 사건의 날짜로 역사에 기록될지 모른다. 바로 오픈AI의 챗GPT가 공개된 날이기 때문이다. 출시된 지 일주일 안에 사용자 100만 명을 모았고, 두 달 만에 무려 1억 명을 돌파했다. 챗GPT는 인스타그램과 틱톡을 가볍게 제치고 인류 역사상 가장 빠른 속도로 사용자를 모은 서비스가 되었다.
곧이어 서점은 온통 챗GPT 책으로 도배되다시피 했다. 신기술이 등장하면 흔히 뒤따르는 전망서는 물론이요, 챗GPT로 집필되었다는 책이 나오는가 하면, 챗GPT를 잘 쓰기 위한 활용서나 인문학적 분석까지 불과 몇 달 사이에 수백 권이 쏟아져 나왔다. 챗GPT를 제대로 써보기도 전에, 그리고 익숙해지기도 전에 이 거대언어모델 서비스에 압도되어 버린 형국이다.
도대체 이 거스를 수 없는 흐름에 어떻게 대처할 수 있을까? 많은 사람들이 챗GPT 관련 책을 너도나도 찾아보는 것도 바로 이런 이유 때문이다. 그러나 공학 지식이 부족한 일반인에게 강화학습, 매개변수, 토큰, 플러그인, API 등등의 용어는 낯설 수밖에 없다. 《박태웅의 AI 강의》는 바로 이들에게 가뭄의 단비와 같은 책이다. 중고등학생도 정독하면 이해할 수 있을 정도로 쉬운 대화체로 쓰여 있어, 읽다 보면 자연스레 인공지능의 원리를 이해하게 된다. 또한 단순한 해설에 그치지 않고 인공지능으로 인해 변하게 될 사회적 충격을 예견하고, 그 우려와 대책의 필요성을 강조함으로써 새로운 시대를 깊이 고찰할 인사이트를 제시한다. 저자 박태웅이 많은 사람들에게 ‘IT 현자’로 불리는 이유가 여기에 있다.
AI의 개념부터 AI 사회가 몰고 올 충격과 우리가 해야 할 일까지
당신이 알고 싶었던 인공지능의 모든 것
《박태웅의 AI 강의》는 총 5강에 걸쳐 AI 리터리시에 필요한 지식과 지혜를 들려준다. 우선 1강은 인공지능의 기본 알고리듬을 설명하고 챗GPT의 개념과 원리를 다룬다. 이를 통해 이 생성형 인공지능이 왜 그토록 놀라운 글쓰기 실력을 보여주면서도 할루시네이션(Hallucination)이라 불리는 환각을 일으키는지를 쉽게 이해할 수 있다. 이어지는 2강에서는 전 세계 사람들이 챗GPT에 열광할 수밖에 없는 이유, 즉 거대언어모델의 놀라운 특징들을 하나하나 밝혀준다. 독자들은 2강에서 창발성(느닷없이 나타나는 능력)이라든가, COT(Chain of Thoughts, 생각의 연결고리), 플러그인과 API 등등 인공지능에 관한 여러 지식을 알게 된다.
3강은 앞으로 인공지능이 인간 사회에 초래할 다양한 충격과 우려점 등을 다루는데, 저자는 오리지널의 실종, 특정 국가와 기업의 독점 문제, 데이터 오염, 지적재산권 침해, 일자리 소멸 등등 우리가 대처해야 할 여러 우려점들을 언급하면서 각각의 이슈에 대한 인사이트를 심도 있게 짚어낸다. 특히 인공지능으로 인해 이제 모든 인류가 마음에 대한 실험을 당하고 있다고 경고하는 4강의 메시지는 박태웅 저자만이 할 수 있는 통찰일 것이다.
끝으로, 5강은 독일의 녹서와 백서, 유럽연합의 인공지능법, 미국의 알고리듬 책무법안 등 다른 나라들의 여러 대책을 보여주면서 인공지능에 대해 정의조차 내리지 못한 우리 정부에 대한 비판의 메시지를 던진다. 이어서 한국 정부가 해야 할 일과 하지 말아야 할 일을 제시하며 우리 사회가 나아갈 방향을 모색하는 것으로 이 책을 맺는다.
AI와 공존할 것인가? AI에 의해 대체될 것인가?
대전환의 시대에 대비하기 위한 첫 번째 가이드
2023년 3월 챗GPT의 다음 버전인 GPT-4가 나왔고, 메타(페이스북)에선 라마를 내놓았으며, 스탠퍼드대학에서는 라마를 더 최적화한 알파카를 내놓았다. 최근에는 구글에서 한국어를 추가한 바드를 출시하기도 했다. 이런 빅테크 기업 서비스 외에 오프소스 프로젝트들까지 더하면 셀 수도 없을 지경이다. 저자의 말처럼 ‘인공지능의 캄브리아기’가 시작된 것이다.
이 같은 변화의 속도는 앞으로도 빨라지면 빨라졌지, 느려지지는 않을 것이다. 인류는 과연 기술 진보의 가속도를 견뎌낼 수 있을까? 이런 급격한 변화에 대비하기 위해 가장 필요한 것은 ‘AI 리터러시’다. 이 책은 이를 위해 인공지능의 다양한 측면을 두루 보고, 그것이 가진 함의와 품고 있는 위험들, 그래서 우리가 해야 할 일들을 짚어내고 있다. 인공지능의 개념과 역사, 그리고 미래를 종합적으로 알고 싶다면, 그 첫 번째 가이드는 단연코 《박태웅의 AI 강의》가 되어야 할 것이다.
책 속으로
말하자면 지금의 인공지능은 ‘어려운 일은 쉽게 하고 쉬운 일은 어렵게’ 합니다. 잠재된 패턴이 없는 곳, 그러니까 확률이 필요하지 않은 분야에서는 어처구니없이 약합니다. 챗GPT는 인터넷에 올라와 있는 거의 모든 문서를 학습했다고 해도 과언이 아닐 텐데요, 이 말은 웹에 없는 정보에는 취약하다는 것을 의미합니다. 가령 다섯 자리 이상의 더하기, 빼기의 모든 셈 결과가 웹에 다 있는 것은 아니겠지요. 123,456,789+56,789와 같은 셈의 결과들이 모조리 인터넷에 올라와 있을 리는 없으니, 챗GPT는 이런 셈을 잘하지 못합니다.
_45쪽, <1강 놀라움과 두려움 사이에서 등장하다> 중에서
앞에서 챗GPT는 트랜스포머 모델을 이용해 주어진 말들의 다음에 나올 가장 그럴듯한 단어를 찾는다고 했지요. 챗GPT가 볼 때는 이건 너무나 그럴듯한 답이었던 것입니다. 그러니까 챗GPT는 참인지 거짓인지를 답하는 것을 배운 게 아닙니다. 트랜스포머 모델을 써서 ‘가장 그럴듯한 말’을 내놓도록 학습을 했지요. 챗GPT는 거짓말을 할 때도 기가 막히게 그럴듯하게 하는 겁니다. 모차르트의 첼로 협주곡에 대해 물으면 쾨헬 넘버(모차르트의 곡 에다 연대기 순으로 번호를 붙인 것)까지 붙여서 다섯 곡을 내놓기도 합니다. 모차르트의 첼로 협주곡은 실제로 남아 있는 게 없지만 챗GPT는 쾨헬 넘버까지 붙여서 답을 합니다. 그래야 그럴듯하기 때문입니다. 뭔가 허언증 환자와 비슷한 느낌입니다.
_48쪽, <1강 놀라움과 두려움 사이에서 등장하다> 중에서
거대 인공지능의 가장 큰 특징 가운데 하나는 ‘규모의 법칙’입니다. 컴퓨팅 파워를 늘릴수록, 학습 데이터 양이 많을수록, 매개변수가 클수록 거대언어모델 인공지능의 성능이 좋아지는 것을 볼 수 있습니다. 이 셋이 함께 커질 때 성능 향상이 더 잘된다고 합니다. 오히려 모델 간의 차이는 그리 크지 않다고 합니다. 그러니까 규모를 키우는 게 무엇보다도 중요하다는 것입니다. 이 때문에 챗GPT의 출현을 알리는 〈타임〉의 표지 제목이 “인공지능 군비경쟁이 모든 것을 바꿔놓고 있다”였던 것입니다. 군비경쟁을 하듯 규모를 키우는 시도들이 앞다투어 나타나고 있다는 것입니다. 챗GPT가 무려 1,750억 개의 매개변수, 5조 개의 문서, 1만 개의 A100 GPU로 학습한 이유가 여기에 있습니다.
_67~69쪽, <2강 우리는 왜 챗GPT에 열광하게 되었나?> 중에서
우리가 챗GPT에 열광하게 된 또 다른 이유는 이것이 사상 최초로 사람이 평소에 쓰는 말(자연어 Natural Language)로 기계와 대화할 수 있게 만들어주었기 때문입니다. 즉, 처음으로 나타난 자연어 인터페이스라는 것입니다. 이전까지 우리는 컴퓨터와 대화하려면 C++, 자바, 파이썬과 같은 컴퓨터 랭귀지(기계어 Machine Language)를 따로 배워야 했습니다. 그런데 드디어 사람에게 하듯이 자연어로 컴퓨터에게 일을 시킬 수가 있게 된 것입니다.
_105쪽, <2강 우리는 왜 챗GPT에 열광하게 되었나?> 중에서
챗GPT의 플러그인이 된다면 많은 사용자들을 가질 수 있지만, 바깥에 있게 된다면 점점 더 사용자 수가 줄어들 위험이 있습 니다. 반대로 챗GPT의 플러그인이 되면 그 순간 내 브랜드의 존재감은 퇴색할 수밖에 없다는 걸 감수해야 합니다. 챗GPT가 알아서 다 처리하고 결과를 주는 것이니 개별 브랜드들은 더 이상 사용자에게는 보이지 않습니다. 사용자 입장에서도 굳이 어떤 서비스, 어떤 플러그인을 사용하는지 알 필요가 없지요. 챗GPT의 그늘 아래에서 언제 대체될지 모를 위험을 안고 살 것인가, 아니면 바깥에서 굶어 죽을지도 모를 위험을 감수할 것인가? 이와 같은 양자택일의 상황이 올 수도 있습니다.
_112쪽, <2강 우리는 왜 챗GPT에 열광하게 되었나?> 중에서
스택오버플로(stackoverflow.com)라는 사이트가 있습니다. “모든 개발자는 스택오버플로 탭을 열어두고 있습니다”라는 캐치프레이즈를 자랑하는 곳입니다. 전 세계의 개발자들이 개발을 하다 궁금한 게 생기거나 막힌 곳이 있으면 물어보고 답하는 게시판입니다. 개발자를 위한 네이버 지식인과 같은 곳이지요. 챗GPT가 발표된 뒤 이 스택오버플로의 방문자 수가 급감하기 시작했습니다. 2022년 12월 한 달 새 12퍼센트나 떨어져버린 것입니다. 이런 추세는 계속 이어져 2023년 3월에도 13.9퍼센트가 떨어졌습니 다. 개발자들은 이제 스택오버플로에서 질문하고 답을 찾는 대신 챗GPT에게 코드를 짜달라고 바로 요구하기 시작했습니다. 커뮤니티 구성원들이 주어진 코딩 질문에 대해 다양한 답변을 게시하고, 장점과 단점에 대해 토론하고, 투표를 통해 최고의 솔루션을 선정하는 것이 스택오버플로의 전통이었습니다. 훌륭한 공동체였지요. 거의 모든 개발자들이 한두 번쯤은 스택오버플로에 올라온 코드를 그대로 복사해 사용한 적이 있었을 겁니다. 그런 공동체가 무너지고 있습니다.
140~141쪽, <3강 열려버린 판도라의 상자> 중에서
인간의 정신, 인간의 마음에 대한 실험은 어떨까요? 그전에 나왔던 증기기관, 엔진, 산업기계 등이 인간의 몸의 효율을 높이고, 인간의 몸을 대체하려는 시도였다면, 인공지능은 인간의 정신노동 효율을 높이고, 인간의 정신을 대체하려는 시도입니다. 인간의 몸에 대한 실험에 대해서는 우리는 대단히 엄격한 절차와 조건을 가지고 있습니다. 그렇다면 인간의 정신에 대한 실험은 어떨까요?
_160~161쪽, <4강 몸에 대한 실험, 마음에 대한 실험> 중에서
미디어는 메시지입니다. 새로운 미디어는 돌이킬 수 없이 분명하고 근본적인 변화를 지시합니다. 인류는 소셜미디어의 출현에 제대로 대응하지 못했습니다. 페이스북이 알고리듬을 바꾸자 전 세계의 정치가 출렁였습니다. 곳곳에서 포퓰리즘이 기승을 떨칩니다. 미국에선 소녀들의 자살률이 두 배로 뛰어올랐습 니다. 지금도 미국 10대들의 자살률은 계속해서 오르고 있습니다. 한국에선 독점적인 포털사의 광고 수익을 배분하는 알고리듬 하나가 언론사 보도를 통째로 망치고 있습니다. 이 사실을 모두가 알고 있지만 누구도 해결책을 내놓지 못하고 있습니다.
_175쪽, <4강 몸에 대한 실험, 마음에 대한 실험> 중에서
정의를 제대로 내리지 못해 실패한 사례를 우리는 이미 여러 차례 경험한 바 있습니다. 가령 데이터를 봅시다. 정부 자료들은 아직도 hwp가 아니면 pdf 포맷입니다. 이것들은 컴퓨터가 자동으로 처리하지 못합니다. 즉 기계가 읽을 수 없습니다. 정부는 정부 문서들의 포맷을 바꿀 예정이지만 그 기한은 2025년 이후로 미뤄져 있습니다. 저런 포맷을 컴퓨터가 처리하지 못하는 것은 표준 포맷이 아니기 때문입니다. 한두 장이면 새로 넣어서 컴퓨터에 입력할 수도 있지만, 정부가 내놓는 공문서는 수십만, 수백만 장을 쉽게 넘어갑니다. 자동으로 하지 않으면 입력할 도리가 없으니 컴퓨터에게는 사실상 없는 문서와 같습니다. 거대언어모델 인공지능은 문서로 학습해야 하는데, 한국은 정부가 나서서 학습을 방해하고 있는 꼴입니다.
_206쪽, <5강 인류는 어떻게 대응해야 하는가?> 중에서