데이터 그리고 인간과 기계의 연결

한빛미디어

2011-10-11

by HANBIT

16,189

제공 : 한빛 네트워크
저자 : Julie Steele
역자 : 전재홍
원문 : Data and the human-machine connection

오페라 솔루션의 아납 굽타(Arnab Gupta)는 "인간에 기계를 더한 구도"가 언제나 "인간 대 기계 구도"를 이긴다고 말한다.

아납 굽타는 빅데이터 분석 서비스를 제공하는 다국적 기업인 오페라 솔루션의 대표이다. 필자는 최근 그와 빅 데이터를 관리하는 커다란 직무와 어떻게 인간과 기계가 교차하는지에 대해 이야기 할 기회를 가졌다. 아래에 인터뷰가 이어진다.

빅 데이터 분석에 대한 당신의 접근 방법에 대해 조금 얘기를 해달라

Arnab Gupta

아납 굽타: 우리 회사는 과학지식 지향적 회사다. 그리고 행위는 - 인간이던 아니던 - 수학적으로 표현될 수 있다는 것이 핵심적인 신념이다. 그렇다, 사람들은 불합리한 가치 판단을 한다. 그렇지만 그들은 공통된 동기부여 인자에 의해 움직이며 수학은 그것을 표현한다.

나는 인간 경험의 예시화로써 소위 "빅 데이터 현상"을 본다. 전에는 데이터가 수집 되지 않았기 때문에 정량적으로 인간의 경험을 측정할 수 없었다. 그러나 트위터가 최근에 발표했듯이 그들은 지금 하루에 3,500억개의 요청을 처리한다. 우리가 말하는 것과 행동하는 것이 지금은 물리적으로 표시를 가지고 있다. 일단 한 현상에 대한 물리적인 표시가 있다면, 그건 수학적으로 표현될 수 있다. 그리고 그걸 표현할 수 있다면, 정부나, 보건 산업 또는 회사 안에 있던간에 그것에 관해 비지니스 아이디어를 구성 가능하다.

어떻게 당신은 급속도로 증가하는 데이터를 다루는가?

아납 굽타: 생각해볼 때, 그건 가능하지 않은 싸움이다. 데이터의 양은 매일, 매주 매년 마다 빠르게 증가할 것이고, 그래서 그것 모두를 수집하는 것은 불가능하다. 경제 생태계에는 특별한 손실이 있다. 회사는 (데이터를) 이해하는데 대한 투자 비율이 늘어남에 따라 엄청난 양의 돈을 쓰고 있고, 더 깊은 이해 레벨에 따라 더 많은 투자를 하게 된다. 이 방법은 수학적으로 동작할 수 없다.

그래서, 우린 데이터를 찾지 않는다. 우린 신호를 찾는다. 우리가 말해왔던 것은 어떤 물고기가 있는지 알아내기 위해 둑으로 물을 막으려는 대신, 어디서 물고기들이 다니는 지 알아내는 신호를 연역적으로 식별하는 것이다. 우린 정적인 데이터의 수집보다 그 흐름에 집중한다.

무엇이 신호를 검색하는데 있어서 시각화 역할을 하는가?

아납 굽타: 시각화는 필수다. 사람들은 때때로 그것을 UI와 대시보드라 부르며 지나치게 단순화 한다. 그리고 어떻게 사람들이 이해하는지에 대한 질문에 과학을 적용하지 않는다. 우리에겐 좌뇌로 들어가 시각적인 은유를 거쳐 우뇌로 통해 이해하는 과정이 필요하다. 오페라 솔루션사에서, 우리는 그런 사고가 알고리즘과 데이터의 시각화 된 것들을 파악하면서 통찰력으로 바꾸는 방법들을 알아내려는 노력을 증대시키고 있다.

이해가 우선이라면, 다음중 어떤 것을 더 선호하는가: 더 나은 예언가능성을 가진 블랙박스 모델, 또는 아마 덜 정확하더라도 투명한 모델

아납 굽타: 사람들은 두갈래로 갈린다. 그리고 블랙박스 기계 대 인간의 구도에 비추어 사고한다. 하지만 그 질문은 기계학습을 인간의 통찰력을 증가시키는데 사용할 수 있느냐 없느냐이다. 그것은 블랙 박스를 열어 설명하면서 그것을 투명하게 만드는 데에 달려 있다. 스트레스 테스팅을 함으로써 그렇게 한다. 예를 들어, 만약 당신이 모기지 불이행에 대한 모델을 보고 있다면, "만약 주택 가격이 X 퍼센트 내려간다면 또는 금리가 X 퍼센트 오른다면 어떤 일이 있어날까" 라고 물어볼것이다. 당신은 자신의 경험에 의거해 답을 구하는 방법을 만든다. 그래서 당신이 배팅 할 때, 어떻게 그 기계가 당신의 배팅을 알려줄 지 당신은 정확히 이해하고 있다. 인간은 분석을 매우 잘 한다. 기계는 (분석을) 지속적으로 잘 하며 실수를 하지 않는다. 기계가 부족한 것은 직교인자를 고려하는 능력과 무엇이 맞을지 추측할 수 있는 창조성이다. 인간의 사고는 그 사이을 채우고 기계가 제시하는 해답의 영향력을 확장한다.

그렇다면 당신은 모델과 데이터 사이언티스트간의 파트너쉽을 지지하는가?

아납 굽타: 우리는 때때로 흑백논리로 생각한다. 하지만 진실은 인간 대 기계 구도였던 적이 한 번도 없었다는 것이다. 항상 인간에 기계를 더한 구도였다. 더욱이, 대부분의 대규모의 문제에 대해서, (게다가 체스에서도) 나는 기계가 인간을 이긴다는 것이 당연하다고 생각한다. 하지만 아마도 대규모 기반에서 기계의 예상된 영향력이 더 낫다 하더라도, 만약 인간의 사고가 그것을 영향력 있게 사용하도록 훈련된다면 그 가능성은 제한이 없어진다. 최근 Jeopardy 쇼의 IBM의 왓슨 컴퓨터와의 대결에서, 나라면 세가지 방법으로 시합 했을 것이다. 왓슨과 한 번, 한명의 Jeopardy 챔피언과 한 번, 그 둘의 조합과 한 번. 그러면 당신은 미래가 어디에 있는지 볼 수 있었을 것이다. (역주, Jeopardy!는 미국 TV 채널의 퀴즈 쇼이다. 2011년 2월 IBM의 왓슨 컴퓨터가 두 명의 예전 Jeopardy 챔피언과 겨루어 이긴 적이 있다)

이것은 우리가 교육에 대한 우리의 접근방법을 바꿀 필요가 있고, 사람들을 기계를 다르게 사용하도록 훈련시켜야 한다는 것인가?

아납 굽타: 정확히 맞다. 지금과 1850년대 사이의 시간을 되돌아 본다면, 교실을 제외하고 세상의 모든 것들이 바뀌어왔다. 하지만 난 우리가 위상 변위가 발생 하는 것을 다루고 있다고 생각한다. 대부분의 것들처럼, 힘의 관성은 움직이기 굉장히 힘들다. 변화는 시간이 걸릴 수 있으며 그 과정에 많은 파편들이 있을 것이다.

우리의 주 장애물은 아직 기계와 인간 상호작용 언어의 개발이 아직 시작되지 않았다는 것이다. 그건 부분적으로는 무성 언어이고, 데이터 시각화가 하나의 중요한 키이다. 문제는 언어가 너무나 힘이 세서 좌뇌가 쉽게 우세해지기 시작한다는 것이다. 하지만 거의 모든 중요한 입력은 실제로는 음성이 아닌 신호들로부터 들어 온다. 우리는 이런 것들을 설명하기 위한 새로운 언어 형식을 창조하는 방법이 아직 없다. 우린 이를 개발하려고 시도하는 시작점에 있다.

다른 열린 질문은, 이것을 위한 기술들이고 필요한 능력이 무엇인가이다. 오페라사에서, 우리는 기계에게 배우는 법을 가르치는 능력에 집중해왔다. 우리에겐 150-160명이 그 영역에서 일하고 있고, 아마도 IBM이나 Google 말고는 사기업이 하는 가장 큰 집중적인 연구일꺼다. 우리가 이런 과학자들을 고용하고 있는 이유 하나는 핵심적 역량의 레벨과, 이해력의 과학에 혁신을 가져오려고 시도하기 위해서이다.

그것의 사업적 측면의 결과는 간단히 말해 실용적이다. 결국에는, 우리가 하는 많은 것들은, 돈이 되거나 또 돈이 되지 않는, 그런 진부한 것이다. 이것은 비지니스이다. 하지만 우리가 들이키는 철학적인 원천은 깊을 필요가 있다.

TAG :

이전 글 : 지속적인 출판 방식은 옵션이 아닌 필수

다음 글 : 디지털 소유권의 늪 - 디지털 출판 소유권의 복잡성

최신 콘텐츠

컬럼/인터뷰

데이터 그리고 인간과 기계의 연결