본문 바로가기 주메뉴 바로가기 사이드바 메뉴 바로가기

4차 산업혁명과 데이터융합

발표 : 이민화 KAIST 교수, 창조경제연구회 이사장, 벤처기업협회 명예회장
동영상에 대한 자막정보
반갑습니다. 이민화입니다. 반갑습니다. 제가 맡은 주제가 콘텐츠4.0입니다. 이제 데이터가 도서관을 나와서 전 세계와 융합을 하고 있죠. 그 얘기를 시작하도록 하겠습니다. 저도 책을 많이 썼죠. 그래서 도서관에 혹시 저런 책이 없으면 비치해 두는 것도 나쁘지 않을 겁니다. 제가 쓴 책이 약 34권이 있습니다. 우선 우리 시작이 4차 산업혁명을 우리가 어떻게 이해하느냐 하는 문제부터 보겠습니다. 4차 산업혁명 들여다볼 때 맨 처음에 하는 게 저와 같이 사물인터넷은 뭐지, 빅데이터는 뭐지, 인공지능은 뭐지. 이런 기술 검토를 먼저 하죠. 그러면 우리가 이해를 하게 되느냐? 이해를 더 못하게 됩니다. 보면 볼수록 더 어려워져요. 이게 코끼리 다리 만지기 같다는 거죠. 그런데 기술 자체가 우리의 목적은 아니죠. 우리의 목적은 뭐죠? 기술이 아니죠. 우리의 목적은 사람을 위한 뭔가를 만들어내는 겁니다. 그것이 인간의 욕망이죠. 즉 욕망의 관점에서 우리가 기술을 봐야지 제대로 보인다는 겁니다. 그러면 이런 관점에서 우리가 문제를 보면, 산업이란 과연 뭐냐? 놓고 봤을 때 산업이라는 물건을 만들고 서비스를 하면 산업이 되느냐? 그렇지 않죠. 산업은 누군가가 소비를 해야지 산업이 됩니다. 그렇다면 우리는 생산과 소비. 이 2개의 순환과정에서 산업을 봐야 되는데 지금까지 어떻게 했죠? 그냥 만드는 관점에서 산업을 봤어요. 그러다 보니까 산업혁명을 뭐라고 보느냐? 기술의 관점에서만 봅니다. 그러면 우리는 지금까지 기술의 혁명이라고 생각을 해 왔습니다. 과연 그런가? 그렇지가 않다라는 얘기를 제가 드리고 그것이 앞으로 우리 도서관이 갖고 있는 방대한 콘텐츠가 세상을 어떻게 바꾸느냐 하는 얘기하고 연결될 겁니다. 기술과 욕망이 융합해서 산업을 만든다고 얘기를 하니까 그러면 지금까지 우리 산업혁명 들은 얘기하고 다르니까 그걸 한번 입증을 해 봐라. 그래서 제가 여러 가지 자료를 만들었는데 그 중 대표적인 자료가 이거입니다. 2014년도에 맥킨지가 뭐를 밝혔냐 하면 인구증가율과 GDP증가율을 비교를 했어요. 2개를 비교해 보니까 아주 재미있는 현상 3가지가 발견됐습니다. 제가 여기다가 화살표를 그렸습니다. 첫 번째 1차 산업혁명이 일어날 때까지의 과정을 보면 이 1820년까지 약 1000년에 걸쳐가지고 GDP증가율과 인구증가율은 완전히 정비례하고 있습니다. 무슨 얘기죠? 사람들이 생존에 필요한 생산을 해 왔다는 겁니다. 즉 이때까지만 하더라도 전체 인구의 80%는 농업에 종사를 하고 있었습니다. 우리는 1차 산업혁명을 기계혁명이라 얘기하지만 사실은 1차 산업혁명은 인간이 먹고 사는 문제로부터 비로소 해방되기 시작한 혁명이다. 그래서 기계혁명이 생존의 욕구와 공진화한 혁명입니다. 그러면 2차 산업혁명은 우리는 뭐로 봐야 될 것이냐. 2차 산업혁명은 인구증가율보다 GDP증가율이 훨씬 빨리 증가합니다. 즉 이제는 뭔가를 축적할 수 있게 되고 편리한 생활을 할 수 있게 된 거죠. 그래서 이런 인간의 편리성, 안정성에 대한 요구를 전기혁명이 충족해 준 거죠. 무엇이 먼저였느냐? 인간의 욕망이 먼저입니다. 3차 산업혁명이 시작되면서 아주 재미난 현상이 생기죠. 지난 45년간 인구증가율은 줄기차게 줄고 있습니다. 이게 무슨 얘기인가요? 이것은 모든 생물 중에서 먹고 살기 풍부한데 이렇게 계속 인구증가율이 줄고 있는 유일한 종이 인간밖에 없습니다. 바로 인간의 가장 중요한 가치 하나가 사라진 거죠. 그것이 뭐냐 하면 연결의 욕구를 정보혁명이 뒷받침하게 된 겁니다. 그러면 우리는 산업혁명을 제가 새로 이렇게 정의했습니다. 산업혁명이란 이제 기술과 욕망이 공진화한다. 기계혁명이 생존의 욕구와 전기혁명이 안정의 욕구와 그리고 전기혁명이 연결의 욕구와 공진화하는 혁명이다. 이렇게 놓고 보니까 오른쪽에 있는 그림들은 우리가 늘 보던 그림입니다. 매슬로우의 욕구 5단계설 그림이 나왔죠. 그러면 이게 뭘 의미하느냐? 4차 산업혁명에서 이 혁명이 어떻게 진행될 것인가에 대해서 과거에 있었던 일. 지금의 현상이 아니라 미래에 어떻게 갈 것인가를 우리한테 인사이트를 얻게 되는 거죠. 이 인사이트에 가장 중요한 것은 인간이 앞으로 필요한 미충족 욕망이 무엇인가 하는 겁니다. 인간의 미충족 욕망을 이제 자기표현 욕망, 자아실현 욕망. 즉 개인화된 욕망들입니다. 이 개인화된 욕망들은 지금까지 많은 문제로 해소될 수가 없었어요. 그런데 이 문제를 우리가 뭐가 해소해 주느냐. 바로 지능혁명이 해소해 주는 거죠. 즉 우리가 이 물질단계에서 사회단계를 거쳐서 인간 개인의 단계에 이르기까지 기술과 욕망이 공진화하면서 이 사회는 발전해 왔다는 겁니다. 그렇다면 우리는 이 4차 산업혁명에서 일어나는 가장 거대한 변화의 핵심을 다시 볼 필요가 있죠. 핵심이 뭐냐? 이제 인간은 개인화된 욕망들, 이것을 충족시키고 싶어요. 과거에 우리가 먹고 사는 문제, 편리한 문제, 연결의 문제 등은 이와 같이 나무의 줄기와 뿌리같이 그닥 복잡하거나 어렵지가 않았습니다. 저것은 표준화된 공정으로 제품과 서비스로 만족시킬 수 있었습니다. 농업경제에서 산업경제를 거쳐서 서비스경제로 가면서 나무의 줄기에 이르기까지 인간의 욕망은 만족할 수 있었죠. 그런데 이제 뭐가 필요하냐? 인간의 수많은 자기표현의 욕망, 나를 나타내고 싶습니다. 거기다가 자기 자아실현 욕망들 꽃을 피우고 싶어요. 이런 문제들은 어마어마한 개인화된 욕망들입니다. 예를 들어서 스카이캐슬에 있는 코디를 우리 아이들 한 명, 한 명한테, 모든 대한민국 학생들한테 붙여주자는 겁니다. 가능해요? 가능하지 않죠. 우리는 그만한 자원이 없습니다. 지금까지는 모든 사람들에게 맞춤 콘텐츠를 제공하고 맞춤 제품을 만들어주고 이런 맞춤서비스를 한다는 것은 불가능했습니다. 그런데 이제 4차 산업혁명이 그걸 가능하게 하는 것이 첫 번째, 공통된 부분들은 플랫폼으로 제공합니다. 그래서 저가로 제공하죠. 여기다가 인공지능이 개별적으로 맞추어집니다. 여기 스포티파이나 또 넷플릭스 쓰시는 분 계실 거예요. 스포티파이, 넷플릭스. 개인의 맞춤서비스를 제공해 줍니다. 소위 말하는 컨시어지서비스를 제공하죠. 과거 같으면 정말 어마어마하게 비싼 겁니다. 지금 바이트댄스가 우버를 넘어서 세계 최고의 기업가치를 갖는 유니콘으로 등장했습니다. 중국의 기업이죠. 틱톡을 쓰는 분들은 아실 겁니다. 그런데 이 바이트댄스가 하는 일이 뭐냐. 모든 콘텐츠를 개개인에게 맞춰서 공급해 준다는 겁니다. 한 명, 한 명한테 맞춤 공급이라는 것은 절대 있을 수 없었던 일들이 이제 4차 산업혁명에서 플랫폼과 인공지능기술로 가능하게 된 거죠. 그래서 유니콘들의 비즈니스. 새로운 비즈니스가 등장하는 패턴을 보면 바로 첫 번째가 플랫폼, 연결의 기술들입니다. 두 번째가 뭐냐 하면 인공지능, 지능의 기술들이에요. 선택을 대신해 주는 거죠. 세 번째는 그것을 묶어가지고 너희들은 하나의 커뮤니티를 만들자 하는 서브스크립션, 가입서비스를 만들어내게 됩니다. 그래서 우리가 1, 2차산업혁명은 오프라인의 혁명이었습니다. 여기서는 공유하고 연결하는 일이 별로 없었습니다. 여기서는 그저 우리가 안정되게 먹고 사는 문제들이 해결됐죠. 그런데 2차 산업, 3차 산업혁명이 시작되면서 우리 세상에는 공유와 연결의 세상이 생겼습니다. 그것이 온라인세상이죠. 이 온라인혁명이 3차 산업혁명을 이끌면서 전세계 GDP를 5% 정도 끌어올렸습니다. 적다면 적고 많다면 많아요. 이때까지는 큰 문제가 안 되는 게 온라인기업과 오프라인기업은 서로 떨어져 있습니다. 네이버와 현대자동차가 서로 부딪힐 일이 없죠. 그들은 서로 다른 사업을 하고 있는 기업들이니까. 그런데 4차 산업혁명에서는 이 현실과 가상의 두 세계가 다시 합쳐지기 시작합니다. 이 두 세계가 합쳐지니까 이제는 네이버도 현대자동차도 자율주행차라는 동일한 경쟁을 치열하게 벌이기 시작한 것이죠. 이렇게 해서 우리는 현실과 가상이 융합한 4차 산업혁명시대에서 무엇이 결합되고 있느냐? 소위 정보와 물질이 결합되기 시작했습니다. 이 정보와 물질이 결합되기 시작하면서 4차 산업혁명의 O2O 현실의 세계는, 소위 오프라인의 세계는 소유의 세상입니다. 원전은 제가 만들 수가 없어요. 그걸 만들면 저는 하느님과 동기동창이죠. 그래서 원자의 세상은 3간의 한계에 직면해 있습니다. 현실 한계는 시간, 공간, 인간의 한계죠. 이 한계를 극복하기 위해서 우리는 뭘 만들었느냐? 이 온라인세계를 만들었습니다. 온라인세계는 시간, 공간, 인간의 한계가 없는 절대계 세상이 됩니다. 우리는 마음대로 미스트롯이든 101이든 프로듀스48이든 이런 것들을 뒤적여서 볼 수 있고, 애니타임, 애니플랫으로 할 수 있고 저희 집사람의 주름살을 한번에 포샵으로 없앨 수 있습니다. 그런데 문제는 허망하죠. 이 온라인세상을 만드는 기술은 현실세계를 데이터로 바꾸는 기술이니까 우리가 디지털트랜스폼이라고 부르고 있습니다. 그런데 이 현실로 다시 데이터를 가지고 나오는 기술이 등장해야지 2개의 세계는 합쳐지죠. 그러면 현실을 데이터로 만드는 기술을 데이터의 트랜스폼이라고 부른다면 데이터를 현실로 만드는 기술은 뭐라고 불러야 될까요? 이것은 똑같은 디지털트랜스폼 그러면 뭔가 이상하죠. 그래서 제가 이건 아날로그트랜스폼이라고 부르자. 이 2가지를 합쳐서 제가 스마트트랜스폼이라고 부르고 있습니다. 두 세계가 합쳐졌습니다. 두 세계가 합쳐지면 이게 우리는 어떤 세계가 만들어지냐? 과거에 없던 소유와 공유가 혼재돼 있는 세상이 만들어집니다. 오프라인은 소유, 온라인은 공유의 세상입니다. 우리 저작권을 놓고 보더라도 오프라인의 저작권법이 현재 우리가 온라인에서 일어나는 일련의 상황하고는 맞아들어가지가 않는 현상들이 발생하게 되는 거죠. 이 저작권법의 문제들도 여기서 발생하고 있습니다. 그러면 이 O2O 세상의 융합의 어려운 점은 무엇일까 한번 생각해 봅시다. 현실과 가상을 연결하는 디지털트랜스폼과 아날로그트랜스폼의 기술이 어려울까요? 기술의 융합이 어려울까요? 아니면 현실세계와 가상세계의 가치관의 융합. 소유의 가치관과 고유의 가치관의 융합이 어려울까요? 어느 게 어려울까요? 기술의 융합이 어려울까요? 욕망의 융합이 어려울까요? 자, 기술의 융합이 어렵다고 생각하시는 분. 제가 공학박사인데 이렇게 지지하는 분이 없다니. 그럼 욕망의 융합이 어렵다고 생각하시는 분. 그렇습니다. 이게 4차 산업혁명의 본질이고 전세계 국가들은 4차 산업혁명을 제도의 융합 관점에서 접근하고 있습니다. 제도 융합이 사실 4 차산업혁명의 제일 큰 문제예요. 우리가 전세계 원격의료가 안 되고 우리가 데이터의 과도한 통제를 하고 있고 이런 일련의 문제들이 다 뭐냐 그러면 기술의 문제가 아닙니다. 제도의 문제들이죠. 그래서 이 문제를 우리가 이따가 제가 아니고 다음 세션에 다루게 되어 있더라고요. 그래서 제가 4차 산업혁명을 이렇게 정의를 합니다. 데이터를 통해서 현실과 가상이 융합하는 혁명이다, 이렇게 정리를 합니다. 그러면 이 정의 하에서 그러면 어떻게 융합하는가를 우리가 좀 볼 필요가 있죠. 현실과 가상의 2개의 세상이 융합해서 우리는 이 사회 보건, 복지, 금융 수많은 문제들을 해결해 나갑니다. 이 해결해 가는 과정을 보면 현실세계에서는 우리 마음대로 못해요. 그러니까 현실세계를 데이터로 바꿉니다. 바꾸는 기술이 디지털트랜스폼. 시간을 바꾸는 기술, 공간을 바꾸는 기술, 인간을 바꾸는 기술이 있죠. 이 바꾸는 기술 6개를 동원하면 현실세계를 이와 같이 데이터의 세계로 바꿀 수가 있습니다. 그럼 뭐가 좋아지죠? 우리는 시공간에 관계없이 편집을 할 수 있고 복제를 할 수 있게 됩니다. 그러면 뭐가 되느냐? 우리는 최적의 맞춤을 할 수 있게 되죠. 그 대표적인 결과가 뭐냐 하면 바로 내비게이터입니다. 내비게이터가 없이 우리가 내가 도착시간을 예측하고 싶다. 예측이 되나요? 지방은 몰라도 서울에서는 안 됩니다. 그리고 내가 어느 길로 가는 게 제일 안 막히는 길인지 알 방법이 있나요? 사실 모릅니다. 그런데 우리는 내비게이터가 있으므로 인해서 도착시간을 예측하고 그리고 최적의 경로를 맞춰주게 돼요. 그러니까 시간을 예측하고 공간을 맞춰주는 이 최적화를 통해서 우리는 불필요한 시간낭비, 에너지낭비 이런 걸 다 줄여나가게 됩니다. 국가 전체로 5조의 가치가 만들어져요. 그러면 이런 5조의 가치가 만들어지는 이 내비게이터와 같은 현실과 가상의 융합을 우리는 공장에서 하면 안 될까요? 되죠. 그게 스마트공장입니다. 교육에서 하면 안 될까요? 그게 스마트학교예요. 교통에서 하면 스마트교통입니다. 도시에서 하면 스마트시티가 되는 거죠. 현실과 가상이 융합하면 뭐가 된다? 예측과 맞춤을 할 수 있고 그로부터 우리는 현실을 스마트하게 바꿀 수가 있게 됩니다. 그런데 왜 지금까지는 그것 안 했는가? 지금까지는 비용이 많이 들었습니다. 그런데 이제는 데이터를 모으는 비용이 제로에 육박해 들어가요. 이제는 자동차 위치를 수집하는 데 돈 또 안 듭니다. 거기다가 데이터를 저장하는 비율이 1억분의 1로 줄었고 그리고 컴퓨팅 파워가 어마어마하게 증가했습니다. 결국은 모든 분야에서 이제는 현실과 가상을 융합해서 예측과 맞춤을 하는 일이 쉬워진 거죠. 그러면 이런 일들이 어떤 단계로 일어나고 있는가 하는 그림도 우리가 봐야 될 겁니다. 우리 도서관도 디지털트랜스폼을 하고 이 세상도 디지털트랜스폼을 하고 그러면 디지털트랜스폼을 한다는 건 알겠는데 어떻게 해야 된다는 거냐? 그걸 얘기를 해야 되겠죠. 1차 산업혁명은 우리 인간의 근육을 확대한 혁명입니다. 2차 산업혁명은 우리 에너지를 확대한 혁명이죠, 전기혁명입니다. 3차 산업혁명은 인간의 신경망을 확대했습니다, 정보혁명이죠. 4차 산업혁명은 이제 우리 인간의 지능을 확대하는 혁명입니다. 그러면 지능은 어떻게 작동하느냐? 제가 1분 전에 했던 얘기를 한번 떠올려주세요. 그 떠올린 생각은 현실입니까, 가상입니까? 현실이 없어요. 뇌는, 우리 두뇌는 가상의 상태에 있습니다. 우리 육체는 현실이에요. 그래서 우리 두뇌의 과정을 보면 첫 번째가 오감을 통해서 데이터를 획득합니다. 시간, 공간, 인간의 현실데이터를 획득하죠. 그런 획득한 데이터를 대뇌피질과 해마에 저장해 두고 전전두엽이 해석을 해 가지고 이건 맛있어 보인다, 열심히 먹자. 이렇게 해서 실제 먹어보고 맛이 있으면 강화하고 틀리면 수정을 합니다. 이게 우리 인간이 하고 있는 일입니다. 이 과정과 4차 산업혁명의 기술은 데이터의 관점에서 보면 똑같습니다. 데이터를 수집하고 저장하고 분석하고 행동하는 겁니다. 그래서 이 모든 융합과정. 우리가 현실세계에서는 내가 몇 시에 도착할지, 어느 길이 제일 좋을지 알 수가 없는데 가상과 합쳐지니까 2개를 알 수 있습니다. 그래서 이 단계가 제1단계는 오감과 같이 현실로부터 데이터를 획득하는 단계입니다. 여기에 들어가는 기술이 사물인터넷, 생체인터넷, 이런 기술들이 들어가죠. 그러면 획득한 데이터를 어디에 갖다놓느냐? 클라우드의 빅데이터로 갖다놓는 게 대뇌피질과 해마에 저장하는 것과 같습니다. 그러면 이것을 인공지능이 전전두엽과 같이 작동해 가지고 예측과 맞춤을 하면 현실세계가 스마트하게 바뀌는 겁니다. 1단계가 데이터화, 2단계가 정보화, 3단계가 지능화, 4단계 스마트화. 이 4단계는 모든 4차 산업혁명의 디지털트랜스폼 과정에 예외 없이 등장하고 있습니다. 그래서 제품을 만드는 캐터필라는 옛날에 제품을 팔고 끝났는데 지금은 팔고 난 다음에 모든 제품의 운영데이터를 수집을 합니다. 운영데이터 수집해서 어떻게 하느냐? 수집한 데이터로부터 클라우드의 빅데이터를 만들고 인공지능이 분석했더니 경주 힐튼호텔에 있는 굴삭기 오른쪽 바퀴가 이제는 고장날 확률이 98%가 됐다. 그러면 비포 서비스가 가능해집니다. 이제 모든 제조업은 서비스와 결합하게 됩니다. 이제 제품이 정보를 통해서 서비스화되는 거죠. 우리는 이와 같은 일들을 수많은 사례에서 볼 수가 있습니다. 이와 같이 스마트툰 같은 경우는 만화를 만드는데 만화를 어떻게 만드는 게 좋을 것이냐. 데이터를 모아서 반응을 다 빅데이터로 봤더니 어떤 식으로 만들면 가장 잘 팔리는가 하는 것들이 등장하게 되죠. 이와 같이 현실만 가지고는 우리가 미래를 예측할 수 없습니다. 그리고 현실만 가지고는 최적의 맞춤서비스를 할 수가 없어요. 이 2가지를 우리가 합친 가상의 세계를 만들어서 이 2가지를 합쳐나가는 것이 바로 우리가 얘기하는 4차 산업혁명의 트랜스폼 과정들입니다. 그러면 이런 것들이 우리 도서관을 포함한 콘텐츠산업에서는 어떻게 일어나고 있는가. 그래서 기본적으로 산업혁명이 농업시대에서, 산업시대에서, 서비스시대를 거쳐서 이제는 어디로 가고 있느냐? 경험시대로 가고 있습니다. 서비스는 표준화돼 있습니다. 경험은 표준화돼 있지 않고 개인화돼 있습니다. 이 개인화 된 경험 경제를 뒷받침한다는 것은 뭐가 있어야 되느냐? 아까 말씀드린 것처럼 플랫폼과 인공지능이 있어야 되죠. 대표적으로 MINECRAFT가 하고 있는 것들이 이와 같이 개인화된 서비스들을 이렇게 뒷받침하고 있습니다. 그래서 일상이 게임이 돼 가지고 한 명, 한 명의 나의 일상이 게임이 되고 나의 콘텐츠를 모아서 내가 나의 삶에 대한 새로운 게임을 만들어가고 있죠. 1, 2차 산업혁명시대에 우리가 생각했던 콘텐츠가 이제는 4차 산업혁명에서는 현실과 가상이 융합하면서 새로운 산업으로 등장하고 있습니다. 그래서 제가 콘텐츠1.0과 2.0을 일단 이렇게 정의를 했습니다. 콘텐츠1.0이라 함은 우리 과거에 문화산업시대의 신문, 책에서 방송, 영화까지 올라갔습니다. 그 다음에 이제 지식정보화산업이 되면서 지금 콘텐츠산업에는 네이버도 들어가고 이런 콘텐츠업체들이, 정보업체들이 들어가 있죠. 그래서 이것까지는 뭐냐 하면 온라인세상을 만드는 디지털트랜스폼. 현실을 데이터로 바꾸는 것까지가 가 있습니다. 이제 4차 산업혁명에는 현실과 가상이 융합해요. 그러면 우리는 이걸 어떻게 봐야 될 것이냐. 이제는 경험이 공유되는 콘텐츠 경제시대로 들어간다는 겁니다. 이제는 개개인에게 가장 중요한 것이 시간입니다. 시간에서 경험을 해요. 경험에서 얻어진 콘텐츠가 공유되기 시작합니다. 그래서 이것이 이제는 세상을 바꾸는 가장 중요한 힘이 돼 있습니다. 2000년도의 한국이 MP3로 세계를 재패했어요. 그런데 우리 잡스 형님이 등장해 가지고 아이팟을 만들어가지고 우리 한국의 MP3산업을 때려잡았습니다. 그런데 이 잡스 형님이 만든 아이팟이 우리 MP3보다 좋은가? 아니에요. 그런데 왜 성공했는가? 아이튠스라는 서비스를 결합한 겁니다. 그래서 한국인, 하드웨어만 만드는 한국의 MP3산업을 휩쓸어버린 거죠. 똑같은 형태로 이 잡스는 이제 MP3를 만들던 아이팟을 아이폰으로 바꾸고 아이튠스를 앱스토어로 바꾸면서 무려 1조달러라는 전대미문한 어마어마한 기업가치의 기업을 만들어낸 거죠. 이 똑같은 일들이 어디서 벌어지고 있느냐? 전세계 모든 경제에서 새롭게 등장하는 거대기업들. 1조 기업가치가 넘는 스타트업들을 우리가 유니콘이라고 얘기하죠. 이 유니콘들의 대표적인 기업들. 샤오미나 nest나 GoPro. 얘들은 뭐하고 있는 친구들이냐 보면 제품을 만들어요. 그러면서 얘들은 또 콘텐츠를 만들고 있습니다. 제품과 정보를 둘 다 다루고 있어요. 그래서 제품과 정보를 둘 다 다뤄서 2개를 연결하는 역할을 합니다. 즉 이제는 제품과 서비스가 이렇게 연결되는 거죠. 뭐로 연결되느냐? 데이터로 연결됩니다. 데이터를 사물인터넷으로써 수집해서 빅데이터를 만들고 인공지능이 분석해서 서비스로 순환을 시킵니다. 그래서 아마존은 저 데이터를 수집해 가지고 저 아주머니가 기저귀를 주문할 확률이 지금 얼마까지 왔는가를 예측하고 그리고 캐터필러는 장비 고장이 어떻게 될 것인가를 예측하게 되는 거죠. 이러한 일들을 하게 되니까 우리는 이제 경험 경제라는 새로운 경제에 들어가고 있습니다. 4차 산업혁명은 물질을 떠나서 이제는 인간의 시간이 가장 중요한 자원이 되는 경험 경제가 됩니다. 시간이 중요한 경험 경제에서는 바로 물질과 정보가 결합하죠. 그래서 맨 처음에 오감이 감응하게 되고 그다음 오감이 전달되고 생활 자체가 쌍방향 콘텐츠로 바뀌게 됩니다. 그러면 이제 이러한 우리의 콘텐츠 산업 전략을 어떻게 가야 될 것이냐. 콘텐츠 산업 전략에서 중요한 것은 개별 콘텐츠가 아니라 개별 콘텐츠가 어떻게 미디어를 통해서 소통되고, 커뮤니케이션 되고 이것이 어떤 거대한 커뮤니티를 만들어내느냐. 여기에 달려 있는 거죠. 그래서 3C. 우리가 늘 얘기하는 콘텐츠와 커뮤니케이션과 커뮤니티의 3C가 잘 적용되는 것들을 보면 1, 2차 산업혁명에서는 이것이 텍스트의 오프라인 가지고 전달됐다면 3차 산업혁명에서는 다매체 음성과 이미지가 온라인으로 전달됐습니다. 그리고 이때는 1:N으로 갔죠. 그런데 이제는 뭐냐 하면 이 공유가 이제는 클라우드 소싱으로 N:M으로 가면서 O2O. 온라인과 오프라인이 융합되고 오감미디어로 확장되고 있습니다. 그래서 이러한 개인화된 서비스를 빅데이터와 인공지능으로 융합하는 바로 기술이 현실과 가상을 융합하고 이제는 욕망이 탈물질화하는 시대로 들어가고 있는 거죠. 그러면 이러한 세상에서 세상이 변화하는 순서를 한번 보면 바로 이런 순서로 변하고 있습니다. 오프라인세상에서 우리는 맨 처음에 현실을 데이터화해야 됩니다. 현실세계는 뭐가 있느냐? 시간, 공간, 인간세계밖에 없어요. 그래서 인간과 공간을 데이터화하는 기술이 여기에 있는 4개 기술입니다. 공간을 데이터화하는 기술이 사물인터넷과 위치기반기술 그리고 인간을 데이터화하는 기술이 생체인터넷과 SNS기술입니다. 우리가 도서관이 되든 국회가 되든 아니면 경주가 되든 간에 거기에 일어나는 모든 일들은 이 4가지 기술로써 공간과 인간의 데이터를 모두 만들어낼 수가 있죠. 이 만든 데이터를 클라우드의 빅데이터로 만들면 정보화가 이루어집니다. 여기에 2개 기술이 들어가죠. 클라우드와 빅데이터입니다. 이 6개의 기술이 소위 디지털트랜스포메이션 기술입니다. 이 기술들을 통해서 만들어진 정보를 인공지능이 분석해서 현실로 가지고 나오게 되면 우리는 스마트한 세상을 만들어내게 됩니다. 오늘 여기 전시되고 있는 기업들 거의 대부분이 이 범주에서 작동하고 있게 되죠. 그래서 우리가 몇 가지 기업의 사례를 놓고 보면 영화의 경우 인공지능으로 영화데이터를 수집해서 영화패턴을 빅데이터화 합니다. 그래서 어떤 사람이 나오고 그다음에 어떤 감독이 누구하고 어떤 스토리 가지고 했을 때 흥행될 것이냐, 이런 것들을 우리가 알게 되고 이런 VR영화로 글로벌 진출을 하고 AI로 창작인프라를 구축하고 있습니다. 애니메이션을 하는 데 있어서도 마찬가지로 애니메이션을 그냥 하는 것이 아니라 이제는 개별 애니메이션 데이터들이 모여서 흥행패턴으로 만들고 역시 마찬가지로 생산비 절감으로 들어가죠. 일상도 우리 일상을 데이터를 수집합니다. 그래서 생활패턴을 데이터화해서 필요한 서비스를 만들어내게 되죠. 이 오픈 플랫폼으로 우리는 방송도 마찬가지로 이제는 과거 지나간 방송들도 전부 다 조각조각 잘라가지고 다시 연결해 붙이게 되죠. 우리 경주에 있습니다. 경주에 온 사람들이 뭘 통해 가지고 경주를 보면 제일 좋을까? 이와 같이 소위 증강현실을 가지고 경주를 바라보게 되면 경주의 과거 경주의 건물들이 어떤 식으로 구성돼 있는가, 이런 것들을 볼 수 있게 되죠. 이래서 우리가 게임. 현재 소위 빅게임이라는 도시 자체를 하나의 게임으로 만들어낼 수가 있게 됩니다. 한마디로 얘기해서 이제 4차 산업혁명은 물질세계였던 현실세계 그리고 정보의 세계였던 가상세계, 2개의 세계가 융합합니다. 그래서 이 융합하는 과정에서 우리는 인공지능, 증강가상현실, 블록체인. 이런 것들이 등장해서 2개의 세계를 연결해 나가고 있죠. 그래서 1.0, 2.0, 3.0, 4.0을 거치면서 우리는 새로운 콘텐츠산업의 시대를 맞이하고 있습니다. 이 전체 산업들은 현실세계를 데이터로 바꾸는 6개의 디지털트랜스폼 기술 그다음에 이 데이터의 세계에서 인공지능이 만든 결과를 현실로 가지고 나오는 6개의 기술이 있습니다. 왼쪽에 있는 것이 디지털트랜스폼이라고 제가 부르는 기술, 오른쪽에 있는 기술이 아날로그트랜스폼이라고 부르는 기술들입니다. 하나하나 기술을 깊이 이해하실 필요는 없어요. 그러나 중요한 것은 뭐냐 그러면 지금까지 디지털트랜스폼. 여기 있는 기술들은 전세계에서 등장한 지 오래되는 기술이고 이미 승패가 결정난 기술들입니다. 오른쪽에 있는 것들은 이제 소위 새로운 콘텐츠4.0에서 부상하고 있는 기술들이죠. 이 기술들을 보면 제일 처음에는 우리는 인간이 왜 그 데이터를 가지고 뭔가 일을 해야 될 것이냐 하는 욕망을 디자인해야 됩니다. 욕망을 디자인하면 두 번째로 그 욕망 중에서 물리적 욕망은 3D프린터와 로봇으로. 정신적 욕망, 시각적 욕망은 증강가상현실로. 욕망을 거래하는 것은 블록체인으로 그리고 욕망을 지속하는 것은 게임화기술로. 욕망을 공유하는 것은 플랫폼으로. 이 기술들이 등장해서 이제 예를 들어서 BTS의 인공지능기술을 우리가 만들어서 개별 우리 전세계 2000만 아미 멤버들한테 우리 BTS가 너한테 빛의 역할을 해 주겠다. 벌써 여기 좋아하시는 여성분들이 계신데 그러면 당연히 쓰겠죠. 그리고 BTS와 함께 배우는 코딩. 우리가 이와 같이 앞으로 만들어갈 대한민국의 미래산업들을 여기서 만들어갈 수가 있죠. 한류스타의 홀로그램 아바타, VR 기반의 문화재 체험. 바로 이 경주가 해야 될 일입니다. 그래서 이러한 우리가 6개 기술을 가지고 만들어낼 수 있는 게임스마트, 음악스마트, E북스마트, 영화스마트, 애니메이션스마트, 채널스마트, 웹툰스마트, 홀로그램스마트, 서치. 이런 것들이 앞으로 도서관을 다루는 정보담당 전문가들의 미래 역할들이 될 겁니다. 우리는 3D프린팅을 통해 가지고 수많은 개인화된 맞춤서비스를 해 줄 수가 있게 됐습니다. VR 통해서 우리는 아무 곳이나 다 가볼 수가 있게 됐습니다. 우리는 페이스북을 통해서, VR 단말기를 통해서 주변 환경 배경으로 나눌 수도 있고, 내가 경주를 오늘 왔다가 갔는데, 내 친구가 다음 달에 와서 내가 남긴 메시지를 다보탑에 가서 찾아볼 수 있게 되고 이런 것들은 우리는 이제 시간, 공간, 인간을 다 쪼개서 경험을 공유할 수 있게 되는 거죠. 그리고 이 일련의 과정에서 우리는 진본성. 원본성에 대한 증명을 블록체인으로 해 나갈 수가 있게 됩니다. 그래서 이 전체가 하나의 게임처럼 재미있게 되는 거죠. 하나 예를 들면 작년에 문제가 됐던 시리아 난민. 난민 같은 경우에도 우리가 그냥 난민문제를 보다가, 난민에 대해서 난민을 돕고자 하는 사람들의 동정심을 유도하는 디자인을 하고, 욕망을 디자인하고, 그걸로 우리가 구호 같은 걸 3D프린터로 만들고, VR로 난민의 삶을 우리가 실감해 보고 게임화로 난민의 삶을 같이 살아보고 블록체인으로 영상이 조작되지 않았음을 입증해 주고, 플랫폼으로 난민을 지원하는 다양한 시스템들을 공유해 주고 이렇게 되면 우리는 첨단기술과 사회적 가치가 융합하는 콘텐츠4.0으로 갈 수 있죠. 여기 빼놓을 수 없는 게 인공지능입니다. 인공지능은 다음 세션에서 전체를 잘 다루시는 발표가 있기 때문에 제가 간단히 하면 이제는 우리가 인공지능이 고양이, 개를 구별하는 단계를 넘어섰죠. 창작의 단계로 들어서고 있습니다. 그래서 우리는 많은 창작의 단계에서 이제 이런 스케치를 하면 스케치를 바탕으로 수많은 종류의 백을 인공지능이 디자인해 주기 시작했죠. 웬만한 그림만 그리면 거기에 따라서 수많은 캐릭터들을 인공지능이 나머지 만들어줍니다. 그래서 붓을 들었고 작곡을 하고 춤을 추고 음악을 만들죠. 그래서 이 음악 synthesizer가 약 30만개, 1000개의 기억 악기데이터를 지금 만들어내고 있습니다. 마젠타는 이 다음 시간에 누가 하시더라고요. 그래서 지금 전 세계에서 가장 책 publishing 하는 데 성공적인 회사가 여기 있는 인키트라는 회사입니다. 24권을 출판했는데 22권이 50위 이내에 들어갔더라. 그러면 이 편집자가 누구냐. 편집자가 없어요. 독자하고 인공지능이 바로 편집자가 된 겁니다. 인공지능은 이제 어디까지 갔느냐? 시와 소설을 쓰고 있습니다. 그러면 이러한 미래사회에서 제일 중요한 문제는 뭘까요. 아론이 붓을 들고 쿨리타가 작곡을 하면 그렇다면 그 저작권은 누가 갖는 것이냐. 이런 많은 우리 법적인 문제들을 이제 아마 다루게 될 겁니다. 그래서 이 다음 세션에서 다루는 프로그램이 있더라고요. 바로 이것이 뭐냐 하면 기술융합은 뭘 만드느냐 그러면 갈등을 만듭니다. 그래서 기술혁명은 반드시 제도혁명하고 연결돼야 되죠. 그래서 제가 마지막으로 제도 문제를 얘기하고 마무리하겠습니다. 현실과 가상이 연결되는 건 뭐로 연결되느냐? 정보로, 즉 데이터로 연결됩니다. 이 데이터는 공공데이터가 있고 개인데이터가 있죠. 이 데이터가 클라우드 고속도로에서 연결됩니다. 우리는 이 클라우드 고속도로를 잘 뚫어야 되고 개인정보와 공공정보의 안전한 활용을 해야 됩니다. 그래서 클라우드 고속도로와 정보의 안전한 활용, 이게 우리의 목표인 거죠. 지금 대한민국은 안전하지도 않고 활용하지도 않고 클라우드 고속도로도 막혀 있습니다. 데이터 쇄국주의는 우리 결국 19세기 치욕의 역사를 되풀이할 수 있고 개방주의로 21세기 역사를 만들어가야 됩니다. 그러면 개인정보, 공공정보를 보호하면서 안전하게 활용하기 위한 일련의 일을 해야 되는데 지금 우리 4차 산업혁명의 가장 바로 중요한 바로미터가 인터넷 트래픽 중에서 클라우드에서 나오는 트래픽이 얼마나 되느냐 하는 이 비중이 전세계 OECD국가의 비중이 이미 2년 전에 90%를 넘어섰습니다. 한국은 지금도 10%대예요. 가장 낮은 수준입니다. 우리는 아직도 온프레미스의 서버시대에 있는 거지 클라우드 시대로 가지 못하고 있습니다. 왜 못 가고 있을까? 바로 수많은 규제 때문입니다. 이 IT강국 코리아가 어떻게 되느냐? IT강국 코리아가 지금 보면 전체적으로 기술은 24위, 제도는 58위. 기술이 아닌 제도의 문제가 돼 있죠. 그래서 이 데이터를 수집하고 저장하고 지능화하고 스마트하는 이 4단계에 걸쳐가지고 곳곳에 걸쳐서 우리는 개인정보 규제, 공공정보 규제, 클라우드 규제, 빅데이터 규제, 인공지능 활용규제, 인력양성 문제, 오프라인 진입규제, 신산업 네거티브 규제 등이 다 걸려 있습니다. 이런 문제들을 우리가 어떻게 해결할 것이냐. 이 문제가 우리 사실은 기술융합보다 더 중요한 문제들입니다. 예를 들어서 우리 전 세계에서 지금 공유차량이 안 되는, 정말 진짜 안 되는 유일한 나라가 대한민국입니다. 원격의료가 진짜 안 되는 유일한 나라가 대한민국이에요. 이런 문제들이 왜 벌어지고 있느냐 하면 신사업에 대해서 우리는 진입규제가 어마어마합니다. 이러한 문제들을 우리가 해결하기 위해서 저희들이 데이터 쇄국주의 타파운동을 벌였고 그 운동의 결과로 작년 8월 30일자로 대통령께서 직접 선언을 하신 겁니다. 1조원을 투자해서 데이터 고속도로를 구축하겠다. 그래서 저희들이 1조원은 투자 안 해도 되는데 데이터 고속도로는 구축하자. 이 내용은 이런 얘기입니다. 3가지인데 개인정보가 지금 우리가 연구활동을 위해서 많은 연구데이터들을 활용할 수 있어야 되는데 연구활동에 개인정보가 들어 있기 때문에 연구데이터로 쓰지 못합니다. 그래서 이것을 연구데이터의 경우는 가명정보만 두면 쓸 수 있게. 이름을 홍길동으로 바꾸면 쓸 수 있게 하자. 우선 이게 첫 번째 가명정보화입니다. 가명정보화는 제한적 활용. 연구 같은 경우는 활용할 수 있게 하자. 그리고 익명정보. 누군가 알 수 없는, 이렇게 알 수 없게 만든 비식별화된 익명정보는 개인정보가 아닌 걸로 취급한다. 그래서 사전에 재식별을 규제하고 익명정보는 활용하자. 그 다음에 실명정보. 내 이름이 진짜 들어 있는 정보는 내가 통제권을 가지자. 내가 병원에 있는 내 정보는 내 통제권이니까 내가 그걸 옮길 수 있는 권리를 가져야 된다. 이러한 개인정보의 안전한 활용과 공공데이터를 개방해서 공공데이터를 원칙적으로 개방한다. 대한민국의 지금 이 시점의 공공데이터는 실제로 개방이 안 돼 있습니다. 실제로 개방돼 있는 수준은 45만건 중에서 지금 우리 DATA.GO.KR에 올라가 있는 게 3만건이 안 됩니다. 연구의 94% 개방돼 있는 것에 비하면 엄청나게 우리는 개방이 안 돼 있습니다. 그 뿐만 아니라 우리는 지금 중앙정부데이터는 실제로 개방 안 돼 있고, 지방정부데이터도 3등급만 개방돼 있는데 3등급도 CC인증을 받아야지 개방할 수 있습니다. 이 상태 가지고는 우리가 절대로 4차 산업혁명을 갈 수가 없죠. 그리고 데이터 고속도로로 가는 클라우드를 명시적으로 예를 들어서 금융에 못 쓰게 하는 유일한 나라가 지금 대한민국입니다. 이러한 우리 문제들을 개선하기 위해서 획기적인 선언을 했는데 참 아쉬운 것은 대통령께서 선언하셨는데도 불구하고 아직까지 이게 국회에 법이 제출되고 7개월째 상임위조차 논의가 안 되고 있습니다. 마지막 슬라이드가 되겠습니다. 그래서 저희들이 주장하는 4차 산업혁명으로 가는 데이터 융합에 중요한 것은 이 규제 문제고, 규제 문제를 풀기 위해서 네거티브 방식으로 데이터 개방이 돼야 되겠다. 그래서 원칙적 개방이 되겠다. 지금은 개방하려는 걸 골라내는데 그게 아니라 안 할 것을 이유를 들어야 된다. 그리고 익명화의 기준은 기본 기준만 지키면 활용할 수 있게 하되 익명화를 어렵게 하는 게 아니라 재식별화하는 것을 강력하게 처벌한다. 세 번째, 국정원이 2, 3등급의 지방정부와 공공기관에는 관여하지 말라. 여기는 국가보안데이터가 없습니다. 그다음에 데이터의 안전한 활용은, 결합은 활용하되 재식별화는 규제하라. 마지막으로 융합기업에 이러한 수많은 타다를 비롯해서 공유차량 기업, 공유숙박 기업. 이런 기업들이 등장할 때 중요한 것은 진입장벽. 기존 사업자를 위해서 새로운 혁신의 싹을 자르는 일은 하지 말아야 되겠다 하는 얘기를 드리면서 제 얘기는 마치도록 하겠습니다. 감사합니다.



데이터융합과 더 큰 도서관 세상

발표: 허용범 국회도서관장
동영상에 대한 자막정보
반갑습니다. 이민화 교수님 강연이 40분인데 저도 한 15분 들은 것 같이 빨리 지나갔습니다. 우리 오늘 주제가 지금 가려졌습니다마는 데이터 융합과 더 큰 도서관 세상입니다. 그러면 말 그대로 어떻게 해서 데이터를 융합하고 더 큰 도서관 세상을 만들어갈 것인가, 이것이 우리가 오늘 모인 모든 분들의 사실 관심사죠. 저는 이렇게 생각합니다. 결론부터 말씀드리면 우리 도서관에 있는 모든 정보들이 디지털 데이터화돼야 된다. 그리고 이것을 전면적으로 개방해야 된다. 그리고 도서관간의 협력을 통해서 공유해야 된다. 저는 이렇게 생각합니다. 그러니까 디지털화, 데이터화죠. 데이터화, 개방, 협력을 통한 공유. 저는 이게 답이라고 생각합니다. 그래서 그걸 어떻게 할 것이냐. 저는 다른 도서관 얘기를 하기 전에 저희 국회도서관 얘기를 하려고 합니다. 국회도서관이 꼭 잘나서가 아니라 제가 도서관장이고 우리 한국학술정보협의회를 이끌고 있는 도서관이기 때문에 국회도서관 얘기를 하려고 합니다. 2019년 올해 우리 국회도서관의 3대 목표가 있습니다. 하나는 데이터 기반의 획기적 확충이고 두 번째가 도서관 자산의 개방과 공유, 세 번째가 협력 네트워크 확대입니다. 이 중에서 데이터 기반의 획기적 확충에 대해서 먼저 말씀드리겠습니다. 왜 이게 중요하냐 하면 데이터 기반이 확충되지 않으면 공유고 융합이고 얘기할 건덕지가 없습니다. 데이터가 없는데 뭘 공유하고 융합하겠습니까? 그래서 데이터 기반의 확충 얘기하겠습니다. 도서관 장서의 디지털화는 여기 표현대로 제가 써놓은 대로 읽으면 데이터가 지능정보기술과 결합해서, 지능정보기술은 결국 AI죠. 지능정보기술과 결합하여 4차 산업혁명시대에 걸맞는 형태의 서비스가 가능하고 데이터 융합의 선결과제이기 때문에 결국은 데이터가 중요하다고 그렇게 말씀드리겠습니다. 이것은 국회도서관 2018-2019년도 데이터화 예산입니다. 데이터 예산인데 2018년까지, 작년까지 저희들은 한 해에 한 25억 정도가 배정돼 있습니다. 대단히 작은 액수입니다. 그래서 제가 2018년도 한 해 동안 저희 국회도서관 직원들하고 기재부 예산실을 수도 없이 쫓아다녔습니다. 이래서 무슨 4차 산업혁명이 되냐. 25억 가지고 뭘 하란 말이냐, 명색의 국가도서관이. 그래서 정말 열심히 호소를 했습니다. 다른 예산은 다 깎였습니다. 국가도서관 지금 말도 아닙니다, 다른 국가기관들이. 그런데 디지털 데이터 구축예산은 320%를 올려서 76억이 2019년에 저희들이 받았습니다. 이것은 아마 디지털 데이터 구축이 중요하다는 인식 정도는 하고 있는 것 아닌가, 이렇게 생각합니다. 그래서 올해 2019년 같은 경우는 앞서 말씀드린 25억 정도 가지고 한 해에 저희들이 종이 자료를 800만면의 원문DB를 더 구축할 수가 있습니다. 그런데 2019년 같은 경우는 이제 76억이 돼 있기 때문에 2129만면을 더 구축할 수가 있습니다. 지금 현재 진도율은 올해가 5월이니까 한 50% 정도까지 올라와 있어야죠. 이렇게 되면 저희들이 우리 한국학술정보협의회를 기준으로 할 경우에 저희들이 지금 원문DB서비스하는 게 2억 4,000만면입니다. 이 경우에 올해 2,000만면이 더 추가가 돼서 올해 말이 되면 2억 7000만면으로 올라가겠습니다. 상당히 늘어나는 거죠. 그렇지만 저희들 생각에는 76억은 택도 없다. 이걸로는 안 된다라는 게 저의 현재 일관된 주장입니다. 뭐냐 하면 1,000억은 달라 이거예요, 1,000억. 그것도 한 해에 다 달라는 게 아니라 200억씩 끊어서 5년 동안 1,000억을 달라는 게 제 주장입니다. 왜 그러냐, 저희 국회도서관의 경우는 입법부 도서관이기 때문에 모든 입법자료가 저희 국회도서관으로 오게 돼 있습니다. 입법자료 그다음에 입법이라는 것은 거꾸로 뒤집어놓으면 정책입니다. 공공정책자료 그리고 여러분이 잘 아시는 대로 학위논문을 비롯한 학술자료, 이것을 저희들이 망라적으로 수집합니다. 단행본 책은 디지털하기가 어렵습니다. 아시지 않습니까? 이걸 디지털 해버리면 전자책이 아닌 이상 출판사가 다 망하지 않습니까? 그래서 개방된 자료나 마찬가지인 입법자료, 학술자료, 정책자료, 이것을 전면적으로 디지털화하자. 지금 현재 저희 국회도서관에 175만 책이 쌓여 있습니다. 175만 책이 쌓여 있는데 이것을 한 해에 76억 그러니까 2019년 올해 예산으로 계속 이렇게 쭉 갈 경우에 저희들이 추정하기를 한 38%를 디지털화할 수 있습니다. 그러면 62%는 디지털화 안 되는 거죠. 그런데 그게 문제가 아니라 해마다 어마어마한 양들이 새로 들어옵니다. 그래서 저희들은 무한정 달라 할 수는 없지만 청년실업 해소한다. 그다음에 노인일자리 만든다. 거기에 막 몇 조원씩 펑펑 때려놓고 아까 이민화 교수님도 말씀하셨지만 4차 산업혁명 특별위원회를 무슨 대통령 직속으로 만들고 국회에다가 4차 산업혁명 특별 무슨 뭐를 만들고 말로만 하지 말고 1,000억만 주면 우리가 가진 국회도서관 175만 책을 다 디지털화해 가지고 우리 국회만 쓰는 게 아니라 대한민국의 4차 산업혁명 기반의 데이터 자산으로 내놓겠다. 그러면 대한민국에 있는 모든 도서관이 다 쓰고 모든 연구기관이 다 쓰고 국가기관도 쓰고 민간회사도 이것을 장사속으로 팔아먹지만 않으면 AI 개발하고 하는 데 쓰도록 우리가 내놓겠다라는 게 저희들 주장입니다. 제가 예산실도 쫓아가고 기재부도 쫓아가고 국회의장님한테 귀에 못이 박히도록 얘기를 했는데 올해 2020년 얘기가 될지 모르지만 어쨌든 그렇게 주장하고 있습니다. 그래서 국민 모두를 위한 디지털. 대한민국 4차 산업혁명 성공을 위한 디지털 국가자산을 구축하자. 데이터 없이 무슨 인공지능을 만들고, 아까 교수님도 말했지만 데이터 없이 뭘 합니까? 그래서 저희들 주장하는 것입니다. 올해 될지, 안 될지 모르지만 데이터가 이렇게 구축이 됐다 치자 이거예요. 되고 있고, 실제로. 또 데이터라는 것은 아까 교수님 말씀하셨는데 개인정보도 데이터고 의료정보도 데이터지만, 저희 국회도서관의 입장에서 볼 때는 아까 말씀드린 입법자료, 정책자료 그다음에 학술자료를 저희들은 디지털화해야 될 데이터로 생각합니다. 저희들은 그러면 이 데이터 구축하면 뭐에 쓰느냐. 어떻게 쓸 것인가에 대해서 몇 가지를 말씀드리겠습니다. 저희들은 지금 올해 2월부터 여기 보시는 Argos시스템을 개방했습니다. 저희 국회도서관 홈페이지에 보면 볼 수 있습니다. 이것은 좀 어려운 말로 지능형 의회정보 융합분석 시스템, 이렇게 한국말로는 부를 수 있고 Argos라는 것은 그리스 로마신화에 나오는 100개의 눈을 가진 인물이라고 합니다. 신화적 인물인데 그러니까 잠을 자지 않고 세상의 모든 것을 아는 그런 신화에 등장하는 인물이라고 합니다. 이것은 뭐냐 하면 한마디로 말하면 데이터, 그러니까 디지털 데이터에 기반해서 의사결정을 하는 겁니다. 그러니까 입법 지원의 경우에 활용하는 시스템인데요. 더 구체적으로 이 뒷장을 보면 좀더 실감이 나실텐데 예컨대 미세먼지특별법에 관한 추이 그래프인데요. 여기 작은 글자로 보이지만 세금, 일자리, 버닝썬, 응급의료, 이런 여러 가지 사회이슈들이 있습니다. 미세먼지 같은 경우에 과거에는 이런 것들을 우리가 분석할 때 외국의 입법예나 그다음에 우리나라의 입법, 정책 그다음에 이런 관련된 것을 주로 문서로, 글자로 봤습니다. 그러나 지금도 그게 중요하지만 이러한 추이 그다음에 각 변곡점마다 어떻게 이 문제가 이슈화됐는지를 저희들이 빅데이터 분석을 통해서 추적을 합니다. 그것이 가능한 것이 Argos시스템인데 왜 가능하냐 하면 우리 트위터, 블로그 또 뭡니까? 뉴스 그다음에 이런 소셜미디어 수억만건을 저희들이 빅데이터 분석으로 분석을 하는 시스템을 개발한 게 바로 이 Argos입니다, Argos. 그래서 이런 Argos시스템을 이용해 가지고 어떤 특정이슈에 대해서 저희 도서관이 가진 축적된 도서관의 정보. 예를 들면 해외의 입법예라든지 관련의안이라든지, 이런 방대한 입법정책정보와 연결을 시키는 겁니다. 그런 시스템이 Argos입니다. 과거에는 불가능했던 거죠, 이게 입체적이고 시계열적인 흐름으로 빅데이터를 분석해 가는 시스템은 이 모든 것이 데이터에 기반하기 때문에 가능하다는 사례를 말씀드립니다. 예컨대 이쪽에 그림 보는 것이 우리가 다 지난번에 본 김용균법 때 사태인데요. 이 김용균법이 상징적으로 보여주는 것은 우리나라 입법, 제도도 마찬가지지만 사후약방문이라는 겁니다. 항상 무슨 1인을 하면 뒷북을 치고 난리를 칩니다. 그러지 말고 우리가 뭐 꼭 국회에만 아니라 어느 사회나 마찬가지지만 좀 더 앞장서고 선제적으로 뭘 해 보자. 이슈를 선제적으로 좀 알아보자 이런 겁니다. 그래서 우리 Argos시스템이 지금도 계속 진보해 나가고 있습니다마는 중요한 것은 그러한 사회적 이슈들을 추적하고 예측해 나가는 시스템입니다. 그런 것들이 이제는 국회에만 해당되는 게 아니라 소위 말하는 융합의 시대 아닙니까? 융합의 시대에 다양한 이해관계가 과거와 비교할 수 없을 정도로 거미줄처럼 얽혀 있기 때문에 이런 다양한 정보원들이 입체적으로 활용되고 거시적으로 활용되고 해야 된다. 역동적으로 분석돼야 된다. 이런 얘기를 사례로 드리는 것입니다. 그리고 데이터 디지털 기반은 그만큼 중요하다는 것을 여러 가지 사례를 들어서 말씀드릴 수 있지만 그 정도에 그치고요. 그 다음에 두 번째 저희 국회도서관의 올해 목표인 도서관 자산의 개방과 공유에 대해서 말씀드리겠습니다. 특히 개방 부분은 개방하지 않으면 공유라는 것은 불가능하지 않습니까? 공유는 개방을 전제로 하기 때문에. 이건 우리가 오픈 액세스니 이런 것들이 다 같은 개념이지만 말로만 오픈 액세스지 실천은 안 하지 않습니까? 저희 국회도서관의 개방은 3대 개방입니다. 첫째, 도서관 디지털 데이터 자산의 전면개방 두 번째, 디지털 데이터를 가지고 IT기술을 활용해서 하는 서비스의 개방. 세 번째, 저희들 국회도서관이 실체로서, 물리적 실체로서의 공간의 개방. 이 3가지인데 다음은 개방에 대해서 말씀드리겠습니다. 먼저 데이터와 서비스의 개방입니다. 저희 공공데이터의 적용 및 이용 활성화에 관한 법률 제3조 1항에는 굉장히 그럴 듯한 말이 쓰여 있습니다. 저희 국회도서관은 한마디로 거듭 말씀드리지만 국회도서관이 구축하고 소장한 모든 자료는 국민 예산으로, 국가 예산으로 구축된 것이다. 우리 개인의 것이 아니다. 그렇기 때문에 국가기밀이 아닌 이상은 무조건 개방돼야 된다. 대원칙입니다. 무조건 개방되고 누구나 활용할 수 있어야 된다, 이런 얘기입니다. 그래서 우리 국가도서관인 국회도서관의 데이터를 가지고 다른 기관들이 도서관이든 연구기관들이든 이 데이터를 활용한 다양한 서비스를 할 수 있도록 하는 것이 해야 된다. 그것이 우리 국회도서관의 책무고 의무다, 저는 이렇게 합니다. 여기 읽어보시면 알지만, 공공기관은 공공데이터를 편리하게 이용할 수 있도록 노력하여야 하며 이용권을 보편적 확대를 위하여 필요한 조치를 취하여야 한다. 법은 이렇게 되어 있는데 아까 이민화 교수님 말씀 들어보면 실제로는 그렇지 않지 않습니까? 그러면 예를 하나 들어보겠습니다. 아마 이 자리에 계신 분들은 대부분 알고 계시리라 보는데 현재 우리 국회도서관이 서비스하고 있는 국가학술정보 클라우드서비스입니다. 작년만 해도 이게 10개 기관이었는데 그 사이에 다시 2개 기관이 늘어나서 현재 12개 기관이 저희와 같이 하고 있습니다. 옆에 보시면 알지만 국회도서관, KISTI. 여기 KISTI 본부장님 내일 주제발표하지 않습니까? 그 다음에 KISTI 그 다음에 KERIS 다 압니다. 연세대학교 등등등등. 그래서 이렇게 12개 기관이 지금 작년에 650만건인데 720만건으로 늘어났습니다. 720만건을 클라우드상에서 같이 쉐어하고 있습니다. 물론 우리만 쓰는 게 아니라 전 국민 누구나 쓸 수 있도록 이렇게 개방되고 있는데 올해 우리 디지털 데이터 구축 예산이 현재 76억인데, 이게 이 법으로 많이 늘어나면 이 정보도 아마 굉장히 1000만건 정도로 올라갈 수 있지 않을까, 이렇게 기대를 하고 있습니다. 그리고 또 우리 여기 계신 회원기관 여러분들이 이러한 데이터를 이용해 가지고 빅데이터 분석을 할 수 있도록 빅데이터 플랫폼도 저희들이 지금 현재 제공하고 있다는 것을 이용하시는 분들은 알고 계십니다. 역시 이것도 저희 데이터에 기반하여 저희들이 한 건데 바로 작년에 총회 이 자리에서 제가 국가학술정보 신경망을 만들자 라고 제가 주제발표를 했었습니다. 이것은 뭐냐 하면 블록체인기술에 기반해서 우리 도서관들이 이제는 클라우드를 이용하지 말고 블록체인기술이라는 것을 이용해서 어떤 중앙서버에다가 자기 것들을 꺼내놓고 그것을 공동으로 활용하는 시스템도 좋지만 이제는 블록체인이라는 아주 혁명적이고 획기적인 기술이 나왔기 때문에 이것을 우리 도서관 서비스에도 적용을 하여 각자가 자기 데이터를 갖고 있으면서 중앙서버, 중앙의 매개체 없이 각자가 남의 것을 똑같이 이용하는 이런. 그러니까 우리 두뇌에 무슨 중앙서버가 없지 않습니까? 두뇌처럼 그렇게 만들자 해서 제가 제의를 했고, 우리 외부용역을 통해서 개념검증을 했고, 현재 어디까지 단계가 왔냐 하면 시스템 분석, 설계 단계까지 왔습니다. 블록체인기술을 활용하면 우리 지금 여기 계신, 이론적으로는 여기 계신 모든 도서관들이 우리 두뇌의 뉴런이 얽혀지듯이 신경망처럼 얽혀질 수 있습니다. 그래서 제가 바라기로는 올해 안에 가능하면 대표적인 의향을 가진 몇몇 도서관들이 우선 시범적으로 이 블록체인기술을 적용해서 한번 해 보면 어떨까. 그래서 그게 정말 잘 돌아가면 계속 확대해 나가면 내년 이 총회 정도 되면 상당히 진전돼 있지 않을까, 이렇게 합니다. 저희들은 사실 국가도서관이기는 하지만 예산의 한계가 크기 때문에 내년에 정부기관 사업제한 참여 등을 통해서 예산확보를 주장. 아까 우리 이민화 교수님 마이데이터도 얘기했는데 저희 이번에 마이데이터사업에도 당첨이 돼서 이제 사업을 시작하고 있습니다. 굉장히 중요한 사업인데 그게 어디, 과기정통부에서 했나요? 거기도 우리가 이번에 참여하게 됐습니다. 컨소시엄 형태로. 그리고 또 저희 개방과 관련한 하나의 사례를 들면 지금 말씀드린 것 다 작년 이후에, 작년 총회 이후의 얘기입니다. 올해 1월 1일부로 제가 우리 국회도서관이 가진 외국법률 데이터베이스를 전면적으로 국민에게 공개를 해버렸습니다. 지금까지 우리나라에 외국법률 번역DB는 없습니다. 저희들이 갖고 있는 게 거의 유일하고요. 제일 큽니다. 이것은 법률번역이라는 것은 아시지만 일반 문학이라든지 소설 번역하고는 전혀 차원이 다른 얘기입니다. 그래서 지금까지 법제처라든지 사법연구원, 이런 데서 우리 것을 썼는데 이것 왜 우리만 쓰냐, 이렇게 해 가지고 제가 공개를 해서 현재 1만건이 넘습니다. 104개국 1만건이 넘고 현재 굉장히 잘 쓰고 있고 예를 들어서 작년에 한 해 동안 저희 법률DB를 이용한, 그러니까 오픈을 안 했을 때 이용한 건수가 1만 3,048건인데요. 올해 3월까지 벌써 이 숫자를 넘어섰습니다. 그 정도로 많이 이용하고 앞으로 이 데이터는 인공지능 개발에 상당히 활용되지 않을까 생각합니다. 혹시 아시는 분 있지만 지금 ETRI(한국전자통신연구원)에서, 한국전자통신연구원에서 연구하는 엑소 브레인이라고 우리 국책사업으로 세계 최고 수준의 인공지능기술을 개발하고 있습니다. 거기에 법률 엑소 브레인, 법률분야의 인공지능에 학습데이터를 저희 국회도서관에서 바로 공급하고 있는 것도, 국회도서관 자료의 신뢰성, 품질의 양호성 때문에 그런 것 아닌가 생각합니다. 이것도 마찬가지라고 생각합니다. 그러면 세 번째는 이제 데이터의 개방 그다음에 도서관 IT기술에 기반한 서비스의 개방에서 공간의 개방도 저희들은 같은 개방이라고 생각합니다. 저희 국회도서관 같은 경우에 현재 와보신 분들은 아시는데 지금 대대적인 공사를 하고 있습니다. 그래서 5월 말에 끝나는데, 6월 초쯤에 끝나는데 도서관을 그냥 확 열어버리려고 제가 하고 있습니다. 예컨대 작년에 저희 5월에 여기서, 여기 아니죠. 목포죠. 목포에서 총회를 하고 난 다음에 제가 서울에 돌아가서 저희 국회도서관 역사상, 66년 역사상 유례없는 조치를 제가 해버렸습니다. 그게 뭐냐 하면 개인도서를 갖고 열람실에 들어올 수 있게 제가 풀어버렸습니다. 이게 여러 가지 문제가 많다라는 것을 알고 있고 지금 우리 국립중앙도서관도 여러 가지 문제 때문에 하지 못하고 있는데 제가 해버렸습니다. 뭐가 문제냐. 노트북 가지고 들어오지 않냐. 노트북 가지고 들어오는 거나 자기 책 갖고 들어오는 게 뭐가 차이가 있냐. 두 번째, 아니 그 고답적인 일본 국립국의 도서관도 가보니까 자기 책 갖고 마음대로 들어가던데 왜 이 대한민국이 못 들어가냐. 그러면 책이 섞이고 만약에 분실되면 그것은 우리 책임이지 왜 그걸 열람자들한테 그 책임을 떠넘기냐 이렇게 해서 확 풀었더니 지금 1년이 지났는데 문제가 없습니다. 대신 좋은 점이 뭐냐, 우리 국회도서관 하루에 실제로 오신 분. 디지털로 이용하는 분 말고 실제로 오시는 분이 하루에 작년에 한 3,000에서 3,200명 이렇게 됐는데 지금 평균적으로 3,400명을 유지합니다. 많을 때는 4,000명도 넘습니다. 우리 국회도서관 와보시면 아시지만 자리가 없습니다. 매일 아침 9시에 열람실 열어서 밤 10시까지 하는데 안 가세요, 집에를. 토요일도 하고 일요일도 합니다. 그 정도로 사람이 많이 일어났고 그것도 개인도서를 갖고 들어오는 것도 저는 우리 도서관의 개방이라고 생각합니다. 1층 중앙홀, 우리 국회도서관 31년 된 건물인데 1층 중앙홀은 완전히 개방합니다. 이게 사진인데 드디어 우리 국회도서관, 국가도서관이고 근엄하고 옛날에는 대학원생 이상만 들어왔었는데 드디어 샌드위치카페가 들어옵니다. 왜 안 되냐? 왜 안 되냐? 사무처하고 거의 싸우다시피 해 가지고 지금 공사를 하고 있습니다. 샌드위치카페를, 6월에 오픈합니다. 한번 와보세요. 그래서 커피를 들고 1층에 들어와서, 쇼파에 앉아 커피 마시면서, 책도 보고, 잠도 자고, 얘기도 하고 도서관이 그런 데지 도서관이 와가지고 맨 공부만 해야 되냐. 그렇지 않습니까? 문화도 있고 휴식도 있고 이런 게 도서관이 아니냐. 그래서 이것은 이 사진은 지금 공사 중이고 그냥 이렇다는 뜻이고요. 북카페가 들어오는데 누구나 편안하게 찾아와서 커피 한잔을 마시는 여유를 즐기는 어떤 지식과 문화의 놀이터로 만들자. ‘전당’ 그러면 너무 근엄하고요. ‘놀이터’로 만들자, 이렇게 지금 공사를 하고 있습니다. 이렇게 바뀝니다. 우리 국회도서관 1층이. 이것도 지금 우리 국회도서관 사진은 아닙니다. 왜냐 하면 지금 공사 중이기 때문에 이런 식으로 바뀐다는 겁니다. 우리 국회도서관 같은 경우에는 국회 경내에 있기 때문에 국가 1급보안시설입니다. 그래서 1급 보안시설이기 때문에 어쩔 수 없이 경비규정에 따라서 들어오려면 검사도 하고 열람증도 끊고 해야 되는데요. 제가 그랬습니다. 1급 보안시설은 국회의사당에서 하시고 우리 국회도서관은 국회 안에 있다는 죄로 왜 1급 보안시설이냐. 열람실 같은 데는 조용하고 또 서고 같은 데는 연구보존서적이기 때문에 안전하게 지키더라도, 1층 중앙홀을 비롯한 상당수 공간은 사람들이 자유롭게 들어와야 되지 않느냐, 이렇게 해서 오픈을 하려고 그럽니다. 1층 중앙홀에다가 이런 책상, 오픈서가, 쇼파 이런 것을 들여놓고, 와서 다리 꼬고 앉아 놀도록 이렇게 지금 완전히 개방한다. 이건 저희가 말하는 데이터의 개방, IT기술에 기반한 서비스의 개방에 이은 공간의 개방 개념입니다. 그래서 이렇게 지금 공사를 하고 있는데 예컨대 지금 국회도서관을 들어올 때 저도 그렇습니다마는 다른 도서관도 마찬가지 아닙니까? 회원을 가입해야 이분이 열람증을 받아야 이분이 책을 빌려가면 누가 빌려가는지 알고 하기 때문에 그건 어쩔 수 없는 절차인데 제가 없애버렸습니다. 어떻게 되냐. 지금 그러면 열람을 하고 대출을 하는 사람과 1층 중앙홀을 가도 나는 열람하고 대출하지 않는다. 그냥 커피 한잔 마시러 왔다. 놀러 왔다 하는 사람은 그냥 출입자 개념으로 해서 출입자와 열람자를 구별하려 그럽니다, 지금 시스템을. 그래서 열람을 하고 책을 대출할 경우에는 어쩔 수 없이 그것은 어느 도서관이나 마찬가지지만 열람증을 정식으로 끊어야 되는데 그것도 굉장히 간소화됐습니다. 무지하게 간소화됐습니다. 1, 2분이면 다 끝납니다. 단순한 출입자는 그냥 네이버 ID로 QR코드 하나 받아가지고 핸드폰에 넣어가지고 찍고 들어오게 이렇게 하려고 지금 시스템 거의 다 됐습니다. 또 하나는 저도 방송통신대학교 학생입니다. 제가 방송통신대학교 학생인데 공부를 하고 싶은 게 있어서 다니는데 방송통신대 학생이라면 학생증 저도 있습니다, 주머니에. 지갑에. 학생증만 대고 들어올 수 있게 제가 방송통신대 총장님하고 이미 협의를 끝났고 아까 우리 방송통신대 도서관에서도 우리 관계자분들이 와 있는데 지금 추진 중입니다, 양쪽에서. 그런데 왜 그러냐 하면 방송통신대 학생은 일반 시민이지 않습니까? 그 학교에 가지 않고. 그래서 방송통신대 학생증만 대고 들어오면 들어올 수 있게 이렇게 코드쉐어링하고 있고, 제가 지난주에 연세대에 갔는데 연세대를 비롯한 먼 대학이 아니라 그 신촌쪽에 있는 연세대, 이화여대, 서강대 이런 대학을 위주로 해서 연세대도 제가 도서관장님한테 연세대 학생은 학생증 대고 들어올 수 있게 하자 그랬더니 합시다 이렇게 해 가지고 하는데, 어쨌든 대학생 학생증이나 네이버 ID로 이렇게 쉽게 들어올 수 있게 하는 겁니다. 이 어플리케이션 써본 분 계신지 모르겠는데 이것은 그냥 우리 애플스토어, 아이폰 같으면 애플스토어 같은 데 들어가서 그냥 다운받는 일반 앱입니다. 이것과 똑같이 생겼습니다. 실제로 저기에다 검색어를 넣으면 우리 도서관이 가진 650만건의 서지정보와 1,200만 책의 정보가 반응속도 열람 나오는데 0.1초밖에 안 걸립니다, 0.1초. 그래서 결국은 우리가 더 많은 데이터를 개방을 하고 하게 되면 내 손 안에 대한민국 최고의 디지털 도서관을 갖고 다닌다, 이렇게 될 수 있도록 하자 하는 게 하고, 실제로 이 어플은 써보면 아시지만 굉장히 편리하게 돼 있습니다. 이런 것도 저희 국회도서관을 개방하는 게 되겠습니다. 지금 보시는 이 그림은 저희가 지난주 5월 17일날 공식 착공식을 가진 국회도서관 최초의 부산분관입니다. 부산분관 조감도인데 이것은 저희들 6년 전부터 국회도서관 자료보존관의 성격으로 지으려다가 지금 이게 3층 건물인데 부산에 있습니다. 명지신도시에 있는데 을숙도 옆에 있습니다. 2층, 3층은 자료보존관으로 하되 1층은 지역민들과 여러 가지를 위한 첨단도서관으로 활용하자 해서 하는데 이 도서관도 지금 공사를 시작했는데 역시 전면적인 개방과 공유의 원칙이 적용되고요. 거기다가 플러스 최신 디지털기술을 활용해서 정말 우리가 미래도서관이란 무엇인가라고 말할 때 대한민국의 모델이 될 수 있도록, 첨단도서관이 무엇인가를 말할 때 모델이 될 수 있도록 만들려고 저희들이 지금 하고 있습니다. 이 도서관도 적용되는 개념은 똑같습니다. 개방, 공유. 지금 제가 도서관 공간의 변화에 대해서 말씀드리는데 사실 도서관에 대해서 많은 분들이 여기 계신 분들이 고민이 많으실 겁니다. 도서관이 무엇인가, 도서관의 정체성에 대한 굉장한 고민들이 많습니다, 사실. 지금 4차 산업혁명은 우리 도서관도 예외가 아닌 직접적인 당사자죠. 도서관도 어떤 혁명적인 변화를 겪고 있는데 그러면 도서관은 무엇을 하는 곳이냐. 앞으로 도서관은 그러면 무슨 서비스를 하고 어떤 의미를 갖는 곳이냐라는 것에 있어서 많은 개념정립이 이루어지고 있습니다. 예컨대 제가 사례를 하나 들어보겠습니다. 앞서 말씀드린 대로 연세대를 제가 지난주에 일 때문에 특강을 하러 갔는데요. 연세대 중앙도서관이 굉장히 큽니다. 1층에 가니까, 중앙도서관 1층에 가니까 이쪽 한켠으로는 학생들이 막 떠들고 자기들끼리 뭘 하고 있습니다. 떠들고 난리도 아니에요. 시끄럽습니다. 그런데 이쪽 옆에는 같은 공간에서 학생들이 앉아가지고 노트북으로 공부를 하고 있고요. 저쪽에서는 뭘 하고 있든 말도 아닙니다. 그래서 뭐라 했더니 관장이 그러더라고요. 연세대 도서관장께서 “국회도서관장님, 우리 연세대 도서관 1층의 개념은 시끄러운 도서관이 콘셉트라 그럽니다” 문자 그대로 시끄러운 도서관이고 굉장히 활기 있고 학생들이 옆에서 떠들던 말든 공부를 하는 걸 봤습니다. 그 백색소음을 즐기는 거죠. 올해 11월에 서울특별시에 양재도서관이 개관을 합니다. 이 양재도서관은 개념이 시끄러운 도서관입니다. 옛날하고 완전히 상상도 할 수 없는. 시끄러운 도서관이라는 것은 검은 백조처럼 충돌하는 개념인데 이게 이제는 자연스러운 도서관이 됐습니다. 제가 아까 우리 경북도지사님 오셨을 때도 말씀드렸는데 지금 대구광역시 대표도서관을 지금 건축이 시작됐는지 아니면 지금 아직도 설계단계인지 모르겠는데 짓기 위해서 시작하고 있습니다. 저도 신문에서도 봤고 직접 들었는데 대구광역시 대표도서관을 어떻게 만들 것인가를 가지고 논쟁이 붙어 있는데 그 논쟁이 뭐냐 하면 책 없는 도서관을 만들자? 네? 아니다. 무슨 소리냐. 도서관이 책이 없으면 말이 되느냐? 책 있는 도서관, 이 논쟁이 붙어 있습니다. 책 없는 도서관 대 책 있는 도서관. 굉장히 재미있는 논쟁입니다. 저는 굉장히 둘 다 일리가 있고 그런데 책이 없다고 그래서 한권도 없는 게 아니고요. 과거처럼 도서관의 본래적 인류사 5000년의 수집, 보존기능. 수집, 보존기능을 과연 이 시대의 도서관이 할 필요가 있느냐라는 그런 논쟁이겠죠. 그래서 책 없는 도서관 대 책 있는 도서관 논쟁이 세게 붙어 있다고 합니다. 그리고 내년에 지금 서초도서관이 짓고 있는데 서초도서관 같은 경우는, 서울시 서초도서관 같은 경우는 기본 개념이 뭐냐 하면 메이커스 스페이스입니다. 메이커스 스페이스. 도서관을 책보다도 IT혁명쪽에 둬서 메이커스 스페이스 도서관을 만든다. 이렇게 굉장히 많이 바뀌고 있다는 말씀을 드립니다. 아마 여기 계신 분들도 실감하시리라 생각됩니다. 그래서 이제 결국은 IT기술. 지금까지 말씀드린 4차 산업혁명으로 대변되는 IT기술의 진보가 어떻게 도서관서비스에 구현되느냐라는 건데 저희 국회도서관도 마찬가지입니다. 똑같은 영향을 받고 있습니다. IT기술에 한정해서 한두 가지만 말씀드리면 저희 지금 보이는 화면이 저희 도서관 1층 중앙홀에 만들어진 미디어wall입니다. 올해 2월 20일 67주년 개관기념식 때 제가 오픈한 건데요. 제가 중국 상해도서관을 작년에 가보고 너무너무 충격을 받아서 미디어wall을 만들어 여기에서 지금 눈으로 보이지 않는 설명해 주고, 말로 하지 않으면 눈으로 보이지는 않는 디지털서비스에 대해서 저희들이 홍보판으로도 이용하고 여러 가지 이용 많이 합니다. 예컨대 지금 한번 보시면 이런 겁니다. 이게 그중의 하나 화면입니다. 저희 학술정보협의회 구성기관들이 현재 몇 개가 지금 우리 도서관을 이용하고 있고 접속돼 있는가를 실시간으로 보여주는 이런 데이터들입니다. 이런 것들을 여기에 연결해서 미디어wall을 통해서 보여줍니다. 이런 굉장히 많은 서비스를 하는데요. 결국은 우리 국회도서관도 이렇게 IT에 기반한 새로운 도서관 공간으로 변화하고 있다는 말씀을 드립니다. 앞으로 저희는 단계적으로 가는데 최종적으로 디지털정보센터라고 저희들이 갖고 있습니다. 디지털정보센터도 현재는 가면 컴퓨터를 이용한 저희 도서관 자료의 검색기능을 하고 있는데 앞으로는, 내년쯤이면 되겠죠. 증강현실과 같은 최첨단 정보기술을 활용해서 세계적 수준의 IT체험공간으로 바꾸려고 그럽니다. 그렇게 해서 개방하는 겁니다. 그만큼 많이 변했다는 얘기를 드리겠습니다. 결국은 한마디로 말씀드리면 저희 국회도서관은 저희들이 가진 모든 자원은 결국은 국가 예산이고 국가 예산으로 만들어지고, 국민 세금으로 만들어지고 국가도서관의 자산이기 때문에 국가기밀이 아닌 이상 국민 모두에게 개방되고 공유되어야 된다는 게 저희들의 대원칙입니다. 그리고 국회도서관의 공간도 이제는 단순히 와서 자료를 보고 조용히 공부하는 곳이라기보다도 국회를 찾는 모든 시민의 창조적 IT기술을 체험하는 문화공간이자, 누구나 편안하게 활용하는 어떤 문화의 공간, 핫플레이스 같은 곳이 돼야 된다. 이런 개념으로 저희 국회도서관도 바뀌고 있습니다. 앞서 말씀드렸다시피 2018년도, 작년에 전체 1년에 하루 평균 방문자가 3,300명이었습니다. 저희들은 지금까지 말씀드린 대로 1층 중앙홀을 그렇게 바꾸고 카페가 들어오고 어쩌고 저쩌고 출입시설을 하면, 올해 10월쯤에는 1만명 정도까지 올라가지 않을까, 300% 정도까지 증가하지 않을까, 이렇게 기대하고 있고 실제로 이 목표를 달성하기 위해서 노력하고 있습니다. 마지막으로 중요한 것은 데이터 기반의 구축이 되고 그것을 개방하고 공유를 하려면 협력이 중요합니다. 협력 네트워크 없이는 공유할 수 없습니다. 협력 네트워크를 위해서 굉장히 준비를 많이 했는데 그 한 가지만 저희들이 설명을 드리겠습니다. 먼저 우리 지금 현재 있는 우리 한국학술정보협의회입니다. 올해 17년 됐고 2017년에 1,800개이던 것이 현재 1,992개를 돌파했습니다. 그래서 다음 달 초가 되면 딱 2,000을 돌파합니다. 지금 예정이 돼 있습니다. 그래서 2,000을 돌파하는 어떤 상징적인 의미가 있죠. 굉장히 빠르게 돌파하고 있고요. 제가 올해 들어서 전국 17개 시도교육청을 전부 다니면서 학술정보협정을 맺고 있습니다. 그래서 학교도서관들이 저희 국회도서관 데이터를 이용할 수 있도록 이렇게 권유하기 위해서 지금 하고 있는데 학교도서관이 우리나라에 거의 2만개 가깝습니다. 이 도서관도 정보의 사각지대에 놓이면 안 된다 해서 학교도서관과 지금 끊임없이 올라가고 있습니다. 작년에 우리가 이제 결의했듯이 분과위원회도 구성했습니다. 여기는 분과위원회 전체의 올해 3월 13일날 한 건데요. 국가학술정보신경망조성 분과위, 저작권법개정 분과위. 저는 이중에서 제일 중요한 게 이거라고 생각합니다. 저작권법. 아까도 이민화 교수님도 얘기하셨다시피 이게 정말 말도 안 되는 상태로 지금 있는데 어떻게 하면 좋을지 저도 참 난감하기 짝이 없습니다. 그 다음에 4차산업혁명대응 분과위원회인데 어쨌든 시간이 많이 걸리고 우리가 자주 만나지는 못하지만 저희들 나름대로 최선을 다해서 도서관 현안에 대해서, 도서관계가 당면하고 있는 현안에 대해서 열심히 노력하려고 합니다. 우리는 또 우리 한국학술정보협의회는 현재 2,000개 기관을 돌파하지만 외국과도 굉장히 지금 확대를 많이 하고 있습니다. 이미 알고 계시지만 미국의 연방의회도서관, Library of Congress하고도 이미 협약이 돼 있고요. 5분 남았는데 5분 안 걸립니다. 걱정하지 마세요. 그 다음에 또 어디입니까? 하버드하고도 돼 있는데 현재 59개 기관으로 확대가 돼 있습니다. 그래서 외국의 한국에 대한 관심이 많기 때문에 저희들은 저희 스스로 대한민국의 지식정보의 창이 되자, 이렇게 노력하고 있다는 말씀드립니다. 아울러 올해 4월 23일이면 불과 한 달 전이죠. 저희들이 법률정보를 다루는 기관들과 전국적 네트워크를 만들었습니다. 이것은 보시면 아시겠지만 대한변호사협회, 서울대, 연세대, 한국법제연구원, 법제처 이렇게 6개 기관이 우선 출발을 했는데 대한민국 최고의 법률정보 서비스 네트워크가 될 거라고 생각합니다. 앞으로 이 법률정보 네트워크 협의를 통해서는 지금 여기 학술정보 네트워크처럼 법률정보를 공유하지만 앞으로 법률정보 공유를 위한 플랫폼 구축이라든지 법률 원문자료의 공동구축이라든지 이런 국가적 일도 같이 해나갈 것으로 기대합니다. 그다음에는 세 번째로 정부적 네트워크를 하나 더 만들었는데 의정정보협의회입니다. 이것은 이 총회가 끝나면 직후에 6월 12일날 창립총회를 갖기로 이미 결정돼 있습니다. 전국에 243개 지방의회의 의정자료를 전부 국회도서관 홈페이지를 통해서 볼 수가 있습니다. 지금도 오픈돼 있습니다. 현재 100개 의회와 통합이 됐고요. 17개 광역시도의회하고도 다 됐습니다. 그래서 이번에 17개 광역시도의회가 참여하는 전국의정정보협의회가 발족을 하는데 이것도 결국은 의회정보에 관해서는 국회도서관 홈페이지를 통해서 전부 다 하나의 통합된 네트워크 속에서 보고 그것을 발전시키자는 이런 취지입니다. 결국은 이렇게 해 가지고 국회도서관은 이제 한 달 뒤인, 정확히 한 달 뒤인 6월 26일에 국회도서관 지식정보 SOC 선언이라는 큰 행사를 계획하고 있습니다. 우리 회원기관 여러분께도 저희들이 초청장을 보내드릴 텐데 이것은 작년에 2월에 우리가 4차 산업혁명 선도하는 국가중심 도서관이 되자, 이런 선포식을 갖고 아까 말씀드린 대로 디지털 데이터 기반의 구축 그다음에 이것의 개방, 공유 그다음에 협력의 확산, 이런 목표를 가지고 왔습니다. 지금까지 말씀드린 그런 성과를 기반으로 해서 앞으로는 대한민국의 기반이 SOC라고 우리 표현하듯이 지식정보의 SOC를 추구하자. S는 뭐냐, 공유. share, 영어로. 약간 콩글리시죠, 사실은. share. O는 open, 개방. C는 사실은 communicate인데 connect 해 가지고 협력 이렇게 해서, 대한민국 지식정보의 SOC를 이루자, 이런 바를 내걸고 국회도서관의 역할에 대해서 다시 한 번 재정립하고 국가도서관으로서 더 이렇게 리드하는 그런 역할을 하겠다, 이런 다짐을 합니다. 마지막으로 결론을 말씀드리고 오늘 발표를 마치겠습니다. 저의 제일 좋아하는 취미가 등산이고 또 특히 겨울등산을 좋아합니다. 겨울등산을 해 보시면 아시지만 눈이 덮힌 산을 갈 때 맨 앞에 서서 눈길을 헤쳐가는 사람을, 그런 행위를 러셀이라고 합니다. 러셀. 버튼 할 때 러셀하고는 조금 다른데 러셀이라는 단어입니다. 그런데 그것은 굉장히 힘이 들기도 하지만 위험하기도 합니다. 그러나 반드시 누군가는 해야 되는 일입니다. 그래야 뒷사람이 안전하게 따라가지 않습니까? 저희들은 국회도서관도 국회도서관이 특별히 잘나서가 아니라 그래도 대한민국에서 도서관 인프라를 그래도 갖고 있고 인력이나 조직이나 갖고 있고 또 의회도서관이기 때문에 힘도 있고 그래서 이런 도서관으로서 4차 산업혁명이라는 이런 큰 변화 시기에 우리가 도서관 혁명이라고 말할 정도로 이 큰 변화 시기에 우리가 말하는 미래도서관, 첨단도서관. 앞으로 도서관의 역할을 누군가는 앞장서서 헤쳐 나가고 개척해 나가야 된다. 그게 누가 할 것이냐. 모두가 한다는 건 아무나 안 하는 것이기 때문에 우리 국회도서관이 책임감을 갖고 하자. 눈 덮힌 산을 갈 때 러셀의 생각을 갖고 하자. 맨 먼저 뛰어드는 퍼스트 펭귄이 되자. 서부 개척해 나가는 그런 개척자의 정신을 갖자, 이런 얘기입니다. 국회도서관은 그런 국가도서관으로서 대한민국을 넘어서 세계적 국가도서관을 지향하고 우리 대한민국의 모든 도서관들이 지식강국, 도서관강국, 도서관천국. 이런 것들이 되도록 최선을 다하겠습니다. 이 길은 오늘 우리 주제에 정한 대로 디지털 데이터의 구축, 그것의 개방 그리고 협력을 통한 공유에 있다고 확신하고 우리 회원기관 여러분들의 많은 동참과 협조를 부탁드리겠습니다. 이상 마치겠습니다. 감사합니다.



4차 산업혁명시대 무엇을 연결할 것인가

발표: 김창경 한양대학교 창의융합교육원 교수, 전 교육과학기술부 제2차관
동영상에 대한 자막정보
김창경: 안녕하십니까? 한양대학교의 김창경 입니다. 이렇게 또 훌륭한 자리에 와서 제가 강연을 하게 된 것에 대해서 굉장히 영광으로 생각하고요. 제가 슬라이드만 139장을 가져왔는데 제 말이 워낙에 빠르니까 제가 한 3초마다 하나씩 할 것이다. 라는 것이고요. 그래서 저도 시간을 엄수하겠습니다. 4차산업혁명시대에 무엇을 연결할 것이냐. 여러분, 동국대학 하면 불교로 특화된 대학이죠. 그래서 2017년도 12월 달에 여기서 불교와 4차 산업이라는 컨퍼런스가 열렸죠, 그래서 제가 도대체 무슨 일이 있었을까 하고 절을 열심히 봤더니, 조계사 주지스님부터 시작해서 온갖 분들이 다 오셨는데 1주제를 딱 보니까 인공지능로봇의 해탈 가능성. 인공지능로봇은 해탈할 것이냐. 3주제를 보니까 4차 산업 기술의 불교철학적 해석. 제가 무슨 불교를 폄훼하자는 것이 아니고 도대체 무슨 일이 틀림없이 일어난 거죠. 그렇죠? 산사에 계신 고승들이 다 내려오셨다. 일본에서는 이미 인공지능로봇을 다 섬기고 있다 라는 것이고요. 여러분들 중국 가시면 중국의 거지들도 다 QR코드로 적선한다 하는 거죠. 이제 중국의 거지들도 다 살아남으려고 지금 진화를 했는데 이렇게 진화했다는 거죠. 왜 이렇게 진화했겠습니까, 자동차의 윈도우를 내리고 하는 분들한테 컵을 딱 넣어가지고 거기서 또 적선을 받아야 되니까 중국의 거지들도 진화하고 있다. 이것은 일본의 호프집 사장입니다. 보시다시피 뒤에 선풍기가 있죠. 이게 뭐냐 하면 꼰대를 감별하는 선풍기다. 제가 꼰대 인물. 쉽게 말씀드리면 제가 여기 있어가지고 우리 대학원생하고 여기서 생맥주를 마시는데 저도 이제 여러 꼰대 분들을 제가 무지하게 많이 압니다. 그런 분들하고 얘기를 하면 제가 이런 얘기를 합니다. 내가 옛날에 무슨 IMF시절에 외환위기 극복할 때, 어쩌라고. 네? 20년 전 어쩌라고요? 그러면서 계속 꼰대스러운 얘기가 나오면 여기 IBM의 인공지능이 장착되어 있는데 이것의 세기가 점점 강해진다는 거죠. 약풍, 중풍, 강풍으로 되면서 이게 6개가 다 돌아가면 드디어 꼰대 아저씨가 아, 내가 꼰대노릇을 하는구나 라고 자기의 말을 멈추게 된다는 거죠. 제가 오늘 드리고 싶은 말씀은 뭐냐. 산사에 계신 고승부터 중국의 거리인, 그다음에 일본의 호프집 사장까지 4차 산업혁명을 모르고서는 지금 살아갈 수가 없다. 그런 것만 있느냐? 여러분들 요새 인공지능이 왜 이렇게 난리입니까? 왜 이렇게 난리냐 하면 실제로 보는 능력이 생겼기 때문이에요, 보는 능력. 그래서 인공지능이 엄청나다는 얘기를 한 건데 인간이 가장 시각적으로 진화된 동물이다 그랬는데 2012년만 해도 어떤 일이 있었냐 하면 컴퓨터가 개와 고양이를 구별하지 못했다. 그래 가지고 스탠포드에 앤드류 응이라는 굉장히 유명한 인공지능 교수가 있죠. 이 양반하고 구글하고 프로젝트를 했는데 컴퓨터 1만 6천대를 연결해서 유튜브 비디오 천만개를 보여줬더니 드디어 사흘 만에 고양이를 구별하더라. 이렇게 생긴 게 개, 이렇게 생긴 게 고양이라는 걸 가르쳐준 게 아니고 예를 들면 유튜브 비디오 중에 제가 이렇게 개를 끌고 다니면서 예쁜 치와와 이렇게 얘기하는 거예요. 고양이를 데리고 다니면서 우리 예쁜 고양이 그랬어요. 물론 어떤 나쁜 놈이 개를 끌고 다니면서 고양이라고 한 놈도 있었겠으나 그런 놈들은 별로 없었다라는 거예요. 그래 가지고 천만개를 보니까 드디어 이렇게 생긴 게 고양이가 아니겠냐 라고 이제 앤드류 응 교수 컴퓨터에 처음 떴다는 거죠. 그래서 뉴욕타임즈가 너무 놀래가지고 개와 고양이를 구별하는 데 도대체 컴퓨터는 몇 대가 필요하냐? 1만 6천대. 이게 2012년도 6월달 얘기예요. 여러분들 2012년도 6월달 하면 이게 굉장히 먼 옛날 얘기입니까? 아니죠. 얼마 전 얘기 같죠. 그렇죠? 그런데 얘들이 얼마나 빨리 발전을 하면 여러분들 이제 알파고 아시죠? 알파고가 처음에 왔을 때 뭐라 그랬습니까? 과학기술자들 혹은 바둑의 초고수들이 이것이 인간이 만든 가장 창의적인 게임이기 때문에 절대로 이길 수 없다. 가장 어렵다고 그랬죠. 왜냐하면 바둑을 둘 수 있는 경우의 수가 10의 170승개가 있다. 공이 170승개가 있다라는 거예요. 여러분들 10억이면 0이 9개가 있죠. 그러니까 170개가 있으니까 절대 못 이긴다. 다 아시다시피 이세돌이 4:1로 졌고 이게 언제 졌느냐. 2016년도 3월 13일날 졌다라는 것이죠. 그런데 이 때 뭐라 그랬냐 하면 이 사람이 여러분도 잘 아시는 알파고를 만든 허사비스라는 사람이고 이 사람이 구글의 전 회장인 에릭 슈미트예요. 뭐라 그랬냐 하면 우리가 비록 인공지능이라고 그랬지만 하도 사람의 흉내를 내가지고 절대로 인공지능 되기는 멀었다. 무슨 얘기냐 하면 바둑은 5000년의 역사이기 때문에 기본적으로 16만건의 정석이 있고 3000만건의 기보가 있다라는 거예요. 그걸 다 입력했다. 다 입력을 했더니 이제 이세돌을 4:1로 이겼다라는 거죠. 그랬는데 여기까지는 사실 제가 별로 안 놀랐습니다. 제가 놀란 건 뭐냐, 2017년도 10월달이 되니까 네이처라는게 여러분들 잘 아시다시피 가장 좋은 과학기술저널이죠. 여기 뭐가 나왔다고요? Mastering the Game of Go without Human Knowledge. 그렇죠? 알파고도 진화를 했어요. 인간의 지식을 하나도 입력하지 않고 바둑의 최고수가 됐다. 무슨 얘기냐. 이것만 가르쳐줬다는 거예요. 까만 것은 흑, 하얀 것은 백이고 다음과 같이 백이 흑을 둘러싸면 먹고 다음과 같이 이렇게 호구쳐도 먹는다. 이것을 가르쳐줬더니. 즉 16만건의 정석, 3000만건의 기보를 하나도 입력하지 않았는데 스스로 배워가지고 3시간이 지나니까 사람의 초보자 수준이 됐으며 19시간이 지나니까 실리, 집, 세력을 이해했고 사흘이 지나니까, 72시간이 되니까 기존의 알파고를 100:0으로 이겨가지고 얘가 은퇴해버렸다는 거예요. 59개 기보를 내리고 은퇴를 해버렸어요. 그래서 이게 신이 남긴 기보예요. 그래서 요새 바둑분야들은 다 이것 연구하고 있다. 이게 이제 노벨상을 받은 논문인데 무슨 얘기냐 하면 제가. 예를 들면 저도 연구를 하고 그럴 거 아닙니까? 제가 이렇게 헤매고 있냐 하면 하도 우리의 조상, 선배들이 남겨놓은 원리, 법칙, 규율, 규범 이런 게 하도 많아가지고 그걸 몽땅 공부하려다 보니까 제가 여기서 헤매고 있다라는 거예요. 인간의 지식을 엄청 주입했더니 어떠한 한계를 묻는 걸 대비하여 아무것도 주입하지 않았더니 다음과 같이 싹 바로 한계를 바로 넘어가버리더라. 저는 알파고한테 물어보고 싶은 게 딱 하나가 있다. 뭘 물어보고 싶냐? 북핵문제. 저는 북핵문제에 하나도 관심이 없어요. 그런데 북핵문제가 딱 나오면 그 해답은 저는 이미 알고 있어요. 무슨 UN으로 제재를 하고, 무슨 개성공단을 닫고, 중국에서 석유관을 다루고, 그러면 북핵문제가 해결이 됩니까? 과연 알파고는 뭐라고 대답을 할 것이냐. 그래서 드디어 영국의 가디언지에서 뭐라 그랬냐 하면 AI that learns on its own. 스스로 배운다라는 얘기죠. 스스로 배우는 인공지능이 나타났다. 그런데 DeepMind가 아까 알파고 만든 그 회사죠. 그 회사가 2013년도 12월달에 뭘 만들었냐 하면 인간이 만든 가장 쉬운 게임인 벽돌격파를 스스로 배워서 이기는 것을 자기 홈페이지에 딱 공개했더라는 거예요. 인간이 만든 가장 쉬운 게임. 여러분들 잘 아시다시피 이것만 가르쳐주는 거예요. 까만 건 필요 없으니까 컬러로 된 것만 깨라 그랬더니 얘가 스스로 배워가지고 드디어 이렇게 딱딱딱 깨다가 뭐를 알게 되느냐 하면 이 구석을 공략하면 드디어 이 공이 이 안으로 들어가서 이렇게 들어가면 빠빠빡 하고 다 깨지죠. 이걸 스스로 알았다는 거예요. 이게 승률이 그래서 4번이 가장 높고 3번은 그래도 높으며 1, 2번은 승률이 낮다. 이게 언제라고요? 2013년도 12월달, 2013년도 12월달에 사람이 만든 가장 쉬운 게임을 스스로 배워서 이겼는데 2016년도 3월달에 인간이 만든 가장 어려운 게임인 바둑을 얘네들이 공략하게 됐다. 그러니까 속도가 얼마나 빠른가 아시겠죠. 그렇죠? 그런데 여기까지도 제가 별로 안 놀랐어요. 2018년도 12월달에 드디어 허사비스가 뭐라 그랬냐 하면 이제 자기네 인공지능이 fundamental(근본적인)한 scientific problem(과학문제)을 다 풀 수 있다. 쉽게 말하면 과학계 퇴출이다. 과학문제를 다 풀 수 있다고 했어요. 그러면서 뭘 예로 드냐 하면 여러분들 단백질이라는 것 아시죠? 그렇죠? 단백질은 20개의 필수아미노산으로 되어 있고 이것이 마치 염주알같이 돼 있어서 염주알을 다 꿰놓은 건데 그러니까 염주알이 한도 끝도 없이 있는 거예요. 그런데 조그마한 세포 안에 단백질이 들어가 있어야 되니까 단백질이 구겨지고 접혀서 이렇게 돼 있어요. 그것이 단백질 접힘문제라는 거예요. 그래서 얘네들이 어떻게 접혀 있나가 실제로 이 병이 어떻게 진화되는가. 노안은 어떻게 되는가, 이런 것의 핵심기저인 거예요. 그런데 단백질이 이렇게 구겨지고 접히는 것의 경우의 수가 몇 개가 있냐. 10의 300승이 있다는 거예요, 300승. 이게 사실은 생명공학에서 가장 어려운 문제. 가장 어려운 문제가 접히는 경우의 수를 다 계산을 하려면 우주의 생성시간보다 더 걸린다는 거예요. 우주 생성시간이 140억년 정도죠. 140억년이 더 걸린다는 거예요. 그런데 얘가 풀었다, 어떻게 접히는지를. 다시 얘기하면 무슨 얘기냐, 지금 과학기술 문제를 지금 인공지능이 다 풀고 있다. 과학기술계부터 퇴출이다. 이건 또 무슨 소리냐. 조금 이따가 말씀드리기로 하고 4차산업혁명은 Digital Transformation이라고 하는데 그건 무슨 얘기냐. 여러분들 1994년에 아마존이 처음 창업했습니다. 그때 우리가 뭘로 인터넷을 검색했냐 하면 우리가 마이크로소프트의 인터넷 익스플로러 이런 걸로 검색한 게 아니라 이 친구가 만든 넷스케이프라는 것으로 검색했어요. 그래서 이 사람이 마크 안드레센이라는 사람인데 이 사람이 돈을 엄청 벌었을 거 아닙니까? 그래서 이 사람이 뭘 했느냐. 이 사람이 실리콘밸리에 벤처캐피털 세워가지고 회장이에요. 그러면서 무슨 유명한 얘기를 했는데. 세상을 소프트웨어가 다 먹어치우고 있다 그러면서 뭐라 그랬냐 하면 이제 In the future every company will become a software company. 앞으로는 모든 회사가 다 소프트웨어 컴퍼니가 돼야 된다. 이것을 저보고 해석하라 그러면 무슨 앞으로 자동차 만든 회사, 스마트폰 만드는 회사가 소프트웨어 컴퍼니가 돼라는 것이 아니고, 제 해석으로는 라면가게를 하더라도 다 소프트웨어 컴퍼니가 돼야 한다. 이 얘기는 조금 이따 말씀을 드리겠고. 그래서 당연히 이제 도서관도 Digital Transformation 해야 되는데 Digital Transformation 하면 뭐가 좋으냐. 그래서 아까 온 세상을 다 소프트웨어가 먹어치운다고 그랬죠? 자동차는 어떻게 먹어치웠을까? 아까 마크 안드레센이 그렇게 얘기하고 한 6개월쯤 후에 메르세데스 벤츠 회장이 다음과 같이 전기자동차를 갖고 나와서 뭐라 그랬냐 하면 여태까지 자동차는 휘발유로 다니지만 이제부터는 소프트웨어로 달린다고 얘기를 한 거예요. 자동차 이제부터 전기자동차는 소프트웨어로 달린다. 다시 말씀드리면 전기자동차는 바퀴 달린 스마트폰이기 때문에, 즉 전기자동차는 이렇게 생긴 거예요. 여기 배터리가 있고 모터를 앞으로 돌리면 앞으로 가고 뒤로 돌리면 뒤로 가고 모터의 전기를 끊으면 쉽게 말하면 얘들이 멈추니까 거기에 있는 내연기관, 엑셀레이터, 트랜스미션, 브레이크 이런 게 하나도 필요 없는 거예요. 이렇게 깔판만 필요해요, 깔판. 그래서 얘네들이 이렇게 스마트폰하고 똑같으니까 여기 디스플레이 달고 이러면 우리가 스마트폰의 온갖 데이터가 다 오는 것과 마찬가지로, 드디어 이제 자동차가 Digital Transformation 했더니 여기 데이터가 모이더라는 거죠. 그래서 여러분들 잘 아시는 테슬라라는 전기자동차를 만든 회사는 요새도 지금 전세계 모든 길을 다 다니고 있는데 그래서 하루에 800만km의 도로의 정보를 모으고 있고 그래서 얘네들은 예를 들면 자동차 길을 다니는 것이 아니라 바코드 위를 달리는 것과 마찬가지다. 그래서 이제부터는 자동차는 여태까지 어떻게 했다고요? 휘발유로 다니다가 소프트웨어로 달리다 보니까 그러니까 드디어 데이터를 모으게 돼서 이제부터는 데이터로 달린다. 그래서 하루에 쓰이는 데이터량이 4000기가바이트라는 거예요. 우리나라의 여러 기업들이 사실 황당한 얘기들 많이 하는데, 그 중 가장 황당한 게 뭐냐 하면 KT에서 하는 우리가 5G시대가 되면 자율주행자동차가 되면서 잘살 거다. 천만의 말씀. 하루에 4000기가 필요하다니까 이것 지금 5G의 요금으로 내려면 하루에 데이터비용만 8000만원이다. 한 달 쓰면 12억. 여러분들 저도 우리 마누라하고 딸래미하고 20기가데이터 이거 나눠쓰죠. 그렇죠? 그런데 하루에 4000기가 필요하대요. 어쨌든간에 데이터로 달리면 뭐가 좋으냐. 이건 조금 이따 말씀드리기로 하고. 하여간 어쨌든간에 도서관이 디지털화하면 드디어 도서관에 데이터가 모이기 시작했다. 그래서 결국은 4차 산업혁명이라는 것은 데이터를 어떻게 조물딱조물딱하냐. 어떻게 연결해서 도대체 뭘 만들 수 있냐. 이게 4차 산업혁명의 가장 중요한 얘기다. 그래서 드디어 데이터 경제시대가 왔다는 것이죠. 데이터 경제시대를 제가 한 4가지 정도 예로 쉽게 말씀 드릴텐데 데이터 경제시대에서 가장 중요한 것은 뭐뭐하기 전에 뭐뭐한다는 거예요. 무슨 얘기냐. 저는 내일 여기서 떠날 것이고 저는 여기서 강연하는 것이 제 SNS에 와 있기 때문에 저는 신경주에 갈 것이고 그래서 저는 여기서 10시쯤 떠날 것인데 10시쯤 떠나기 전에 나는 택시를 타고 거기까지 갈 것인데 그런데 우버택시는 내가 부르기 전에 와 있다. 택시가 부르기 전에 와 있어요. 카카오택시는 이게 불러도 안 온다. 요새 숨죠? 여러분, 택시업무를 하는데 불러야 오는 택시하고 부르기 전에 오는 택시하고는 천지 차이죠. 이게 여러분들 제가 뻥친다라고 생각하시겠으나 그게 아니다. 우버 알고리즘은 12월 31일에 데이터를 분석해 보니까 어느 도시가 가장 빡세게 노는지 알고 있다. 우리가 역시 기대한 대로 파리 사람들은 새벽 4시까지 놀며, 뉴욕 사람들은 새벽 2시까지 놀고, 샌프란시스코 사람들은, 이건 샌프란시스코죠. 오후 9시에, 웰빙족이라 오후 9시에 집에 간다. 이것을 뉴욕말로 바꾸면 뉴욕은 5개 보로로 돼 있죠. 그래서 맨해튼, 퀸즈, 브롱스, 브루클린, 스테튼 아일랜드 이렇게 돼 있어요. 우버 알고리즘 뭘로 하냐 하면 맨해튼 사람들 새벽 2시까지 노는 걸로 알고 있어요. 그렇게 새벽 1시 45분이 되면 뭐가 있냐. 브루클린에 있는 우버기사님한테 딱 콜을 보내는 거예요. 여기 있지 말고 맨해튼 가라, 이렇게. 제가 맨해튼에 놀러가서 새벽 2시까지 놀다가 딱 나오면 우버택시는 부르지도 않았는데 바글바글 하다는 것이죠. 그래서 지금 우버는 다음과 같이 엄청나게 성장을 하고 있는데 뉴욕의 명물인 옐로우캡은 다음과 같이 성장이 정체돼 있다. 피자는 시키기 전에 배달돼야 돼요. 무슨 얘기냐. 여러분들 피자가 맛이 없습니까? 엄청 맛있어요. 이 세상에 맛이 없을 수 없는 걸 2개를 꼽으라면 하나가 닭 튀긴 것, 두 번째가 피자인 거예요. 세 번째가 라면, 네 번째가 햄버거, 다섯 번째가 볶음밥이라는 거예요. 어떻게 피자는 맛이 없냐? 우리집에 띵동 하고 들어올 때 이게 식어서 오기 때문에 맛이 없는 거예요. 그래서 푸드트럭이 나왔는데 이 푸드트럭 줌피자라는 데고 피자를 빨리 만들기 위해서 이 안에서 로봇이 피자를 만들어요. 로봇이 피자를 만드는 데 5분밖에 안 걸리니까 이게 우리집에 띵동하기 5분 전에 여기서 피자를 만들어가지고 딱 오니까 이게 따끈따끈하게 와가지고 치즈가 이렇게 늘어지고 엄청나게 맛있게 먹는 거예요. 얘가 전화는 안 받을 테니까 다음과 같이 앱으로 받게 됐는데 드디어 이 앱은 데이터가 쌓이다 보니까 뭘 알게 되냐. 김창경이네는 꼭 토요일마다 피자를 시켜먹는데 저녁 7시에 페퍼로니피자를 시켜먹는 걸 알게 되는 거예요. 그래서 토요일날 저녁 7시가 되면 내가 전화를 하기도 전에 띵동하고 페퍼로니피자가 와 있다, 이런 얘기예요. 피자는 시키기 전에 와야 된다. 여러분들이 이탈리아에 가셔가지고 진짜 피자를 잘하는 레스토랑에 갔어요. 그래 가지고 거기 있는 셰프를 꼬셔가지고 이 경주 근처에서 피자집을 열면 어떻게 되겠습니까? 망하지. 왜 망하냐? 경주 피자 다 맛있어. 다 맛있다고요. 그래서 여기의 줌피자라는 데서 최근에 사람을 뽑았는데 사람 뽑는 사이트에서 누구를 뽑았다고요? 소프트웨어 엔지니어를 뽑았다. 여기서 무슨 음식 잘하는 주방장을 뽑은 게 아니라. 이게 아까 제기한 라면가게를 하더라도 소프트웨어 데이터가게가 되어야 된다는 것이고 의사는 쓰러지기 전에 찾아와야 된다. 저의 예를 들면 의료보험 데이터를 딱 보면 내가 한 달에 한번씩 의료보험에서 약을 타갔다는데 내가 한 달 5일, 한 10일이 돼도 안 오면 쟤가 이상한 거니까 내가 쓰러지기 전에 의사와 간호사를 보낸다. 그래서 여기서 최근에 이렇게 데이터를 분석해서 이렇게 했더니 1500억을 투자받았다. 자동차는 사고나기 전에 멈춰서야 돼요. 무슨 얘기냐. 한양대학교에는 한양초등학교가 있죠. 한양초등학교는 어떻게 돼 있냐 하면 오후 4시면 피하는 것을 이 알고리즘은 알고 있어. 그래서 데이터가 모이다 보니까 오후 4시가 돼서 자율주행자동차가 비록 오더라도 얘는 알아서 멈춘다, 이런 거예요. 다시 말씀드리면 여태까지 휘발유로 달리는 자동차는 사고가 나야 안전한 걸 알아서 엄청나게 두꺼운 철판을 썼는데 데이터로 달리는 자동차는 사고가 안 나기 때문에 기본적으로 굉장히 얇은 재료를 쓴다. 그러니까 다시 말씀드리면 무슨 얘기라고요? 자동차가 휘발유로 달리는 자동차하고 데이터로 달리는 자동차는 아예 상대가 안 되는 거예요. 아예 상대가 안 된다. 그래서 자동차는 사고나기 전에 멈춰선다. 커피는 줄 서기 전에 주문돼야 돼요. 카페X, 여러분들 요새 로봇 바리스타가 커피 타주는 거 이러는 거 많이 보셨죠? 그렇죠? 이 로봇 바리스타가 커피를 타줘요. 이 커피가 맛이 있습니까, 없습니까? 맛있지. 요새 커피는 다 맛있어. 무슨 얘기냐 하면 무슨 스타벅스 커피도 맛있고 폴바셋 커피도 맛있고 빽다방 커피도 맛있고 블루보틀 커피도 다 맛있어요. 맛없는 커피가 하나도 없어. 어디 무슨 외국에서 유명한 바리스타가 와가지고 하도 잘난척을 해 가지고 주최측에서 커피를 한잔 타줬다는 거예요. 그랬더니 이 커피가 너무 맛있다고 난리가 났어. 그래서 그분을 꼭 모시고 싶다고. 뭐 타줬다는 거예요? 커피믹스. 커피믹스 타줬다고. 그러니까 커피는 다 맛있어. 그러니까 당연히 이 커피 당연히 맛있어. 그런데 데이터가 쌓이다 보니까 어떻게 됐다고요? 얘가, 이 친구는 아침 8시부터 꼭 와서 아이스아메리카노를 시켜먹는 걸 아는 거예요. 그래서 이 친구가 딱 오면 아이스아메리카노를 딱 내줘요. 어떤 때는 아이스아메리카노 먹고 어떤 때는 카페라떼 먹으면, 이건 없구나. 딱 내준다는 거예요. 무슨 얘기냐. 여러분 픽스에비뉴, 뉴욕에 놀러 가셔가지고 거기서 딱 이게 있어요. 스타벅스가 있어요. 그러면 어디든지 줄서느라고 바글바글하고 스타벅스가 여기도 있고 여기도 있고 여기도 있고 길 건너도 있고 스타벅스가 엄청 많아요. 그런데 어디는 줄서느라고 바글바글하고 어디는 줄이 하나도 없어. 그러면 여러분들 어디 가시겠습니까? 줄 없는 데 가야 되는 거예요. 왜냐, 스타벅스 커피는 다 맛있으니까. 다 맛있어. 그런데 여기는 왜 사람이 없다고요? 이미 내가 대개 가서 뭘 시켜먹을지 알고 있다라는 것입니다. 데이터, 그렇죠? 데이터 비즈니스를 이길 수 없다. 이걸 도서관으로 얘기하면 문헌조사하기도 전에 요약돼 있어야 된다. 무슨 얘기냐, 여러분들 요새 로봇이 실험하시는 거 아시죠? 요새 대학원생이 실험하는 게 아니라 로봇이 앉아가지고 다 이렇게 실험하는 거예요. 배터리 이런 거 다 로봇이 실험해. 요새는 로봇이 실험만 하는 게 아니라 드디어 로봇이 새로운 실험을 얘네들이 고안한다, 이런 얘기예요. 그런데 로봇이 하다 보니까 얼마나 빨리 하겠어요. 그래 가지고 가장 중요한 게 뭐냐 하면 지금 실험데이터 논문이 한도 끝도 없어요. 논문만 기본적으로 여태까지 5000만개가 있으면 1년에 100만개가 더 생기고 특정 단백질에 대한 논문만 7만개가 있다. 여러분들, 제가 박사학위 할 때 끝날 때 논문 몇 개 봤는지 아십니까? 인용한 게 한 300 몇 십개밖에 안 된다고. 연구자가 1년에 본인이 논문을 읽으면 몇 개나 읽는다고 생각하세요? 그런데 단백질 하나에 7만개의 논문이 있다니까요. 이것 어떻게 할 것이냐. 인공지능이 요새 해결한다. 그래서 인공지능이라는 것이 드디어 대학의 library. 대학의 데이터센터에 아주 필수적인 요소가 됐는데 제가 예를 들면 IRIS.com.AI라 읽는 것이 기본적으로 얘를 딱 부르면 저 IRIS예요 하면서 이렇게 논문을 다 요약해 줍니다. 그러니까 논문은 찾기 전에 요약돼서 여러분들한테, 고객한테 가야 된다 이런 것이죠. 그러니까 무슨 얘기냐 하면 책을 대출해 주는 것이 아니라 데이터를 대출해 줘야 된다. 데이터에서 엄청난 일을 할 수 있다. 무슨 얘기냐. 이 조그마한 아이들이 여기서 레모네이드를 파는데 이걸 공짜로 준다는 거예요, 공짜로. It’s free. 그래서 이 아저씨가 아줌마한테 쟤네들이 레모네이드를 공짜로 가져가래 그랬더니 이 아줌마가 그랬겠죠. 그럼 쟤네들은 뭐로 돈 버냐 그랬더니 얘네들이 계속 물어봐. 뭘 물어봐 그랬더니 아저씨는 도대체 몇 평짜리 아파트 사세요? 아저씨는 주말에 뭐하세요? 아저씨는 자동차를 뭐 사세요? 아저씨는 카페라테가 좋아요, 아이스아메리카노가 좋아요? 이걸 계속 물어보는 거예요. 무슨 얘기냐 하면 레모네이드를 공짜로 주고 모든 데이터로 돈을 번다 이 말이에요. 무슨 소리냐. 이 사람이 아까 얘기했던 스탠포드의 앤드류 응 교수인데 기본적으로 모든 회사는 다 인공지능 처음, 인공지능 first company가 돼야 되는데 기본적으로 데이터를 모으기만 해도 돈이 된다. 제가 이제 데이터로 뭐를 할 수 있는지 2가지 말씀드려요. 첫 번째는 데이터는 모으기만 해도 돈 된다. 어떻게 아냐. 앤드류 응의 A couple of student니까 학생 2명이겠죠. 그렇죠? 이 2명이 데이터를 모았는데 무슨 데이터를 모았냐. 상추 데이터를 모았다는 거예요. 그래서 상추 데이터를 온갖 엄한 상추 데이터를 다 모았어요. 그래 가지고 뭘 만들었냐 하면 잡초를 제거하는 그러한 기계를 만들었어요. 여태까지는 무슨 일이 있었냐 하면, 이런 기계를 만들었는데. 여태까지는 이게 상추건 잡초건 다 제초제를 뿌렸는데 이게 상추면 이건 안 뿌리고 이게 잡초잖아. 여기만 제초제를 뿌리자, 이렇게 만들었다는 거예요. 데이터를 인공지능이 보는 것을 사람보다 훨씬 잘 보니까. 그래서 대박났겠죠. 대박이 나가지고 드디어 자기네들이 책임질 수가 없어서 이것을 가장 잘 만드는 JOHN DEERD라는 회사에, 농기구를 제일 잘 만드는 회사에, 미국에. 얼마에 팔았다고요? 3000억. 3000억에 팔았다고. 지금 우리나라가 무슨 돈 되는 게 아직도 부동산인 줄 알고 토지를 투기를 어떻게 하나. 이게 다 잘못된 거예요. 요새 젊은 애들한테 뭘 가르쳐줘야 된다고요? 돈 되는 것은, 진짜 돈 되는 것은 뭐라고? 데이터. 데이터를 어떻게 모으느냐, 이게 돈버는 것의 핵심. 그렇죠? 핵심기능이다라는 것이고요. 또 하나는 뭐냐, 데이터를 연결하면 대통령도 만들 수 있다. 이건 무슨 얘기냐 하면 우리 이제 이 양반 있죠. 이 양반이 이제 대통령이 됐는데 페이스북하고 연동을 하나 한 Cambridge Analytica라는 회사를 연동했다라는 거예요. 무슨 얘기냐 하면 이 사람이 이 사람의 머리죠. 이것이 페이스북이고 Cambridge Analytica 회사의 여기에 데이터를 했는데 이것은 이제 이 사람이 Analytica의 영국 런던에 있는 이 사람이 사장이에요. 어디를 가서 하도 이런 얘기를 해 가지고 드디어 알려진 거예요. Data-driven behavior change. 무슨 얘기냐 하면 그래서 하여간 이것을 해 가지고 대통령이 됐다. 그래 가지고 페이스북이 페이크북이 됐고 사장님한테 트럼프 만나봤어요? 여러 번요. 모든 조사, 데이터, 분석, 목표설정까지 다해 줬다. 그러면서 여기 싫어요 엄청 달리고 그래서 요새 페이스북이 어려운 거예요. 그래서 얼마 전에 페이스북 저커버그가 상원 가가지고 조사받은 것도 다 그래서 조사받은 거예요. 뭘 했냐. 우리가 좋아요가 어떻게 연결되는가를 분석했다는 거예요. 무슨 얘기냐, 제가 여러 얘기를 다 뺐지만 제가 좋아요를 눌렀는데 제가 다음과 같이 양파링을 좋아하고 Lord of the Rings을 좋아하며 제가 모건 프리먼의 이걸 좋아하고 이 사람 뉴스를 잘 보면 어떻다고요? IQ가 높다. 놀랍게도 어떤 사람은 다음과 같이 이 사이트. 기아를 해결하자, 이 사이트에 잘 들어가고 다음과 같이 할리데이비스 오토바이를 좋아하면, 이 사람 노래를 좋아하면 이 사람은 IQ가 낮다. 이걸 인공지능이 알아냈다는 거예요. 내가 성의 소수자인지, IQ가 높고 나쁜지 별의 별 걸 다 안다는 거예요. 그래서 이런 건 인간이 알 수 없지만 이런 걸 알 수 있는 알고리즘을 그저 했더니 그렇게 미묘한 차이를 알아내더라. 우리나라 선거 어떻게 합니까? 내년이면 선거철이 되는 거죠. 그러면 우리나라는 대개 처음에 이런 것부터 생각해요. Demographic View. 무슨 얘기냐 하면, PK냐, TK냐, 호남이냐, 난리치는 거. 이게 이제 Geographic View죠. 그렇죠? 지리학적으로 어떻게 하느냐. 얘를 Demographic으로 하면 그 사이에 남자냐 여자냐 이것도 20대냐 30대냐 40대냐, 이렇게 나눈다는 거예요. 그런데 이렇게 똑같은 View도 자세히 데이터 기반으로 조사를 해 봤더니 다 다른 성향을 가지고 있더라는 거예요. 이게 Psychographic한 View라는 거예요. 무슨 얘기냐 하면 모든 사람한테 개별 마케팅이 다 가능한데 예를 들면 이런 거예요. 어떤 앱을 깔아가지고, 아까 말씀드린 Cambridge Analytica에서 깐 앱을 가지고 다 분석을 해 봤더니 저는 예를 들면 20대 여성인데 수입도 비슷하고 직장도 비슷한데 둘 다 여행을 좋아하나 이 사람은 다음과 같이 이렇게 건물을 가서 보는 걸 좋아하고 이 사람은 바닷가 가서 쉬는 걸 좋아한다, 이런 거예요. 이 사람은 40대 남성으로 똑같이 수입도 비슷하고 직장도 비슷하고 사는 데도 비슷하나 탈 것을 좋아하는데 이 사람은 자동차를 좋아하는 데 비하면 이 사람은 마운틴바이클을 좋아한다, 이런 거예요. 이런 것을 다 알게 됐다. 다시 말씀드리면 그게 이제 OCEAN 테스트라는 것인데 이것의 앞글자를 따서 OCEAN 테스트라는 거예요. 나이대도 비슷하고 똑같은 여성이 Amex를 사용하는, Amex카드를 사용하는 이런 사람이지만 OCEAN이 뭐냐 하면 얼마나 이 사람이 오픈돼 있느냐, 얼마나 이 사람이 양심적이냐, 이 사람이 얼마나 대외적으로 활발하냐. 이 사람이 얼마나 남이랑 소통이 잘돼 있느냐, 이 사람이 얼마나 까칠하냐, 이런 것을 다 분석을 해 봤더니 이게 같은 사람이 아니라 다 다른 사람이 되는 거예요. 그래서 여러분은 이제 엄청나게 무슨 미국에서 총기사고가 많이 나죠. 총기사고가 많이 나는데 왜 미국에서 총기가 없어지지 않을까, 이게 헌법에 보장된 권리잖아요. 그렇죠? 그게 이제 제2, 세컨드헌법 Amendment죠. 그런데 여러분들이 이제 미국 대통령 뽑을 때마다 맨날 무슨 총기문제를 어떻게 할 것이냐 여러 문제를 다하는데 똑같이 총기를 사용하는 것을 찬성하더라도 이렇게 신경질적이고 양심적인 사람한테는 어떻게 홍보를 해야 하냐 하면 당신이 혼자 있을 때 어떤 괴한이 침입하면 이 괴한을 총기로 방어해야 된다라고 얘기를 해야 되는 데 비하여 이 사람은 애국심이 높아서 이 사람한테 뭐라 그러냐 하면 기본적으로 미국이라는 나라는 대대손손이 우리가 총을 가지고 이것을 해 왔다, 나라를 지켜왔다. 이렇게 얘기한다는 거예요. 그래서 12개의 다른 버전의 이것을 갖다가 만들었다. 그래서 이길 수가 있었다. 그러나 클린턴 진영은 이런 걸 하지 않았다라는 거죠. 다시 말씀드리면 무슨 얘기냐, 내가 좋아요 누른 것 300개를 분석해 보면 내 마누라보다 나를 더 잘안다는 거예요. 그러니까 데이터를 분석하면 뭘 할 수가 있다? 부자도 될 수 있고 심지어 대통령도 만들 수 있다. 그래 가지고 모든 사람한테 다 개별적인 전략을 쓸 수 있다. 우리도 다 페이스북에 한번 다 털렸다. 여러분들 이거 하신 적 있으십니까? 저도 해 봤어요. 신이 나를 만들 때 뭐 지혜를 넣고 뭘 콧물을 떨어뜨리고 비아그라 넣고 이런 것 해 보셨어요, 안 해 보셨어요? 이미 여기서 나의 취향 다 얘기했다는 거예요. 그러니까 나의 취향 다 털렸다라는 것이고 결국은 하드웨어를 집적하는 게 아니라 소프트웨어를 집적해야 된다. 또 무슨 얘기냐, 다음과 같이 Answer Engine이 있는데 이것은 이 세상에 있는 모든 것을 다 답을 해줘. 세상에 있는 것을 모두 답을 알려줘. 이게 진짜 중요한 얘기예요. 우주는 여태까지 과학기술을 하는 사람이 뭐나 그랬냐 하면 우주는 기본적으로 Mathmatical이라고 했어요. 수학이기 때문에 수학을 잘해야 된다 그랬는데 세상이 바뀌어가지고 우주는 뭐라고요? 우주는 디지털이다. 디지털로 다 풀어. 무슨 얘기냐, 저한테 있는 앱이에요. 여러분들 이거 옛날에 우리 수학의 정석 이거 풀었습니까, 안 풀었습니까? 코사인 곱하기 코사인은 뭐, 그런 말 필요 없어요. 그냥 해 가지고 딱 치면 답이 바로 나와요. X분의 사인에스 그래프 그려라. 우리 고등학교 때 어떻게 했어요. 1차 미분을 영어로 하는 데서 2차 미분 변곡점이고, 말이 필요 없어요. 그냥 딱 쳐서 그려라 그러면 딱 나와요. 이것만 하는 줄 아세요? 대학교 수학, 이것 제가 그대로 대학교에서 배운 수학에서 카피뜬 거예요. 이거 그냥 0.5초 안에 다 풀어줘요. 히틀러 그려라, 얘 그려준다니까요. 싸이 그려라, 그려준다니까? 그런데 식으로 풀어준다니까? 이것만 하는 게 아니라 오늘 밤에 우주정거장 어디 돌고 있냐? 그러면 얘가 찍어준다니까. 내가 뉴욕 가가지고 오늘 볼 수 있는 별자리는 뭐냐? 그러면 이게 가리켜준다니까. 라면의 성분은 뭐냐? 그러면 얘가. 이거 제가 다 찍은 거예요. 라면성분 가르쳐준다니까. 여러분들 앤드게임 보셨습니까? 하도 무슨 여러 놈들이 와서 싸우니까 슈퍼맨하고 헐크가 싸우면 누가 이기느냐 딱 봤더니 어떻게 됐다고요? 얘가 가르쳐준다니까. 그런데 이게 제가 10만원만 해도 내가 핏대를 안 내겠는데 이게 얼마라고요? 3000원. 이게 3000원이라고요. 여기 있는 사람이 누구라고요? 저요. 제가 수학문제 푸는 거예요, 이거. 학생들이 저 찍어준 거예요. 나도 퇴출이다. 나도 퇴출인 거예요. 나부터 퇴출이다. 과학기술부터 퇴출이야. 이것만 있냐? 여러분들 빌바오라는 데가 굉장히 쇄락한 도시인데 여기가 스페인의 도시예요. 그런데 여기가 조선업도 쇠퇴하고 우리나라 군산같이 된 거야. 그런데 여기 뮤지엄을 지어가지고 여기가 문화도시로 탈바꿈됐다는 거예요. Guggenheim museum을 지었는데 보시다시피 이렇게 생긴 게 이상하죠. 이걸 Frank Gehry라는 사람이 지었어요. Frank Gehry가 지은 건물은 다 다음과 같이 트위스트가 되고 꼬이고 비틀어져 있어요. 그래서 이게 MIT의 STATA 센터라는 거예요. STATA 센터가 여기가 이렇게 생겼어요. 제가 이제 MIT에서 공부했는데 이거 딱 가보면 저는 이거 딱 보면 무슨 생각나는 줄 아세요? 이거 안 무너지냐? 우리 구조역학 공부했으니까 안 무너져. 그런데 Frank Gehry가 어느 날 스케치를 이렇게 하고 이 양반이 술 드셨는지 모르겠지만 이렇게 한 다음에 이렇게 해 가지고 이걸 밑에 건축사무소에 던져줬더니 이 사람들이 이 소프트웨어 플랫폼을 써 가지고 이게 이렇게 변하더니 이렇게 변하더니 이렇게 돼 가지고 이렇게 됐다라는 거잖아요. 그래서 여러분들 파리 가시면 이게 루이비통 파운데이션이라는 거예요. 이게 어떻게 됐다고요? 여기서 나왔다니까. 여기서 이게 이렇게 됐다니까. 그러면 이걸 이렇게 할 때 여기서 무슨 공과대학에서 구조역학 배운 애가 이거 풀었는지 아세요? 천만의 말씀. 소프트웨어 쓸 줄 아는 사람이 이거 빠르게 풀었다는 거예요. 요새는 문제를 푸는 게 아니라 어떻게 한다고요? 문제를 빨리 해결한다는. 빨리 해결하는데 도대체 수단, 방법을 가리지 않고 답을 아는 지구 반대편 사람한테 연락을 하든지 플랫폼으로 풀든지 그러는 거예요. 옛날에는 문제를 잘 푸는 놈이 장땡이었는데 요새는 어떻다고요? 문제를 빨리 해결하는 놈이 장땡이라고요. 저한테 빨리 끝내라고 저기서 계속 얘기하는데 이런 거예요. 제가 학부에서 학생들 가르쳐요. 그러면 공과대학에 5대 역학이 있어요. 열역학, 유체역학, 구조역학, 뭐 다 있어요. 그럼 이제 A플러스를 받았다고 학생들이 이러는 거예요. 교수님, 제가 그런 거 다 A플러스 받았는데 요새 취직이 안 돼요. 그럼 저는 뭘 하면 돼요? 너 A플러스 다 받았으니까 이제 너를 하려면 너희 회사 사장님이 너 쓰려면 적어도 2천만원대 후반, 3천만원대 초반 줘야 되지 않겠냐? 그런데 네가 안 줘가지고 누군가는 답을 하는 그 문제만 쭈구리고 앉아서 풀면 네가 사장님이면 네가 너를 쓰겠니 아니면 3,000원짜리 앱 사겠냐. 앱 사지. 세상이 완전히 바뀐 거예요. 우리만 모르고 있다니까, 지금? 그래서 뭘 해 줘야 된다고요? 이런 것을 도서관에서 대출하면서 문제를 빨리 해결하는 방법을 가르쳐줘야 된다. 그래서 결국 도서관이라는 것은 무엇이냐. 여태까지 새로운 경험을 제공하는 공간이어야 된다. 새로운 경험을 제공해야 된다. 여러분들 스타벅스가 커피맛이 맛있어서 갑니까? 새로운 경험을 제공하는 공간이기 때문에 가는 거예요. 새로운 경험이라는 것은 아까 제가 딱 들어가면 제가 무슨 커피를 먹는지 알고 이미 나의 개인정보는 거기에 다 있으며 그래서 새로운 경험을 하는 이러한 크리에이티브 스페이스가 돼서 책도 드론으로 날라주고 그래서 이렇게 하는 것이 도서관이 디지털화가 되는 것이고, 그래서 디지털화가 되면 데이터가 모이고 데이터를 분석하는 그러한 알고리즘이 있어야 되고 이렇게 되면 결국은 도서관도 진화한다. 그래서 마지막 말씀 드리면 제가 아까 뭐라고 했어요. 산사에 계신 스님, 중국의 거지 그 다음에 일본의 호프집 사장도 4차 산업혁명에 적응하지 않고서는 절대로 살아남을 수 없다. 당연히 도서관도 4차 산업혁명에 꼭 적용하라는 말씀을 드리면서 제가 강연을 마치겠습니다. 고맙습니다.



주제토론: 4차 산업혁명시대와 초연결사회

토론: 최광남 한국과학기술정보연구원(KISTI) NTIS센터장
동영상에 대한 자막정보
최광남: 안녕하세요. 저는 Kisti NTIS센터의 최광남 이라고 합니다. 앞서서 이민화 교수님이나 김창경 교수님이나 너무 발표를 잘하시는 분들 뒤에 토론을 하라고 하셔서 정말로 많은 부담이 됩니다. 또 사실은 김창경 교수님의 자료를 못 받고 토론준비를 이렇게 하라고 준비를 들었습니다. 그래서 나름대로는 많이 다른 분들하고 안 겹치는 부분에 대해서 잠깐 얘기를 하려고 합니다. 앞에서도 얘기가 있었지만 지금 4차 산업혁명시대라고 많이 얘기들 합니다. 많이 얘기들 하는데 미국의 NSF를 보면 NSF에 헬렌 길(Hellen Gill) 박사, 이분이 예전에 CPS라는 사이버 물리시스템이라는 것을 얘기를 했는데 이것은 현실세계하고 어떻게 보면 가상세계랑 하나가 완전히 일치화되는 것이 우리가 얘기하는 CPS라고 2006년도에 이렇게 얘기를 했습니다. 그림에서 보시는 것처럼 이러한 하늘을 나는 비행기부터 흐르는 물, 사람, 개 모든 것들이 이렇게 다 실질적으로 연결되고 현실과 또 이러한 가상이 서로 어떻게 사람의 간섭이 없이도 이렇게 완전한 이 연결되는 세계를 CPS라고 하고 이것이 이제 미국에서는 GE를 중심으로 하는 디지털 트윈이 하나인 것이 된다고 볼 수 있습니다. 이 부분을 고민하든지 세부적으로 보면 이런 거죠. 앞에서 많이 얘기하신 것처럼 첫 번째 많은 데이터들. 지금 IOT나 여러 가지 모든 디바이스로부터 이러한 데이터들이 수도 없이 쌓이는 우리나라 그동안 쭉 AI, 알파고라는 것이 나오기 전에 많이 얘기했던 빅데이터. 그러니까 빅데이터를 분석하는 것을 그런 것에 의해서 결국 빅데이터를 가지고 어떤 알고리즘을 써서 모델링을 해서 이렇게 또 실제 가상세계에 반영하는 이러한 것을 볼 수가 있습니다. 저희가 쉽게 아까 기조강연 들으셨으면 앞에서는 내비게이션 자체가 어떻게 보면 이러한 디지털 트윈의 하나다 라고 얘기를 하셨는데 우리가 우리나라에서 가장 돈을 많이 번 중소기업 중에 하나가 지금 중소기업이 아닐 텐데 골프존 있죠. 저희가 가상 골프 치는 것. 그것도 어떻게 보면 저희가 얘기하는 이러한 CPS 중에 가장 초보적인 단계라고도 볼 수가 있을 것입니다. 이것은 많이 알려진 것처럼 지금 현재 2019년도에 지구상의 인구는 77억 정도가 된다고 합니다. 77억 정도가 되는데 내년에 보이는 예상되는 IOT 이러한 개수가 500억 개 이 정도가 된다고 예측을 하고 있고요. 또 이 부분 다른 측면에서 보면 지금 IOT 관련해서 벤처스캐너라는 이러한 곳에서 분석을 해 보니까 약 2,245개의 이런 스타트업들이 약 81년 정도의 투자를 지금 받고 있다고 합니다. 그 중에서 보면 소프트웨어 플랫폼, 사교육 플랫폼, 자동차 그다음에 금융 그다음에 피트니스, 의료. 모든 분야가 사실은 이렇게 많은 벤처기업들이 투자를 받고 있고 많이 생성이 되고 있는 그러한 상황입니다. 지금 우리가 보는 IOT 라이프 사이트레이닝 소노스 같은 경우에는 지금 저희가 많이 본 스피커를 만드는 그런 기업들이고, 여기가 뒤쪽에서 한번 얘기를 드리겠지만 작년에 기업공시를 했는데 여기가 첫 번째 기업공시를 한 게 100억달러. 100억달러로 기업공시를 했습니다. 2018년도에 많은 이러한 구글 트렌드를 살펴보면 IOT라는 트렌드를 가지고 살펴본 그런 어떤 변화에 대해서 많은 꼭짓점에서 보면 여기서 보면 소노스라는 이런 스피커 만드는 회사에서는 IPO를 선호했는데 처음에는 100억불 이 정도로 했고 캘리포니아에서는 벌써 첫 번째로 IOT 사이버보안쪽 관련된 법을, 법제를 갖고 또 베리진이라는 곳에서는 벌써 미국에서 4개 주에 벌써 5G 상용화를 시작을 했고 여러 가지 이러한 사항들이 발생을 하고 있습니다. 그런데 이렇게 많은 기업들. 스타트업들도 생기고 이렇게 보면서 결국 글로벌 IOT 마켓 자체가 모든 분야에서 엄청나게 이렇게 성장하고 있는 것을 볼 수가 있습니다. 재미있는 것 중에 세계적인 톱 15번째 글로벌 브랜드 랭킹을 이렇게 보여주는 사이트가 있습니다. 거기서 변화를 저희가 살펴보면 2008년만 해도 전세계에서 가장 브랜드 이미지가 높은 데는 코카콜라였습니다. 그 밑에가 마이크로소프트고요. 그런데 2012년도가 돼서 맨 밑에 15번째의 애플이라는 곳이 이렇게 처음 나타났고 여기 여전히 코카콜라가 1위의 가치를 가지면서 IBM이 두 번째로 계속 올라갔습니다. 그런데 2013년에 벌써 보면 애플이 2년 만에 앞에서도 스마트폰이라는 것 때문에 애플이 2년 만에 전세계에서 가장 높은 브랜드 가치를 갖는 그런 기업이 되었고 그다음에 구글이라는 곳 그다음에 여기에 삼성이라는 우리나라의 기업이 한군데가 가치를 나타내고 있고 2018년, 작년 기준으로는 애플과 구글 그리고 아마존, 마이크로소프트 이러한 IT기업들이 다 상위를 차지하고 있습니다. 그런데 앞에서도 얘기한 것처럼 아마존이 IT기업은 아니지만 사실은 왜 그러한 부분에서 가장 좋은 것을 가졌냐는 측에서 아마존이 가지고 있는 데이터를 잘 찾아서 모든 것을 다 파는 그런 나라가 됐기 때문입니다. 스캇 갤러웨이라는 교슈가 쓴 The four라는 책에서 이렇게 보면 이런 아마존이나 애플이나 페이스북 그리고 구글이 어떤 DNA로 이렇게 성공했나라는 것을 설명을 하고 있는데 그것 중에 가장 큰 게 AI. 결국은 빅데이터를 어떻게 수집하고 또 이것을 어떻게 분석했느냐를 가지고 얘기를 하고 있습니다. 그 중에서 보면 구글은 일단 전세계 정보를 모아서 정리한다는 그러한 구호 아래 그리고 페이스북은 전세계를 연결한다는 구호 아래 많은 데이터를 이렇게 갖고 있습니다. 그리고 아마존 같은 경우는 우리는 세계 최고의, 최대의 상점이다라는 것을 가지고 있고요. 여기서 3억명 이상의 신용카드 정보와 구매 데이터를 가지고 이런 것들을 가지고 있고 애플은 자타공인 세계 최고의 비전을 갖는 그런 회사다 해서 여기는 10억명 이상의 이러한 카드 정보를 보유하고 있고 여기서 얘기하는 향후 애플페이라든지 이런 것들 가지고 성장을 하려고 하고 있습니다. 이것은 조금 더 자세히 살펴보면 이렇게 되고 있습니다. 구글, MS, IBM, 아마존, 애플, 페이스북 이런 데가 많이 결국은 앞에 있는 것처럼 보면 결국은 자신들이 수집한 그러한 많은 빅데이터를 가지고 어떠한, 결국은 여기서 얘기하는 알파고라든지 코타나, AI 음성서비스죠. 그리고 왓슨, 알렉사, 시리, 딥페이스 이러한 등등의 대표브랜드를 갖기 위해서 이러한 AI기술. 텐서플로우 딥러닝이라든지 루이스, 왓슨의 헬스, 렉스, 폴리 이러한 알고리즘을 가지고 자체적으로 이런 분석을 해서 그러한 지금 위의 브랜드 랭킹을 갖는 기업들이 등장한다 생각하고 이러한 IT기업들이 IT만 하는 게 아니라 사실은 전 산업 전 분야를 다 한다고 그렇게 볼 수가 있겠습니다. 이것은 올해 국제가전박람회에서 우리나라 같으면 LG나 삼성이 가전부문에서 굉장히 많은 부분을 선도한다고 그랬는데 중국의 하이얼이라는 가전회사에서 듀오세탁기를 이렇게 만들어서 아마 세계 최초로 이러한 세탁기를 만들었다고 합니다. 만들었다고 하는데 여기 같은 경우는 2016년도에 GB의 가전부문을 AI했고 19년도에는 이탈리아에 있는 캔디그룹이라는 것을 M&A를 했습니다. M&A 해서 결국에는 여기에 있는 것들을 보니까 중국의 6,500만명의 데이터를 유저를 가지고 있고 유럽의 400만명, M&A 하면서 얻은 데이터를 가지고 분석을 해 보니까 많은 사용자들이 65%가 빠른 세탁코스를 이용하고 이런 부분을 해서 여기 2개의 모델에서는 9단계의 빠른 세탁코스를 별도로 이렇게 개발했고요. 이것이 선풍적인 인기를 끌 수 있다고 이렇게 얘기를 하고 있습니다. 결국은 그 IOT뿐만 아니라 모든 것들이 다 연결되는 곳에서는 결국은 이러한 저희가 얘기하는 빅데이터. 이런 것들을 분석하는 그런 능력이 어떻게 보면 가장 필요로 하고 있는 그런 부분이 아닐까, 감히 또 얘기를 하고 질의는 나중에 드리는 걸로 하겠습니다.



인공지능과 데이터

발표: 전상현 마인즈앤컴퍼니 파트너
동영상에 대한 자막정보
전상현: 저는 아까 많은 소개를 해 주셨는데 간단히 말씀드리면 기업들에게 AI를 가지고 어떻게 혁신하는지에 대해서 도와드리고 더 구체적으로는 제가 인공지능을 이용해서 데이터를 분석하는 서비스를 주로 사업을 진행하고 있습니다. 그래서 오늘은 전 세션에서 앞으로 어떻게 큰 변화들이 있을 것인지, 그다음에 도서관차원에서의 계획도 많이 들으셨기 때문에, 현실적으로 지금 필드에서 어떠한 혁신들이 발생하고 있는지 중심으로 그리고 AI데이터가 조금 구체적으로 어떤 내용인지 중심으로 간략하게 설명을 드리겠습니다. 사실 큰 얘기인데요. AI가 파괴적인 혁신이고 이런 부분, 어떤 혁신이 될 건지 아까 일전에 이민화 교수님의 명강의에서 아마 많이들 배우신 게 있을 것 같습니다. 저도 굉장히 많이 배웠는데요. 앞으로 AI가 세상을 어떻게 바꿀 거냐에 대한 의견이나 예측은 굉장히 많이 있습니다. 그런데 저는 잘 모르겠습니다. 저는 구체적으로 잘 아직 이민화 교수님만큼 말씀은 못 드리겠고, 제가 지금 자문하고 있는 회사들, 재벌그룹에서도 사장단들을 AI 혁신에 설득하고 끌어들이기 위해서 AI가 어떻게 세상을 바꾸고 회사를 바꿀 건지에 대해서 끊임없이 설명과 사례 찾기를 요구하고 있습니다. 그런데 그런 부분들을 찾는 것도 되게 중요합니다. 그런데 제가 여기저기 가서 큰 이야기들을 듣다 보면 그런데 진짜로 그렇게 AI로 인한 혁신이 발생할 거야라는 궁금함이 좀 있습니다 . 제가 보여드릴 부분은 손정의 소프트뱅크 회장이 작년 아마 3분기 IR 보고에서 설명을 했던 내용입니다. 많이들 보셨을 사진이에요. 그러니까 마차와 차가 등장했을 때 얼마나 혁신이 파괴적으로 순식간에 일어났는지에 대한 예시입니다. 1900년도임에도 불구하고 13년 만에 말이 전부 다 차로 변하는 아주 파괴적인 혁신이 실제로 발생을 하죠. 그러면서 도시생활도 다 바꿔버리고 지금으로 치면 약간 연상되는 게 택시와 공유경제, 공유차량 서비스 이런 것들이 생각이 나기는 하는데요. 손정의 회장은 이 얘기를 하면서 어찌됐건 AI혁신이라는 건 발생할 텐데 이만큼 파괴적인 혁신이 될 것이다 라고 주의를 환기하고요. 그런데 이분이 더, 제가 굉장히 인상 깊게 봤던 부분은 이게 정말 필연적으로 발생할 수밖에 없는 미래다 라는 이야기를 아주 단순화한 개념을 가지고 하고 있습니다. 여기 보시는 게 첫 번째는 CPU, GPU고 두 번째는 메모리용량이고 세 번째는 통신속도입니다. 인공지능을 사람에 굉장히 비유적으로 많이 비유를 하지 않습니까? 예를 들어서 뇌를 놓고 봤을 때 CPU나 GPU는 처리하는 속도에 관련이 될 것이고요. 그다음에 두 번째로 메모리는 기억하는 용량에 관련이 될 것이고, 세 번째는 신경전달속도 라고 봐도 되고, 연결될 때 왔다갔다 정보를 주고받는 속도로 비유를 할 수 있을 것 같습니다. 커뮤니케이션하는 속도. 그렇게 되면 과거 30년 동안 이 사람이 굉장히 단순화해서 얘기한 건 각각이 과거 30년 동안 100만배가 발전을 했대요. 그리고 앞으로 30년 동안 과거 30년보다 더 당연히 많이 할 텐데 기본적으로 100만배씩은 증가할 거라는 거죠. 그러면 사람이 앞으로 100만배 정도 정보를 잘 처리할 수 있고 더 많이 기억할 수 있고 더 빠르게 커뮤니케이션할 수 있게 되면 반드시 AI로 인한 혁신은 도래할 수밖에 없다라고 아주 심플하게 결론을 내버립니다. 그러니까 이게 진짜로 도래할 거야? 어떤 모양인지 확실해? 이런 얘기를 할 것도 없어요. 지금까지 이게 변화를 이끌었고 앞으로 분명히 발전할 것이기 때문에 변화는 온다라고 단언을 합니다. 또 이제 고수들은 단순화를 잘하는데 이분이 또 단순화해서 얘기한 것이 아까 4차 산업혁명에 대한 개념화도 굉장히 훌륭한 사례를 봤습니다마는 비즈니스하는 사람의 입장에서 부가가치쪽으로 보는 거죠. 처음에 농업이나 어업이나, 이런 부분이 있고 그다음에 공업의 산업혁명이 있고 이 사람이 그다음으로 정의한 건 인터넷에 대한 혁신입니다. 그다음에 이제 AI를 위에다 올려놨고요. 개인적으로 그분이 자꾸 하는 말이 본인이 10년 전에 인터넷 혁신에 대해서 지금의 AI처럼 좀더 관심을 가지고 봤으면 돈을 더 투자해서 훨씬 큰돈을 벌었을텐데 너무 아쉽다, 이런 얘기를 한다고 합니다. 그 얘기를 여기도 하면서 그런데 지금 자기는 AI의 혁신을 보고 있기 때문에 AI에다가 어떻게든 더 많은 돈을 투자할 거다. 아시죠, 다들? 100조원의 펀드를 만들어서 비전펀드를 운영을 하고 있고 이 이야기를 한 다음에 최근에 100조짜리를 또 하나 만들었죠. 그래서 어떤 방향으로 AI가 혁신될 것이냐. 좋은 이야기들 많고요. 그다음에 손정의 회장의 인사이트는 반드시 이것은 도래할 것이고, AI 혁신은 현실화가 될 것이다라는 부분을 사실 AI 혁신을 매개로 비즈니스를 하고 있는 저한테도 굉장히 인상 깊은 인사이트였기 때문에 좀 보시기 어려운 내용 같아서 이쪽에다 포함을 시켜서 이걸로 시작을 했습니다. 너무 먼 얘기만 했고요. 그러면 단기적으로, 중단기적으로 발생하는 기술혁신들 우리가 여러 가지 테마들을 주로 꼽는데, 거기에 AI가 진짜로 많이 영향을 미치고 있나? 간단하게 Gartner에서 선정하는 Strategic technology Trend라고 해서 어떤 게 전략적으로 굉장히 중요한 트렌드인지 선정하는 것들을 살펴봤습니다. 이게 2018년도에 선정한 2019년도 사례인데 첫 번째가 Autonomous Things라고 해서 자율주행차건, 아까 무인드론 얘기도 말씀하셨는데, 자율적으로 운행하는 기계나 장치들이 첫 번째고, 두 번째 Augmented Analytics는 데이터 분석에 대한 부분입니다. 인공지능을 가지고 제가 데이터 분석을 하는 서비스를 하고 있다고 말씀드렸는데 바로 그 부분이 여기에 해당하는 부분이고요. 그다음에 AI-driven Development는 이것은 소프트웨어 개발에 대한 문제예요. 소프트웨어 개발도 AI가 옆에서 너는 지금 신텍스가 틀린 것 같아 아니면 이런이런 목적의 코드를 개발하고 싶어라고 하면 드래프트를 해 준다든지 아주 간단하고 반복적인 코딩은 AI가 대신한다든지 이런 부분들이 지금 이렇게 중요한 트렌드로까지 올라와 있습니다. Empowered Edge도 사실 Edge Computing 개념에서 AI와 밀접하게 연결이 돼 있고요. 그다음에 Smart Factory, 이런 부분을 다 포함하는 Smart Spaces라는 부분도 같이 올라와 있습니다. 결론은 굉장히 여러 가지 테크놀로지 트렌드를 단기적으로 예측하고 있는데, 이것들 중에 상당히 많은 부분이 AI와 밀접하게 연관돼 있고, 아주 깊은 AI의 발전을 전제로 하고 있다는 점에서 AI의 혁신이 도래할 것이고, 또 지금 이미 발생하고 있는 혁신에 스며들어 있다라고 한번 짚고 넘어가고 싶었습니다. 여기까지 큰 얘기고요. 제가 이제 오늘 말씀드릴 부분 중에 또 하나 중요한 부분은 AI와 데이터입니다. 아까 데이터 경제에 대한 얘기도 나왔고, 클라우드 위에 데이터를 올려놔서 고속도로를 만들고 이런 부분들에 굉장히 큰 얘기들도 많이 나와주셨는데요. AI와 데이터가 도대체 무슨 관계냐를 제가 간단하게 설명드릴 수 있을 것 같아서 이 도표를 가지고 왔습니다. 이쪽에는 ALGORITHMS이 있고요. 이쪽에는 INFRASTRUCTURE가 있고 이쪽에 DATA가 있습니다. 얼마 전에 구글이 정말 사람같이 대화를 생성할 수 있는 AI 엔진을 만들었어요. 그래서 그걸 공개를 했습니다. 그런데 그게 어떻게 만들어졌냐 하면 일단 알고리즘 측면에서 버트라는 아주 신기술, 정말 연구의 끝단을 달리는 신기술을 중심으로 굉장히 여러 가지 알고리즘들을 조합해서 대화를 생성하는 기술을 만들었고요. 그다음에 그걸 구글이 보유하고 있는 굉장히 방대한 대화데이터들을 실제로 그 알고리즘에 훈련을 시켜서 그 과정 중에는 정말 많은 GPU 학습이 필요하고 훈련을 하기 위한 적절한 소프트웨어, 하드웨어 인프라가 필요하겠죠. 이 3가지 요소를 잘 조합을 해서 결국 사람같이 말하는. 예를 들어서 미용실에다가 예약을 하는 보이스 에이전트를 가상으로 만들었는데 그것의 예약을 실제 수행한 직원들이 이게 사람인지 아니면 가상에이전트인지 구분을 못하는 정도의 수준의 엔진들을 구성을 하는 겁니다. 저희는 이런 형태의 사람의 어떤 기능이나 특정요소를 AI가 수행하는 것을 AI엔진이라고 부르고요. 그 안에 알고리즘과 데이터가 가장 큰 핵심적인 역할을 하고 있다고 보고 있습니다. AI데이터. 데이터가 없으면 사실 AI는 아까 보신 대로 작동을 하기가 되게 어려운데 자율주행에 대한 얘기가 많이 나오고 있습니다. 자율주행에 대한 부분, 어떤 AI 학습데이터가 필요한지 작은 글씨로 굉장히 많이 써 있습니다. 당연히 차선도 구분해야 되고, 저게 사람인지 전봇대인지 알아야 되고, 실제 주행을 할 때 어떻게 컨트롤해야 되는지. 간단하게 생각하시면 저희가 운전을 할 때 도로를 보고, 가속도를 느끼고, 판단을 하고, 이런 부분들이 다 데이터로 AI를 학습시켜야지 실제 작동할 수 있는 모델들이 되는 겁니다. 그만큼 AI는 중요합니다. 거기다 더 나아가서 기술적인 판단뿐만이 아니에요. 윤리적인 판단도 AI에 데이터로 학습시켜야 됩니다. 아마 많은 분들, 관심 있는 분들은 아실 텐데 미국의 어떤 대학교에서 설문조사를 다하고 있어요. 그게 일련의 자율주행차에 내가 탑승했다고 볼 때 자율주행차가 어떤 윤리 우선순위를 가져야 되느냐를 설문을 조사하고 있습니다. 굉장히 긴 설문인데 되게 재미있어요. 기회가 되시면 한번 해 보면 좋겠습니다. 그러니까 운전자가 어느 정도 우선인지, 운전자가 어쩔 수 없이 사고를 피할 수 없을 때 사람을 칠 거냐 고양이를 칠 거냐, 이런 아주 간단한 질문부터 시작해서 훨씬 더 복잡한 윤리적인 부분까지 고려하는 설문을 하고 있어요. 그것 왜 하느냐. 그게 AI데이터예요. 그러니까 논리적이나 윤리적으로 딱 끊어서 이야기하는 것도 방법이겠지만 그런데 그것은 AI라고 할 수 없고 그냥 룰이고요, 규칙이고요. 이런 부분에 AI윤리를 작동시키기 위해서 현실세계의 사람들의 데이터를 모으고 있는 겁니다. 그래서 그 데이터로 학습하면 이제 어떤 종류의 윤리적인 판단을 하는 AI가 탄생을 하겠죠. 그렇게 데이터는 사실 AI의 기능뿐만이 아니고 성격이나 밸류도 굉장히 크게 좌지우지를 합니다. 자율주행차 얘기가 나왔으니까 조금 더 진행을 하면 자율주행차 굉장히 큰 주제잖아요. 벤츠하고 BMW하고 같이 합작회사를 만들고 마이크로소프트나 구글이나 각자 진영을 만들어서 크게 전세계적인 기업들이 합종연횡하고 기술개발이 여러 군데에서 발생을 하고 있습니다. 그런데 지금 다 너무 큰 회사들만 있어요. 그러니까 작은 회사나 굉장히 빠른 혁신들이 움직이기에는 아까 말씀드린 데이터들을 어디서 구할 수도 없고 돈 들여서 만들 수도 없고 확보가 굉장히 어렵습니다. 그러면 큰 회사들 안에서 그냥 경쟁이 되는 거예요. 구글이 가진 데이터 어디가 또 가질 수 있겠습니까? 한국으로 치면 네이버가 가진 데이터를 다른 데서는 가질 수가 없어요. 그러다 보니까 이런 형태의 UC버클리에서 산학협동으로 굉장히 의미 있는 규모의 자율주행하고 관련된 데이터세트를 만들어서 공개를 합니다. 그렇게 하면 예를 들어서 저희 회사도 굉장히 괜찮은 자율주행에 필요한 특정기능을 구현할 수 있는 알고리즘을 수학적으로 개선할 수 있는 방법을 저희가 찾았어요. 그러면 이게 진짜로 개선이 되는지, 안 되는지는 여기 있는 데이터를 얻어서 학습을 시켜보고 벤치마크에 비해서 좋다, 나쁘다를 판단을 해야 되고 만약에 그게 진짜 좋다면 저희가 갑자기 어떤 엔진을 만들어가지고 이 자율주행 전장에 뛰어들 수가 있는 거예요. 그만큼 데이터를 만들어서 공개함으로써 얻는 효과가 굉장히 많아집니다. 바로 전 세션에서 허용범 관장님께서도 단순히 데이터를 디지털 이전하는 것뿐만 아니고 공개하고 공유하는 게 중요하다는 말씀하셨는데 정말로 AI데이터에서는 이런 형태의 데이터를 만들어서 공개하는 것이 실제로 큰 효과를 발휘할 수가 있습니다. 또 하나 공개의 효과가 있습니다. 지금 복잡하게 좀 써있는데 Stanford Question Answering Dataset이라고 SQUAD라고 저희가 부릅니다. 저희 회사가 이따가 보여드릴 예시 중에 하나인데, Q&A엔진이에요. Q&A엔진인데 질문과 답을 미리 입력해 놓은 게 아니고, 그다음에 어떤 답이 있는 문서를 미리 학습한 것도 아니고, Q&A엔진을 학습시켜놓으면 새로운 문서를 읽고 그 안에 있는 내용에 대한 질문을 AI가 답을 합니다. 아주 쉽게 생각하면 그냥 중학교 때나 이런 때 시험 때 독해문제라고 보시면 돼요. 지문이 나오고 그 안에서 질문들을 하면 답을 맞히는 그런 AI엔진이 있는데, 딥러닝기반으로 학습할 수 있는. SQUAD라는 데이터세트는 시험문제 같은 거예요. 그러니까 어떤 연구소건 아니면 저희 같은 기업이건 SQUAD 데이터세트를 가지고 저희의 모델을 학습시켜서 Q&A엔진을 만듭니다. 그다음에 그 엔진을 제출하면 스탠포드에서 그걸 채점을 해서 결과를 발표해요. 그러면 이게 마이크로소프트 중국 연구소, 아니면 뜬금없이 갑자기 저희 회사, 아니면 어디 대학교의 연구진들, 이런 데가 리더보드에서 싸움을 하기 시작해요. 그러면 정말로 이 데이터세트 하나를 가지고 Q&A엔진이라는 것의 기술발전이 서로 경쟁적으로 표준을 가지고 이루어지는 거예요. 이것도 AI데이터를 잘 만들어서 공유할 때 발생할 수 있는 핵심입니다. 이게 지금은 한국에 한국어버전으로 유사한 개념으로 만들어져서 아마 LG CNS에서 강원대 이창기 교수님하고 만들어서 한국어 Q&A엔진에 대해서 유사한 리더보드를 운영하고 있고, 예상하시다시피 카카오와 네이버가 엎치락뒤치락 잘 싸우고 있습니다, 제일 톱레벨에서. 이런 형태의 구체적인 AI데이터들을 정부에서는 실제로 많이 돈을 주고 만들기도 합니다. 예를 들어서 저희가 지금 실제로 수행하고 있는 프로젝트인데요. 마인즈랩에서 한국정보화진흥원하고 같이 진행하는 프로젝트입니다. CCTV 영상을 가지고 이상행동을 잡아내는 기능을 만들기 위해서는 어떤 것이 이상행동이다라고 레이블이 달린 데이터세트가 굉장히 많이 있어야 됩니다. 그래서 정상행동은 이것이고, 이것은 이상행동이야. 이상행동이면 어떤 종류의 이상행동인가. 이게 싸움하는 장면인지, 뭔가 절도를 시도하는 장면인지, 이런 부분들에 대한 사람이 달아주는 정답이 지금 기술에서는 굉장히 필요해요. 그래서 그것을 실제로 연출을 해서 찍기도 하고 아니면 유튜브나 이런 데 저작권의 문제가 없는 영상들에 저희들이 직접 답을 태깅하기도 하고 일부는 저희가 가진 기술을 가지고 자동태깅을 적용해서 나중에 검증을 해서 써보기도 하고 온갖 방법을 동원해서 어떻게 하면 더 많고 효율적인 AI데이터를 만들지를 고민을 해서 프로젝트를 진행하고 있습니다. 이렇게 하면 저희도 영상인식과 관련된 비즈니스를 하고 있기 때문에 여기서 나오는 데이터를 가지고 저희도 저희 엔진의 성능을 향상시킬 거예요. 그것 말고 더 이 데이터가 공개가 되면 AI 전문기업만 AI서벨런스 할 수 있고 이런 거 아니잖아요. 기존에 이미 CCTV를 하고 있거나 보안관제를 하고 있는 업체들도 이 데이터세트가 있고, AI엔지니어를 모아서 본인들의 모델을 만들고 싶으면 그 모델을 만들고 AI로 무장한, 시큐리티 회사도 한 단계 더 도약을 할 수 있는 거죠. 그래서 그런 토대가 된다는 점에서 공공적인 측면에서도 AI데이터를 만들고 공개하는 활동들이 활발하게 이루어져 있고, 상당 수준의 예산이 여기에 투입이 돼서 진행이 되고 있습니다. 디지타이즈하고 이것을 활용한다. 제가 국회도서관과 도서관 대표님들이 모이신 자리이기 때문에 한번 생각을 해 봤는데 논문 안에 그리고 책 안에 단순히 텍스트로만 넘기는 것 말고도 굉장히 의미적으로도 뽑아내서 디뷰할 수 있는 정보들이 많습니다. 이제 그런 것들을 단순히 디지타이즈하는 것을 넘어서 AI가 읽고 예를 들어서 아까 전에 제가 말씀드린 Q&A엔진 같은 것들이, 실제로 읽고 그 안에서 주제들을 뽑아내서 재정리하는 것도 현재 기술로도 시도할 수 있어요. 광범위하게 적용했을 때 얼마나 효과적일 것이냐는 조금 이슈가 있습니다마는. 그런 것들이 정말 AI가 책과 논문자료를 읽고 의미 있는 데이터들을, 정보들을 뽑아서 데이터화하면 그것이 이제 아까 전에 말씀드린 어떤 다른 AI데이터가 되기도 하고, 다른 데서 가치 있게 쓰일 수 있는 빅데이터가 되는 그런 부분에 정말 보물 같은 원천을 가지고 있는 곳이 도서관이라고 저는 생각을 합니다. 그래서 AI의 데이터가 얼마나 중요한지, 지금 도서관에 있는 많은 자료들을 데이터로 넘기고 디지털화만 하는 것이 아니고, 정말 이것과 AI혁신에 활용될 수 있게까지 잘 몰고 간다면 정말 더욱더 큰 밸류를 낼 수 있다고 저는 확신을 하고 있습니다. 여기까지 AI데이터에 대해서 말씀을 드렸고요. 그다음에는 저희 회사가 보유하고 있는 기술과 실제 사례들을 중심으로, AI가 진짜로 현실에서는 어떤 것들 할 수 있어라는 것에 대해서 조금 저희 관점의 안내를 드리려고 합니다. 마인즈랩이라는 회사는 기본적으로 저희도 정부가 투자한 앱들이라는 기관에서 음성인식과 관련된, NLP와 관련된 기술을 전수받아서 그것을 가지고 상용화하는 것으로 시작한 회사입니다. 그런데 지금은 단순히 NLP, 자연어처리뿐만이 아니고, 음성인식과 자연어처리뿐만이 아니고, Q&A엔진이나 영상인식, 이런 부분에 각종 AI엔진 기술들을 구현해서 그것을 플랫폼으로 만들어서 컨텍스센터, 콜센터 솔루션을 만든다든지 아니면 Smart Factory에 활용한다든지 아니면 로봇과 결합해서 AI로봇을 만든다든지 하는 여러 가지의 비즈니스 용례들을 만드는 플랫폼 회사를 지향하고 있습니다. 그래서 아까 전에 알고리즘도 말씀드렸고 엔진이라고 말씀드렸는데 실제 마인즈랩은 이렇게 정리를 하고 있습니다. 시각엔진, 그다음에 음성인식엔진, Q&A엔진 이런 것들을 클라우드 위에 올려놓고 API 형태로 접속해서 활용할 수 있게 만들어놓고 있습니다. 그러나 이런 요소 엔진들을 가지고 조립해서 어플리케이션을 만드는 것이죠. 이게 컨택센터 어플리케이션이 될 수도 있고 챗봇 어플리케이션이 될 수도 있고 아니면 새롭게 만드는 인공지능스피커에 들어가는 어플리케이션이 될 수도 있습니다. 그래서 이런 요소기술들을 가지고 실제 현장에 적용을 하고 있는 회사다라고 말씀드릴 수 있습니다. 몇 가지 좀 예시적인 내용들을 보여드릴게요. 그러니까 저도 이렇게 강연을 많이 보고 다니고 또 이렇게 사례들을 보면 저게 진짜 되는 건지 아닌지 좀 헷갈릴 때가 있어요. 그런데 저희는 정말로 안 되는 걸 된다고 하면 사실 비즈니스가 조금 팔리다가 망하고요. 그리고 만약에 정말 재미없고 그게 뭐야 하는 것을 팔고 다니면 팔지도 못하고 망합니다. 그래서 아슬아슬한 줄을 타면서 이제 사업을 지속을 해 가고 있는데 그런 측면에서 봐주시면 좋을 것 같습니다. 아까 전에 말씀드린 MRC라고 Machine Reading Comprehension이라고 SQUAD 데이터세트 같은 것들을 써서 AI가 지문을 읽고 답변을 해 주는 엔진입니다. 이걸 Q&A엔진으로 구현을 한 것입니다. 동영상 재생이 안 되는 것 같습니다. 넘어가보겠습니다. 제가 말로 설명드릴게요. 이게 제가 실제로 고객사들한테 제안할 때 어떻게 하냐 하면 제안하는 자리에서 그 자리에서 예를 들어서 제가 어디라고 볼까요? 국회도서관이라고 하면 국회도서관을 네이버에 검색을 합니다. 그러면 국회도서관과 관련된 뉴스가 나오잖아요. 그러면 뉴스를 클릭해서 그걸을 드래그해서 카피한 다음에 저희 MRC엔진에다 넣고 그 안에 있는 항목들을 질문을 입력을 해요. 예를 들어서 국회도서관의 관장님 이름이 뭐야, 이런 질문을 하면 만약에 그 텍스트 안에 관장님의 성함이 적혀 있다면 관장님의 성함을 답으로 뱉습니다. 그리고 만약에 국회도서관이 추진하고 있는 사업의 이름과, 거기에 같이 참여하고 있는 기관, 아니면 예산, 이런 항목들이 기사니까 보통 많이 들어 있잖아요. 그런 항목들에 대해서 명시적으로 자연어로 질문하면 그 부분에 가장 답에 해당하는 문장이나 아니면 단어들을 저희한테 돌려줍니다. 그래서 이게 굉장히 사실 인공지능을 가지고 Q&A쪽의 작업을 해 보신 분들한테는 굉장히 마법 같고 혁신적인 Q&A엔진으로 호소를 할 수가 있습니다. 다만 이제 저희가 실제로 적용을 하다 보면 이게 오답이 나왔을 때 굉장히 부작용이 큰 분야에는 사실 사용하기가 쉽지 않고요. 저희가 여기저기 적용하고 다녀봤을 때 제일 좀 호응이 좋고 실제 사용예가 좋은 데는 기업들 안에 보면 아마 도서관도 마찬가지일 것 같은데 그냥 사소한 Q&A가 굉장히 많잖아요. 콜센터가 따로 있는 것도 아니잖아요, 도서관이나 이런 데 운영을 하려면. 그러면 그것을 내부에서 업무하시는 분들이 하나하나 전화받아야 되고 메일로 회신해야 되고 이런 일들이 굉장히 사실 부담이 되거든요. 일반적인 회사도 마찬가지예요. 인사팀에 있는 혹은 총무팀에 있는 IT팀에 있는 직원들은 그런 문의들을 받느라고 실제로 얼마나 좋은 IT환경을 만들지. 얼마나 좋은 사람들을 리크루팅하지. 이런 것에 집중할 시간을 많이 빼앗기고 있는 거죠. 그런 때 회사의 규정집과 규정을 처리한 사례집들을 뒷단에다가 텍스트 쭉 넣고 저희 MRC엔진으로 들어오는 질문에 답변을 할 수 있게 하고 그것의 인터페이스를 챗봇으로 구현을 하면, 그런 부분들은 사실 아주 단순한 질문들은 많이 해소를 해서 실제 직원분들의 업무량을 좀 고부가치쪽으로 이동할 수 있는 그런 효과들을 보고 있습니다. 이제 점점 더 엔진이 정확해지면 적용할 수 있는 범위나 답할 수 있는 것들이 더 많아지겠죠. 그런 부분들을 기대하면서 저희도 이 부분의 기술개발을 계속 지속하고 있습니다. 두 번째 이제 XDC는 eXplainable Document Classifier라고 했는데, 이거는 될까요? 설명할 수 있는 인공지능이라고 저희가 이름을 붙였습니다. 조금 더 배경설명을 드리면, 이걸 보실까요? 이게 지금 여행기타에 해당하는 주제인지, 항공에 해당하는 주제인지, 사회기타에 해당하는 주제인지를 자동으로 엔진이 판별을 해서 처음 보는 텍스트에 대해서 판정을 내린 거고요. 그런데 이게 자동분류하는 다른 엔진들과 가장 큰 차이는, 이거 꺼주시죠. 어느 부분 때문에 딥러닝 엔진이 그렇게 판단했는지에 대해서 하이라이트된 값들을 보여준다는 게 가장 큰 차이점입니다. 그러니까 딥러닝이 혁신으로 넘어간 다음에는 이 딥러닝 엔진이 왜 그렇게 생각했는지를 알 수가 없다고 해서, 유명한 블랙박스 비유를 하면서 그 부분을 설명할 수 없으니까 현실에서 쓰는 데 굉장히 많은 한계들을 가지고 있다고 지적을 하십니다. 그래서 그런 부분을 극복하고자 하는 노력들이 많이 있고, 그중에 굉장히 초보적인 수준의 노력이 딥러닝의 결과값을 내는 데 어떤 부분이 가장 가중치가 높게 관여를 했는지를 하이라이트에서 보여주는 부분이 있습니다. 그래서 그 부분을 저희가 포함을 시켜서 이번에 실제로 적용한 건 어디에 적용했냐 하면 기업 안에 문서들이 굉장히 많은데 검색엔진에다가 적용을 했습니다. 검색엔진이 지금까지 굉장히 많은 기술발전이 와 있었지만 내부의 문서들의 내용이 어떤 주제다라는 것을 검색의 기준값으로 포함하는 것은 조금 잘 못하고 있던 부분이었어요. 그런데 저희가 챗봇으로 검색엔진을 구현했을 때 앞에서 물어보는 사람의 의도를 파악해서, 이것이 어느 분야의 것이다라고 생각이 되면, 그 분야의 것으로 판별된 문서를 가중치를 높여서 검색엔진의 답으로 주는 그런 형태의 서비스를 구현을 했습니다. 제가 드리고 싶은 말씀이 많아서 굉장히 오랫동안 이야기를 했네요. 그래서 이런 형태로 실제 기업들에게 적용을 하면서 기술의 한계점들을 얼마나 실제 서비스 디자인을 잘하면서 돌파해 나가느냐가 필드에서 저희가 AI기술을 가지고 비즈니스를 하면서 항상 부딪히고 또 푸는데 굉장히 흥미진진한 많은 경험들을 하는 요소라고 말씀드릴 수가 있습니다. 하나은행 사례인데요. 하나은행에 저희가 챗봇을 집어넣어서 엄마한테 1만원 보내줘, 이런 것들 처리하는 챗봇을 오픈을 했고요. 그다음에 Smart Factory쪽에는 분석적인 내용을 서비스화해서 진행을 하고 있고 영상에 대한 인식기술들도 여기 저작권쪽 관련된 논의도 굉장히 많은 것 같은데 저작권보호협회. 이런 곳에 불법영상들을 잡아낼 수 있는, 인식할 수 있는 알고리즘 같은 것들을 개발해서 제공하기도 했습니다. 시간이 없기 때문에 넘어가겠습니다. 그다음에 해피콜. 아까 전에 아주 단순한 업무들은 AI한테 넘길 수 있다고 말씀을 드렸는데 저희가 지금 진행하고 있는 사례는 보험사의 사례입니다. 보험사가 보험을 판매한 이후에 정말로 이해하셨어요, 이 질문을 고객한테 해야 하는 게 법이에요. 그런데 그게 점점 더 복잡해지고 있어요. 아마 조금 있으면 퀴즈도 낼 거예요. 콜센터 상담원들이 전화해서 고객님, 구매하신 상품에서 보장내역이 뭡니까 이런 질문도 할 거예요. 그런 질문을 콜센터가 하게 하려면 그게 또 어마어마한 돈이 듭니다. 그런 부분을 아예 AI가 전화를 해서 음성으로 물어보게끔 답변을 들으면 맞는지, 틀린지 확인하고 또 다른 질문에도 답하고 이런 AI봇을 만들고 있습니다. 이게 아마 저희가 납품하고 있는 회사의 보험을 사신 분들은 아마 하반기 정도에는 실제 그 AI봇의 전화를 받게 되실 것 같아요. 그다음에 딱 그냥 짐작하시다시피 AI봇이 있으면 영어 같은 것들을 가르치는 쪽으로도 많이 쓸 수 있고요. 그런데 이것은 재미있는 게 뭐냐 하면 저희가 유아용 AI 영어교육서비스를 만들었는데 AI데이터 말씀을 드렸잖아요. 데이터세트를 구성하는 데 핵심이 한국의 어린아이가 콩글리시같이 발음하는 것을 너무 틀리다고 하지 않게 만드는 게 저희한테 되게 과제였어요. 그래서 얼핏 생각하시면 조금 웃으실 수 있는데 사실 서비스관점에서 봤을 때 아이가 열심히 이야기했는데 분명히 틀린 건 아닌데 R, L 헷갈려서 무조건 잘못했다고 B 하면 그게 좋은 서비스는 아니거든요. 그래서 그런 부분들을 잘 좀 훈련시키고 잘 관리할 수 있게 만드는 게 아주 현실적인 챌린지였습니다. 그래서 마인즈랩이라는 회사는 실제 국내에서 거의 유일하게 AI로만 매출을 내고 있는 회사입니다. 그래서 아마 내년도에는 지금 상장을 계획하고 있고 올해의 매출은 200억 이상을 기록할 것으로 기대를 하고 있고요. 저는 마인즈랩 안에서 컨설팅서비스를 맡고 있는 마인즈앤컴퍼니를 운영하고 있습니다. 굉장히 많은 기업들을 담당을 했었고요. 마지막으로 시간이 없지만 제가 한마디만 더 드리면 제가 이민화 교수님의 강의를 굉장히 인상 깊게 들었는데 디지타이즈에서 정보를 가상으로 도서관으로 만드실 거잖아요. 그럼 그것을 이민화 교수님에 따르면 다시 현실로 가지고 오시는 혁신을 하셔야 되는데, 저희가 그런 부분에 기여할 수 있으면 정말 보람찬 회사라고 생각이 들 것 같습니다. 그런 부분에서 많은 기회를 여러분들과 나누기를 기대합니다. 감사합니다.



국가데이터 공유 활용 전략

발표: 김재수 한국과학기술정보연구원(KISTI) 국가과학기술데이터본부장
동영상에 대한 자막정보
김재수: 안녕하십니까? KISTI의 김재수입니다. 반갑습니다. 저는 이쪽에서 하겠습니다. 먼저 발표해 주셔서 좋은 기술적인 얘기를 많이 해 주셨고 그러면 저는 이제 기술도 기술이지만 실제 데이터측면에서 말씀을 드려보고 싶고, 또 우리가 일반적인 데이터라기보다는 과학기술에 초점을 맞추는 연구데이터에 대해서 집중적으로 얘기를 해 보고 싶어서 소개를 드리려고 합니다. 먼저 들어가기 전에 데이터에 대한 개방성 그리고 오픈의 측면에서 오픈 데이터를 한번 보고요. 그 다음에 우리나라 국가적으로 봤을 때 연구데이터가 어떻게 활용이 되고 또 공유가 돼야 될지 전략적인 측면을 말씀을 드리고, 사실 마지막에 있는 사례들이 여러분들한테 바로바로 인식이 될 것 같아요. 그래서 그런 측면으로 말씀을 드려보겠습니다. 패러다임이라는 것이 사실 데이터뿐 아니라 정치, 경제, 사회문화 전반적인 패러다임의 변화가 있어요. 그런 부분에 있어서 현재는 가장 큰 특징은 저는 뉴노멀시대다. 예전에는 뭔가 규칙이 있었어요. 그리고 그 규칙에 의해서 앞으로 이러이러한 현상이 발견이 되면 이럴 것이다라는 것이 공식이 성립됐던 것을 노멀한 시대였는데, 이제는 뉴노멀이라고 노멀이 없어진 거죠, 결국 어떤 현상이나 법이 생긴다고 하더라도 향후에 어떻게 될 것이다는 것을 예측을 못하는 거예요. 그래서 그것이 뉴노멀시대인데, 그 뉴노멀시대는 대표적으로 그래서 4차 산업혁명에 나타났다라고 보여집니다. 그래서 특히나 우리가 오픈 사이언스라든지 오픈 액세스에 매우 잘 아시는 부분이기도 하고요. 특히 오픈 사이언스라는 측면에서 데이터도 오픈하고 액세스할 수 있는 것도 무료로 개방이 돼야 된다. 또 특히 저희는 과학기술측면에서는 R&D도 저희가 4세대 R&D로 도입이 됐습니다. 그래서 4세대 R&D는 데이터기반의 R&D라고 얘기를 많이 합니다. 그리고 우리가 좋은 장비가 있어야 좋은 또 SI논문이 많이 나오고, 특히 네이처의 논문을 한번 쓰려면 저자가 한 1,000명 이상씩 되는 우수한 논문도 있고 또 거기에는 네이처는 항상 그것에 따른 연구데이터를 같이 제출하도록 합니다. 그래야만 재현성을 검증하고 또 그것에 대한 가치를 다시 한 번 확인할 수 있는 거라고 합니다. 그래서 이러한 파도처럼 패러다임들이 계속 변화가 되고 있는데요. 이제는 데이터 경제까지 얘기하는 그런 상황까지 온 것 같습니다. 그러면 데이터라고 봤을 때 ICT기반의 R&D인데요. 사실 데이터가 기계 가독형 즉 디지털화가 됐기 때문에 이런 변화들이 다 발생이 되는 거고 또 오픈 액세스라는 것도 사실 책자 형태에서의 오픈 액세스는 굉장히 어렵잖아요. 그런데 결국 디지털화됐기 때문에 오픈 액세스도 증가가 되고 폭발적으로 하는 것 같습니다. 부다페스트에서 오픈 액세스를 2002년에 선언을 한 이후로 상당 부분 e사이언스라든지 아니면 우리나라도 데이터에 대한 개방 부분이 되고요. 특히 2015년에는 우리 대전에서 OECD 세계과학기술정상회의 선언문 중, 7개의 아젠다 선언문 중에 개방형 과학을 위한 정책개선 지원이 포함된 게 바로 오픈 사이언스입니다. 오픈 데이터와 오픈 액세스를 포함하는 그런 사례가 있고요. 여기서 사실 시민참여 과학이라고 있는데 Citizen Science라고 해서 마지막 부분에 한번 잠깐 소개를 해 보겠습니다. 오픈 데이터라는 것은 상당히 Open이라는 것 그리고 Data라고 하는 것 그리고 Goverment의 관계들이 많이 있어요. 그래서 이것이 정부의 공공데이터라는 측면 그리고 데이터가 개방되어 있는데 정부 것인지 아니면 일반 데이터인지 그리고 개방성이 있는지 아니면 이건 개방되지는 않지만 공공데이터다 해서 이런 것들이 있고요. 특히 데이터 같은 경우는 통계데이터라든지 지리적인 것, 기업, 웹에 있는 것, 코퍼스. 다양하게 오픈 데이터가 있다고 보면 되겠고요. 그래서 공공데이터에 대한 해외적인 동향 같은 걸 보면 미국 같은 경우는 data.gov 해서 모든 데이터들이 개방이 돼 있고요. 특히나 이것은 데이터를 개방함과 동시에 이용자들이 잘 활용할 수 있게끔 하는 부가적인 서비스도 제공을 하고 있어요. 그래서 원시데이터만 쓸 수 있는 사람은 쓰고 아니면 API를 개발해서 쓰고 싶다하면 일정 비용의 비용을 주면 API 개발까지 하고 실제적으로 데이터를 변환을 해 준다거나 하는 그런 추가적인 서비스까지 미국은 하고 있다 라고 보시면 되고 영국 같은 경우는 상당히 굉장히 법률적으로도 굉장히 강하게 되어 있는 나라의 특징을 갖고 있어서 특히 오픈된 데이터에 대한 활성화순위는 영국이 가장 활발하다. 1위로 되어 있네요. 다음은 유럽의 연구데이터 공유 활용 부분입니다. Open AIRE라고 하는 것은 유럽연합에서 공적자금을 투입한 과거의 연구데이터 플랫폼이라든지, 아니면 프레젼 2020에서 나오는 모든 프로젝트에 대한 연구과제, 성과물들을 망라적으로 리파지토리에 구축한 것이 바로 Open AIRE입니다. Open AIRE의 각종 70만 리서치에 대한 데이터. 70만 과제라는 거죠. 거기에 관련된 모든 것들이 있고 zenodo라고 하는 서비스를 통해서 통합검색을 하는 그런 대표적인 유럽연합의 오픈 데이터라고 보시면 되고 사실 이 zenodo 같은 경우는 제가 왜 zenodo라고 했을까 봤더니 이태리의 처음 최초의 사서라고 하는 분이 제노도토스(Xenodotus)라고 하더라고요. 그래서 그 이름을 따서 zenodo라고 지은 검색의 서비스 명칭이 되겠습니다. 그리고 호주 같은 경우는 상당히 우리나라하고 비슷한 거버넌스를 가진다, 이렇게 보여지는데요. 상당히 중앙집권적인 통합적 체제로 공공데이터를 바라보고 있기 때문에 상당히 정부에서 통합의 의지를 갖고 1월에 ARDC라고 하는 호주 리서치 데이터센터로 해 가지고 각종 리파지토리라든지 아니면 검색 또는 그런 인프라를 제공하는 플랫폼들을 하나로 통합하는 그런 ARDC로 다시 출범하게 된 게 호주의 오픈 데이터의 특징이라고 하겠습니다. 일본 같은 경우도 JAIRO를 통해서 상당히 많은 데이터들을 리파지토리를 연결해 가지고 종합랭킹까지 하는 그런 특징이 있겠고요. 미국 같은 경우는 또 과학 분야별로 이렇게 지역에 가까이 허브를 둬서 하는 건데요. 이게 아마 미국 같은 경우도 우리나라의 지역특화산업 이런 것처럼 특화된 지역에 따른 데이터 허브를 하는 특징을 갖고 있습니다. 그래서 여기 중부지역 같은 경우는 농업, 수자원, 스마트시티 중심으로 연구데이터가 집적화되고 있다, 이렇게 보시면 될 겁니다. 그리고 우리나라 같은 경우는 많이 보셨잖아요. data.gov인데 한 2만 9,058건이 지금 세트로 등록이 되어 있는데 아무튼 활용률은 굉장히 떨어지고 있다고 보여집니다. 이거는 아시는 내용이라 생략을 하겠습니다. 그러면 우리나라 국가적인 연구데이터에 대한 공유 또는 활용에 대한 정부에서도 굉장히 노력을 하고 있습니다. 그래서 재작년부터 유영민 과기부장관님을 중심으로 해서 TF를 만들어가지고 추진을 하고 의견수렴을 거치고, 최종적으로 재작년 12월달 상정해서 작년 1월달에 우리나라 국가 연구데이터 공유 활용전략이라는 안건이 국과심에서 통과를 하게 됐습니다. 그래서 공식적으로 우리나라가 국가 연구데이터에 대해서 시작한 시점이 바로 작년 1월달이라고 보셔야 될 것 같습니다. 그래서 그 내용을 잠깐 소개를 드려보면 5가지의 측면에서 중점추진과제가 있겠는데요. 거기서 어떤 커뮤니티라든지 거버넌스 그다음에 기술적인 활용 플랫폼쪽. 저희 KISTI가 이미 시범 플랫폼을 만들어서 운영 중에 있고요. 그다음에 인재양성 분야, 법제도 분야 그리고 이것은 실제 산업적으로 연구데이터까지도 이제는 일자리 창출까지 좀 해 달라, 사실 다섯 번째 같은 경우는 제가 관심이 많아도 실현될지, 안 될지 잘 모르겠습니다. 아무튼 조금 더 긴 호흡으로 봐줘야 될 부분이 바로 일자리 창출이다라고 생각이 됩니다. 핵심추진과제는 말씀드린 것처럼 이렇게 커뮤니티, 플랫폼, 인력양성, 법제도 이렇게 되겠고요. 사실 거창하게 법제도 이렇게 말씀은 드렸습니다마는 사실 데이터관리계획이라고 그래서 미국의 DMP법을 상당 부분 벤치마킹해서 저희 국내에 규정화한 겁니다. 그래서 사실 이 법령에 따르면 모든 시범과제를 지금 하고 있습니다마는 국가 연구개발의 과제에 대해서는 DMP를 적용하도록 올 3월 19일날 공동관리규정이 개정이 됐고 앞으로 9월 1일부터는 아마 데이터관리계획을 과제계획서에 제출하도록 그렇게 의무화규정이 정립이 됐습니다. 그래서 9월 1일부터 과제를 제출하게 되면 전체 과제를 하는 건 아니고요. 거기의 시범과제로 지정이 될 것인데 우리나라 참고로 국가 R&D 과제는 1년에 한 6만에서 6만 5천 과제가 계속 수행이 되고 있습니다. 계속과제인 경우도 있고 신규과제도 해서 6만 5천 과제 중에 일부 지정이 된 과제들에 대해서는 연구데이터를 어떻게 만들 것이고 저장을 하고 앞으로 어떻게 성과를 확산시킬 것인지에 대한 총체적인 데이터 관리계획을 내는 것이 바로 규정화가 됐다는 말씀 먼저 드리겠습니다. 그래서 국가연구데이터 플랫폼은 저희 KISTI가 지금 현재 개발을 해 가지고 시범 오픈을 한 상태입니다. 그래서 연구데이터 플랫폼의 내용들은 기능들로 봤을 때는 보통 검색이라든지 아니면 분석 그리고 저장, 등록, 기타 할 수 있는 모든 기능들을 다 가지고 있고요. 특히나 플랫폼은 국가의 연구데이터 플랫폼이다 보니까 그 하부적인 부분에는 각 분야별로 전문센터들을 두게 돼 있습니다, 우리 국가적으로도, 그래서 현재 바이오 같은 경우는 생명과학연구원쪽에서 바이오쪽 분야를 집중적으로 연구데이터를 만들어서 전문센터화 시킬 예정이고, 또 소재 같은 경우는 화학연구 같은 경우는 화합물 같은 것, 그런 것들을 전문적으로 한다든지 아니면 조금 전에 발표하실 때 학습데이터 같은 경우는 전산원에서 하고 있는 AI허브쪽에서 AI인공지능분야의 데이터들은 전산을 해서 하는 그런 분야별 전문센터들을 국가연구데이터 플랫폼에 연계해서 우리 국민들이 언제나 모든 분야에 대한 연구데이터들을 직접적으로 활용하고 쓰실 수 있도록 플랫폼을 만들고 있습니다. 그래서 연계된 것은 NTIS(국가과학기술지식정보서비스), 사이언스온(과학기술 지식인프라 통합 서비스)이라고 새로 개편이 됐고요. 그리고 DOI(디지털 객체 식별자) 그리고 해외에는 아까 말씀드린 Open AIRE라든지 ARDC 호주 것, 이렇게 연계를 하고 있고, 현재 해외에 있는 Open AIRE는 60만건, 메타데이터 형태로 연계가 돼 있습니다. 그래서 특히 주요서비스는 연구데이터를 등록할 수 있는 것 그리고 검색 그다음에 분석. 이렇게 3대 기능을 중심으로 서비스가 되겠고요. 이것은 생략을 하겠습니다. 특히 대용량 데이터 고속 전송은 연구데이터는 굉장히 대용량이라는 특성을 많이 가져요. 그래서 인공위성 같은 데서 고해상도의 전자현미경으로 촬영을 하게 되면 1m x 1m짜리 1장을 찍어도 거의 테라바이트씩 나오는 정도가 나올 수 있고, 해상 데이터는 굉장히 복잡한 구조를 갖고 있어서 대용량 데이터에 대한 고속 전송이 매우 또 중요한 기술이다. 이것도 또 참고로 말씀을 드리고요. 저희 현재 오픈되어 있는 연구데이터 플랫폼의 콘텐츠는 저희 KISTI가 자체적으로 생산된 24개의 데이터세트. 여기 사실 데이터세트라고 하면 우리가 한 건, 한 건 이렇게 말씀하시잖아요. 그런데 실제 대용량 데이터 같은 경우는 1테라바이트가 1건인 경우도 있어요. 그러다 보니까 주로 세트다 얘기를 많이 하는 거죠. 그래서 건수 가지고는 상당히 연구데이터는 분량을 상당히 알아보기가 어렵다. 같은 경우는 엄청난 수억건을 하더라도 바이트수가 얼마 안 되지만, 대용량 데이터, 특히 슈퍼컴에서 나오는 데이터 같은 경우는 결국 1세트만 해도 벌써 테라바이트 단위로 나오기 때문에 용량으로 봐줘야 한다, 연구데이터들은. 그렇게 보지만 어쨌든 분야별로 24개의 세트. 그리고 지질자원관에 있는 지질에 관련된 암석이라든지 아니면 지진, 이런 것에 대한 7개 세트. 아까 말씀드린 전산원에 있는 게 바로 이것, AI허브 중에 일부 한 800만건의 데이터 세트 그리고 분자생물학분야 그리고 Open AIRE쪽에 66만건 정도의 메타데이터 수 등의 연구데이터가 지금 현재 올라가 있습니다. 이 부분이 데이터에 대한 활용사례인데요. 이렇게 오픈 데이터가 매우 중요합니다. 그리고 대부분 또 활용성이 많아야 하는데 그럼 저런 데이터가 모아져서 어디에 활용될 것인지에 대한 소개를 하면서 매우 중요하고 또 이런 응용사례들을 한번 봐주셨으면 하는 의미에서 가져와봤습니다. 중력파라는 건 굉장히 오래 전에 물리학자들이 가설을 세우고 정의를 한 건데 증명을 못했다가 드디어 발견을 한 거죠, 2017년에. 그래서 그걸 발견한 사람들이 3명이 노벨물리학상을 받았는데 우리나라에서도 중력파 검증할 수 있는 사업단이 만들어지고 거기에 KISTI가 여러 명 참여를 해서 노벨상을 받은 논문의 공저자로 등재가 되는 그런 게 있는데 이렇게 데이터를 가지고 중력파도 검증이 됐다라는 말씀을 드려보는 거고요. 다음은 기상재해 분야입니다. 사실 기상재해 같은 경우도 간단히 일기예보만 보고 할 수도 있겠지만 일기예보와 함께 침수하고도 관련이 되거든요. 그래서 강우량을 예측을 해 가지고 계속 얼마큼 비가 내리면 어느 도시, 인천시의 무슨 동에 얼마큼의 피해가 갈 것이다 하는 침수피해까지도 같이 볼 수도 있고요. 그래서 상당히 요즘은 각종 모델들이 한 3000, 4000씩 모델이 결합한 그런 모델들이 많이 나와요. 수치해석 모델들이. 그래서 수치해석을 통해서 태풍의 경로가 어떻게 간다든지 기상청에서 많이 하잖아요. 그런 것들 하고 대신 구름의 이동이라든지 강우량을 예측을 해서 어느 특정지역에 침수가 예상이 되면 대피를 시킨다든지 그런 부분이 바로 기상재해 재난안전쪽에 활용될 수 있는 분야가 되겠고요. 그다음에는 국민생활 안전분야. 이건 침수부분을 조금 아까 말씀을 드렸던 건데요. 저희가 특히나 침수분야의 강우예측은 슈퍼컴퓨팅을 가지고 인공지능기술을 딥러닝방식을 적용을 해서 예측을 하게 됩니다. 그래서 특히 수치모델의 특징은 기상수치모델과 레이더영상 그다음에 지상에서 관측한 강우량. 3가지에 대한 관측자료들을 융합을 한 모델로 굉장히 독특한 거고요. 그다음에 특히 이제 연안 같은 경우, 인천이나 부산 같은 데 이런 연안에는 또 다른 침수의 문제가 있기 때문에 그런 것들 그리고 실제 도시 같은 경우에는 하수관이라든지 이런 게 있어요, 배수. 그 배수관 이런 것들이 다 지금 인천시 같은 경우는 다 3D로 형상화돼 있습니다. 그래서 관이 얼마큼 두께가 있고 실제 그럼 초당 얼마큼 물이 빠질 수 있는지, 이런 데이터들이 다 등록이 돼 있기 때문에, 어느 정도 어느 지역에 침수가 됐다 그러면 어느 정도 이상이 되면 범람을 할 것인지, 말 것인지 그런 것까지도 다 예측이 가능한 그리고 분석까지 가능한 그런 상태까지 되어 있습니다. 이것도 국민생활 안전쪽인 것 같은데 이건 도시의 지진입니다. 특히나 도시 지진 같은 경우는 고층 아파트라든지 높은 빌딩들이 많고 지하에 많잖아요. 그러다 보니까 지진의 피해가 도시에는 굉장히 크다고 합니다. 그래서 그런 지진들에 대한 우리나라에서는 3도 이상의 지진은 예보를 하게 돼 있어요. 물론 피해가 안 가기는 하지만. 아무튼 고층화되다 보니까 굉장히 지진에 대한 대응도 많이 해야 되는데 또 공교롭게 저희가 지진의 피해를 많이 입은 경주에 와 있네요. 아무튼 여기는 저희가 인천시쪽을 보고 있고 뉴질랜드가 굉장히 지진연구를 많이 하는데 거기하고 지금 협업을 시작을 하고 있습니다. 그래서 아마 슈퍼컴퓨팅기술을 통하고 인공지능기술을 넣어서 지진에 대한 피해를 좀 막아볼까 하는 예측작업을 또 할 수가 있겠고요. 또 특히 도로교통분야는 아까 발표하실 때 자율주행 말씀을 하셨는데 그거 우리도 크루즈기능은 쓰시지 않습니까? 반자율이죠. 반자율기능으로 사실 서울에서 대전 올 때 핸들 몇 번만 잡아도 바로 올 수 있도록 저도 그렇게 내려와봤는데요. 요즘 크루즈기능이 거의 반자율로 잘될 정도로 하는데 아까 그런 기술들이 필요하다는 거죠. 저희도 대전시에서 한번 해 봤어요, 이렇게 했더니 우리는 지금 5개 객체만 분류를 해 봤고, 영상에서. 그런데 가장 어려웠던 것이 야간에 불빛이 많았을 때 산란효과 때문에 굉장히 식별이 어려웠다. 거기에 이제 딥러닝을 통해 학습을 한 거죠. 이러이러한 현상이 될 때는 이건 A타입이 가장 맞겠구나 하는 확률적 방법으로 해서 딥러닝시켜서 식별의 기술 확률을 높였다, 이런 측면에서 보여질 수 있겠고요. 그러다 보면 맨홀 같은 경우도 어느 정도가 되면 맨홀이 고장이 날 것인지 어쩐지 도로교통에 대한 것도 많이 하고 교량, 교량 같은 것에 대한 안전정비. 그런 데도 많이 쓰일 거라고 생각이 됩니다. 이건 과학기술적인 것보다도 일반 비즈니스적인 측면이라고 볼 수 있겠는데요. 이건 여러 가지 공개된 데이터들이 융합이 되면 상당 부분 새로운 인사이트를 볼 수 있다. 실질적인 활용성이 있겠다 해서 한번 소개를 해 보려고 넣어봤습니다. 여기에 빅데이터로 쓴 것은 전국 매출데이터라든지 가맹점트렌젝션 또 점포이력정보 이런 것은 국민은행, KB국민은행이죠. KB은행에서 카드데이터를 갖다 저희가 입수를 해 가지고 인풋으로 사용을 했고 그다음에 오픈 메이트라는 곳에서 지역에 대한 블록정보. 행정동단위가 아닌 아파트의 동단위까지 다 이렇게 해서 블록정보 그리고 유동인구정보, 상주인구 그런 것들이 다 통계적으로 나와 있습니다. 그 정보를 활용을 했고 소셜정보. 일반적인 트윗 같은 것 봤고요. 그다음에 data.gov에 있는 소비자물가지수, 이렇게 다양한 측면의 오픈 데이터들을 갖다가 인풋으로 해 가지고 매출분석과 잠재고객 추정한다든지 고객 소비특성 같은 걸 분석을 해 가지고 마케팅에 활용하는 그런 방법이 있고요. 여기서 말씀을 안 드렸지만 아까 침수 같은 경우도 보험사 같은 경우도 보험을 들을 때 침수피해 보험을 들으면 얼마큼을 보상해 줘야 될지를 아까 그런 침수모델을 가지고서도 산정을 합니다. 그래서 예전에도 한번 카드사에서 저희하고 한번 협력을 해 보자라고 했고 보험상품을 개발하려고 할 때도 수가를 어느 정도 기준을 하냐 할 때도 데이터 기반으로 제시가 가능하기 때문에 어떤 빌딩에 매출이 어느 정도 일어났다 그러면 그 상가가, 상점이 하루 정도 침수 때문에 장사를 못했다 하면 어느 정도의 피해를 입을 수 있을 것이다 라고 하는 산식이 산출이 된다는 거죠. 이런 데이터 활용을 하게 되면. 그래서 상당 부분 과학기술정보, 특히 연구데이터를 쓴다고 하더라도 일반적인 통계청에 있는 통계데이터 그리고 카드사에 있는 금융데이터를 포함한 행정데이터를 다 믹스를 하게 되면 새로운 마케팅 정보라는 것들이 많이 생길 수 있다라는 말씀을 한번 더 드려봅니다. 마지막인데요. 한번 보시면 될 것 같아요. 데이터의 개방이라든지 이런 것들은 인식의 전환이 가장 필요한 것 같습니다. 그리고 활용의 시작은 일단 공개부터 시작을 하자. 내 것을 내놔야 남의 것을 얻을 수 있다는 것이 선공개라는 것이고요. 그다음에 저는 생태계를 많이 좋아하는데요. 저희 KISTI는 국가와 국민을 위한 데이터 생태계 중심기관으로서 항상 일을 하고 있기 때문에 생태계도 매우 중요하다, 그렇게 말씀드립니다. 그래서 남은 시간은 제가 이 말씀을 드리려고 빨리 진행했던 부분 중에 하나입니다. 제가 이제, 많이들 보셨던 피라미드죠. Data, Information, Knowledge, Wisdon 이렇게 되어 있는데요. 우리 조상들은 지혜로 살아왔었습니다. 데이터 그때는 몰랐죠. 우리 선조시대 때 선조들은 지혜로만 살았고 그다음에 진화가 되니까 지식을 많이 갖고 살게 됐었어요. 그런데 지식만 가지고도 살 수 없는 정보화시대가 도래가 되고 정보를 가지고 다루고 살았다는 거죠. 그런데 이제는 더더욱 데이터시대가 돼 가지고 정보만 가지고도 살 수 없는 세상이 된 겁니다. 그래서 저기서 세상을 바꾸는 데이터라고 제가 한번 선언을 해 봤는데요. 그래서 의사결정이 가능한 지혜를 우리가 얻으려면 결국 데이터를 직접 개개인이 다룰 수 있는 데이터인이 되어야 되겠다는 생각이 들었습니다. 그래서 여기 오신 분들은 다 앞으로는 데이터인이 되셔가지고 데이터를 직접 핸들링해서 지혜를 얻을 수 있는 그런 분들이 되시기를 바라고요. 여기 오신 분들 중에 대부분이 도서관에서 많이 오셨기 때문에 제가 며칠 전부터 도서관쪽에 뭔가를 얘기를 한번 해 보고 싶다 해 가지고 생각난 게 그거입니다. 아까 초반에 Citizen Science라고 해 가지고 시민 과학 말씀을 드렸는데 특히 공공도서관의 특성은 전국에 다 있다. 그리고 입지적으로도 상당히 접근성이 좋은 곳에 다 있더라고요. 그리고 모든 분야. 저희는 과학기술만 하는데 인문사회뿐 아니라 과학기술의 모든 정보들이 다 도서관에 있더라. 그리고 거기에는 들락날락할 수 있는 모든 사람들은 남녀노소, 연령에 상관없이 다 온다라는 특성이 있더라고요. 그러면 앞으로 우리 시민 과학이라는 것은 모든 과학은 연구자들이 과학을 하는 것이 아니고요. 연구자는 지원하는 사람이 되고 결국 시민 스스로가 마을 연구원이 돼야 되거든요. 그래서 마을 연구원들이 모일 수 있는 곳은 바로 공공도서관이 되겠다라는 생각이 들어서 모든 전국의 우리 공공도서관이 마을 연구원들을 끌어당길 수 있는 시민 과학의 장이 되기를 바라고요. 그랬으면 좋겠어요. 저도 그러면 마을 연구원들을 지원할 수 있는 과학자로 서포트를 했으면 좋겠습니다. 감사합니다.



4차 산업혁명에 대비한 저작권법 개정 이슈와 도서관 관련 논의동향

발표: 정진근 강원대학교 법학전문대학원 교수
동영상에 대한 자막정보
정진근: 저는 강원대학교 로스쿨에서 지적재산권을 가르치고 있고요. 여기 써 있는 대로 한국저작권위원회 위원으로 15년부터 계속 활동을 하고 있습니다. 제가 이제 지재권을 제대로 시작한 것이 2000년쯤인데 그때가 우리나라가 디지털화되면서 많은 것이 바뀌기 시작했죠. 소리바다도 나오고 그다음에 전송이라는 공중송신권이라는 그런 새로운 이슈들이 계속 나오고 있고 그래서 굉장히 바빴어요. 보통 교수 되면 놀아야 되는데 계속 바빴죠. 그러다가 좀 정리가 됐다 그래서 놀아야지 하고 있는데 갑자기 4차 산업 이슈가 나와가지고 또 바빠졌습니다. 요즘에는 더 바쁜데 오늘 제가 발표할 것은 원래 4차 산업 얘기를 한다 그래서 4차 산업 얘기를 준비했는데 또 도서관에서는 도서관얘기를 해 달라고 해서 도서관얘기를 추가했는데 보니까 이용자분들은 또 이용자얘기도 해 달라 그러더라고요. 그래서 저는 30박 31일짜리 얘기다. 그래서 그걸 다할 수는 없을 테고, 주로 이제 4차 산업 이슈를 우리가 저작권법에서 어떻게 다루고 있는지, 이것을 말씀을 드리고 그다음에 도서관에서 다루어주십사 한 이슈가 몇 가지 있는데, 이건 4차 산업 이슈라고 보기는 좀 어려운 것들도 있거든요. 그래서 거기에 대해서 간략히 말씀을 드리고, 무엇보다도 도서관에서 오신 분들이기 때문에 되게 의견도 많고 질문도 많으실 거예요. 그래서 발표는 짧게 하고 그다음에 토론을 많이 여러분들하고 했으면 좋겠다 하는 생각으로 짧게 하겠습니다. 제가 지금 강원대학교의 법학연구소장을 하고 있는데 연구소장 돼서 제일 먼저 한 것이 뭐냐 하면 학술발표할 때 1시간 있으면 발표는 15분만 해라. 왜냐 하면 45분 동안 계속 있는 페이퍼를 주구장창 이렇게 읽고 나서 형식적인 토론을 하고 하면 하나도 남는 게 없단 말이죠. 그래서 15분 하고 45분 동안 계속 토론해라. 만약에 45분 동안 토론이 계속 나오지 않는다면 그거 발표는 사실 있으나 마나 한 발표죠. 그래서 오늘도 여러분들이 적극적으로 많이 저한테 물으시면 제가 아는 건 없으니까 제가 많이 배워가겠죠. 그래서 그렇게 진행을 했으면 합니다. 이미 여러분께서 기조강연에서 4차산업혁명에 대해서 굉장히 자세히 말씀을 들으셨는데, 이민화 교수님과 도서관장님 강의를 들으면서 너무 머리가 아프더라고요. 저렇게 많은 것을 저렇게 빨리. 더 놀라운 것은 40분을 정확히 지키시더라고요. 그래서 제가 뒤에 시계가 있나 봤어요. 그랬더니 시계가 없어. 굉장히 연습을 많이 해 오신 듯하다 한 게 첫 번째 큰 인상이었고 저는 보통 강의를 어떻게 할까 절대 생각을 해 가지 않습니다. 왜냐 하면 가서 냄새를 맡고 그때그때 다르게 해요. 그래야지 그때그때 나오거든요. 아니면 있는 그대로 하면 죽은 강의가 되니까 물론 이민화 교수님 강의가 죽은 강의라는 얘기는 아니고요. 그게 첫 번째였고 두 번째는 갑자기 4차 산업혁명 얘기를 막 하시다가 두 분 다 끝에는 저작권법이 문제다 하고 끝내시더라고요. 그것 되게 인상적이었어요. 그런데 실제로 들어보시면 알겠지만 저작권법은 문제가 없어요. 없는데 다른 것들이 사실 문제가 있죠. 제가 대통령 직속으로 국가지식재산위원회, 그것 작년에 미래전략특위에서 AI 이런 것을 다루는 소위원장을 해서 한 1년 동안 했었거든요. 거기에서도 빅데이터 문제도 많이 나오고, 그다음에 특히 의료정보, 바이오생체정보, 이런 얘기도 많이 나오고 그랬는데, 거기에는 저작권 문제가 사실상 거의 다 해결이 됐어요. 그런데 거기에서 해결이 안 된 것은 오히려 개인정보 보호, 이런 거였죠. 그리고 올해도 문재인 대통령께서 바이오에 지금 방점을 딱 찍으셨잖아요. 그래 가지고 또 바이오와 관련된 지금 특위가 또 소집이 됐거든요. 거기서 제가 맡은 것도 또 규제완화를 어떻게 할 것인지에 대한 소위원장을 맡았는데, 거기도 핵심은 뭐냐 하면 개인정보를 어떻게 풀 것인가하고, 빅데이터를 어떻게 쓰게 할 것인가예요. 그런데 거기의 방점도 역시 저작권 문제는 이미 해결이 됐는데, 저작권 문제가 아닌 개인정보보호법이라든지 산업발전법, 이런 데서 충돌이 일어나고 있거든요. 그래서 범인은 저작권법이 아닌데 지금 저작권법이 누명을 쓰고 있는 거죠. 그런데 한편으로 생각하면 그만큼 저작권법이 대표법이기 때문에 그렇게 생각하신 것이 아니냐, 이런 관점에서 생각할 때 저작권위원회 위원으로서 그래도 자긍심도 좀 느껴진다, 이런 생각이 들더라고요. 우선은 참고로 말씀드리면 2016년에 아주 중요한 일이 있었죠. 알파고가 이세돌과 바둑해서 4:1로 게임을 가져갔어요. 그러면서 한국 사람들한테 인공지능이 갖고 있는 위력을 느끼게 해 줬죠. 사실 그 게임은 저는 모든 대국을 직접 다 봤는데 그 게임은 사실 되게 불공정한 게임이었어요. 왜냐 하면 인공지능이랑 사람이랑 싸우면 당연히 우리는 뭐를 상상하나요? 로봇이 이렇게 걸어나와가지고 앞에 앉아서 바둑을 두는 걸 상상하는데 그 대국에는 로봇이 보이지 않지 않았습니까? 사람이 대신 놓아뒀죠. 그런데 그 이면에 로봇이 숨어 있을 건데, 장막 뒤에 숨어 있을 텐데 실제로 그 로봇은 사람 모양의 로봇이 아니고 프로세스를 2,000개나 가지고 있고, 전기를 제가 대학에 근무하는 춘천보다도 더 많은 전기를 쓰고, 그다음에 빅데이터기술을 이용해서 그 수많은 기보를 컨닝하고 있었고, 그리고 그 컨닝하는 데는 CPU뿐만 아니라 GPU라고 하는 그래픽을 처리하는 아주 중요한 새로운 IT자산을 가지고 있었거든요. 그래서 사람으로 치면 2,000명의 기사가 모여가지고 모든 기보를 옆에다 쌓아놓고 게임한 거죠. 그렇다고 해서 사람이 2,000명 모이면 이길 거냐? 더 지죠. 그렇죠? 그게 사람이 갖고 있는 최대의 약점이죠. 그래서 어쨌든간에 알파고는 여러 가지를 극복을 했는데 우선은 바둑이라는 것은 19 곱하기 19의 매트리스인데 그것을 가지고 항상 이긴 수를 계산하려면 첫 수가 400의 팩토리얼의 경우의 수가 나온다 그래요. 그래서 그걸 슈퍼컴퓨터로 계산하더라도 실제로 2시간 대국에 둘 수가 없었죠. 그런데 그 게임에서 보면 2시간이란 되게 짧은 시간에 게임을 했죠. 그런데 알파고는 관찰을 잘하신 분들은 느꼈는지 모르겠지만 모든 수를 둘 때마다 시간이 남았었어요. 그래서 제가 느끼기에는 얘가 갖고 있는 수의 한계는, Depth는 크게 높지 않았다. 거기서 끝났죠. 그런데 이세돌은 항상 시간이 모자랐거든요. 그런데 바둑에 관심 있는 분은 아시겠지만 2시간짜리 대국은 아마추어들이 두는 대국이에요, 굉장히 유명한 농심배 이런 데도 한 8시간을 두고 일본에 있는 대국들은 주로 시간제한 없이 두거든요. 만약에 그것을 시청률을 생각 안 하고 8시간을 두고 아니면 20시간, 이틀을 두고 둔다 그랬으면 제가 생각할 때는 이세돌이 이겼을지도 모른다, 이런 생각이 들어요. 왜냐 하면 알파고는 항상 7분, 8분에 자기의 논리적인 계산이 끝났거든요. 더 이상의 논리적인 계산이 나오지 않았었요. 만약에 제가 인공지능의 프로그래머라면 그 시간이 7분, 8분이라는 게 제가 잘못 말했는데 시간제한이 2분이라면 1분이 되기 전에 끝났거든요. 그런데 제가 만약에 프로그래머라면 당연히 시간까지 최적의 수를 더 계산하라고 하죠. 왜냐 하면 경우의 수는 계속 나오니까. 그런데도 불구하고 안 했다는 것은 논리적인 게 별로 그렇게 높지 않다. 하지만 뭐가 있었냐 하면 GPU가 컨트롤할 수 있는 빅데이터가 있었다는 거죠. 그래서 그때부터 빅데이터에 대한 관심이 높아졌어요. 그래서 문화부에서 이 김에 한번 전부개정을 목표로 해서 2016년도에 한번 우리가 과제를 해 보자. 그래서 제가 연구책임을 맡았는데 전체 참여한 교수님이 한 서른 분 정도 됐어요. 서른 분 정도면 저작권법을 전공하는 국내 로스쿨 교수 숫자보다 많은 숫자예요. 다 참여하셨죠. 다 참여해 가지고 한 30여 개 주제를 가지고 논의를 했습니다. 인공지능부터 시작해서 여러 가지 논의를 했죠. 도서관과 관련해서는 보상금이라든지 아니면 E북을 어떻게 처리할 것인지, 이런 문제들을 논의를 했습니다. 대부분 거기서 해결이 됐어요. 개정도 필요 없이 해결이 된다라는 식으로 해결이 됐고 2017년에 가서는 좀더 구체적인 논의가 필요한 것들 한 10여 개 주제를 가지고 다시 또 논의를 했죠. 그리고 거의 제가 볼 때는 해결이 어느 정도 됐다. 그다음에 2018년도에 가서는 인공지능하고 블록체인하고 3D프린터, 이 3개의 주제가 난제라고 해서 집중해 가지고 또 논의를 계속했습니다. 거기서 3D프린트는 큰 문제가 아니다라는 결론을 냈고 그래서 2019년에는 인공지능하고 블록체인하고 그다음에 5G하고 있는데, 사실 5G도 이슈가 있을 수 없어요. 왜냐 하면 통신기술에 불과하거든요. 5G로부터 나오는 서비스에 의해서 생기는 이슈들이 있을 뿐이죠. 통신기술은 저작권의 발전에 굉장히 큰 영향을 미치는데 저작권이 15세기에 생긴 이유는 복제기술 때문이죠. 그리고 디지털시대로 오면서는 사람들이 복제가 쉬워지면서 굉장히 많은 문제들이 생겨요. 왜냐 하면 예전에는 복제가 되게 어려웠기 때문에 사적복제를 인정할 수 있었고 여러 가지 제도들을 통해서 권리를 나눠썼는데 디지털기술로 오면서 복제가 너무 쉬워지니까 그때부터는 복제권을 강화하는 수밖에 없거든요. 그래서 1990년대를 우리가 저작권의 확대, 강화기라고 이렇게 얘기를 하는 거예요. 그러다가 이제 90년대 후반에 오면서는 드디어 우리나라에서 소리바다 사건이 일어났죠. 그게 뭐로 바꿨냐 하면 카피라이터에서 액세스라이터로 바뀌는 거거든요. 접속에 대한 권리로 패러다임이 전환된 거예요. 그러면서 여러분들이 이제부터는 복제가 중요한 것이 아니라 서비스 플랫폼에 접근해 가지고 형용하는 게 중요해져요. 그때 이제 2G망을 갖고 있었는데 2G망에서는 여러분들이 할 수 있는 거라고는 음악 정도밖에 없었죠. 그래서 음악스트리밍이 제일 먼저 시작이 됐죠. 왜냐 하면 음악은 보이스이기 때문에 용량을 거의 안 잡아먹거든요. 그래서 음악이 되는데 그때만 하더라도 영화를 스트리밍으로 보려면 끊겼어요. 못 봤죠. 그런데 3G, 4G로 오면서 뭐가 해결이 되냐 하면 동영상이 해결이 돼요. 동영상이 보이스보다 훨씬 많은 용량을 가지고 있는데. 그러고 나서 이제 다시 요즘에는 5G로 가고 있다며 5G세상이 들어선다고 하자마자 제일 먼저 나온 것이 뭐냐 하면 구글이 스태디아라는 걸 발표했거든요. 스태디아 들어보셨어요? 스태디아는 게임의 플랫폼이에요, 게임의 플랫폼. 게임은 동영상이랑 또 다른 것이 동영상은 이렇게 유튜브를 제가 볼 때도 가끔 끊어질 때가 있죠. 그렇지만 어느 정도는 이렇게 쭉 일련의 동작들을 끊임없이 볼 거예요. 그때 이렇게 갖다놓는 이 바를 보면 제가 보는 것보다 항상 얘가 미리 갖다놓죠. 미리 갖다놔야지 끊김 없이 볼 수 있을 테니까, 이것이 가능한데 게임은 뭐가 안 되냐 하면 미리 갖다놓는 게 안 돼요. 왜냐 하면 쟤가 나한테 총 쏠지 모르거든요. 그러니까 내가 쏠 때 쟤가 쏴야지 내가 총 쐈는데 갑자기 뚝 끊겨. 그러다가 쟤 총이 보이지도 않는데 나를 죽이네? 이러면 게임이 안 되죠. 그렇기 때문에 즉각적인 응답성이 되게 중요하거든요. 이런 시대로 오면서 스트리밍의 시대가 이제 완전히 모든 영역에 적응이 되겠죠. 이런 식으로 서비스가 바뀌는 것은 있지만 5G가 갖고 있는 것은 크게 없지 않은가, 이런 생각이 들고요. 어쨌든간에 모든 논의주제를 다 다룰 수는 없으니까 중요한 것만 몇 개 다뤄보면. 자꾸 제가 내리죠. 우선은 차분히 돌아와서 4차산업의 정의부터 시작을 하겠습니다. 이민화 교수님은 제 모교 교수님이기도 하신데 오늘 오셨으면 좋겠는데 안 오셨네요. 제가 저작권법이 죄가 없다는 얘기를 하고 싶었는데. 4차 산업혁명을 온라인과 오프라인의 융합이다, 이렇게 정의를 하시죠. 이민화 교수님의 것은 제가 유튜브를 통해서 많이 찾아보고 어디 발표하실 때도 가서 보고 그래서 어떤 생각을 하고 계신지 거의 알겠어요. 그런데 오프라인과 온라인의 융합이라는 것은 현상을 설명한 것이거든요. 이 현상을 설명한 것은 매우 유익한 면이 물론 있죠. 하지만 여러 가지 약점을 가지고 있는데 첫 번째 약점은 뭐냐 하면 앞선 산업혁명과의 관계에서 동일한 관점에서 보는 견해를 제시하지 못해요. 그래서 이렇게 제가 생각했을 때는 우리가 철기혁명부터 이렇게 쭉 시작해 보면 모든 혁명은 에너지원에 의해서 바뀌거든요. 철기라는 에너지, 증기라는 에너지 그다음에 디지털에너지 이런 식으로 바뀌거든요. 에너지라는 측면에서 봐야 된다. 그리고 에너지라는 측면에서 본질을 보는 게 굉장히 중요한 이유는 법학은 개념이라는 것이 중요하기 때문에 거기서부터 문제들을 하나하나 벽돌을 쌓듯이 올라가야 돼요. 그런데 어떤 사업을 한다든지 strategy(전략)를 짤 때는 현상이 되게 중요하죠. 그러니까 보는 관점이 다르다, 이렇게 볼 수 있는데, 어쨌든 저는 그래서 4차 산업혁명을 이렇게 정리합니다. 초지능에 의한 권리귀속주체의 변경, 초연결에 의한 책임범위의 유기화, 이것을 특징으로 하는 사회다 하는데, 제가 이건 좀 약화해서 쓴 거고 이게 새로운 에너지가 되는 사회다, 이렇게 쓰거든요. 그래서 초지능과 초연결이다. 초지능의 대표는 인공지능이죠. 초연결의 대표는 IOT예요. IOB도 얘기하지만 어쨌든 IOT를 중심으로 한 연결인데, 초지능기술의 인공지능을 도와주는 기반기술 중에 하나가 빅데이터죠. 이런 식으로 개념화해서 보거든요. 빅데이터고, 그다음에 초연결기술의 개념기술이 사물인터넷이다, 이렇게 보는데, 인공지능의 권리주체성, 이것이 법에서는 제일 중요한 문제예요. 왜냐 하면 인공지능이 앞으로 뭘 창작하고 서비스도 제공할 텐데, 그러다 보면 법에서 제일 중요한 것은 뭐냐 하면 얘가 권리를 갖는지하고 책임을 지는지, 이 2가지의 문제거든요. 이게 법에서 중요하죠. 그런데 여기에 대해서는 이미 답이 많이 나와 있어요. 미국의 나루토사건이라고 들어보신 분이 많이 있을 텐데, 신문에서 많이 나와서. 어떤 사진작가가 인도네시아 밀림에 들어가가지고 원숭이 사진을 찍다가 사진기를 뺏겼어요. 자기는 쪽팔리니까 찍어보라고 놔두고 왔다고 하더라고요. 그런데 뺏긴 것 같아, 처음에 뺏겼다고 했어요. 한 2시간쯤 있다가 원숭이가 좀 질려서 사진기를 놓고 갔단 말이에요. 그래서 가봤더니 아주 재미있는 셀카들이 많이 있는 거예요. 그래서 이 사람이 이걸 전시를 했죠. 다른 데서도 썼어요. 저작권 침해소송이 붙었겠죠. 그래 가지고 미국 법원에서 다퉜는데 그러다가 자기들끼리 합의를 했거든요. 우리나라 합의하면 그냥 종결시키는데 미국 법원이 워낙 재미있는 사건이고 끝까지 가야 된다 그래 가지고 그걸 안 받아줬어요. 합의를 안 받아주고 끝까지 갔어요. 결국에는 뭐라 그랬냐 하면 저작물의 창작자는 인간이어야 된다. 그런데 원숭이는 인간이 아니기 때문에 이것은 저작물 자체가 아니다, 이렇게 결론을 내렸죠. 그렇기 때문에 저작물 자체가 아니기 때문에 저작물에 대한 저작자도 존재할 수가 없는 거죠. 더 이상 얘기할 필요가 없는 거죠. 그럼 특허는 어떻게 되느냐? 특허에 대해서는 1980년에 특허범위를 확장시킨 아주 대표적인 판례가 있거든요. 미국의 판례가 샤크라버티컬 사건이라고 부르는데, 그 사건에서 특허범위를 아주 획기적으로 연방대법원이 확장을 시킵니다. 그러면서 얘기한 것이 뭐냐 하면 anything made by man under the sun, 이렇게 얘기해요. 태양 아래 인간에 의해서 만들어진 모든 것. 그러면서 인간이라는 것으로 한정을 하고 있죠. 그래서 그렇게 해석이 될 것이라고 이렇게 우리가 생각을 합니다. 최근에 중국에서도 되게 재미있는 판례가 나왔는데, 하급심 판례이기는 하지만. 중국에서 인공지능기술이 중국이 지금 많이 발전해 있거든요. 인공지능은 우리가 이미 많이 뒤쳐졌다. 핀테크부터 뒤쳐지기 시작해서 이미 우리가 많이 뒤쳐졌다, 이렇게 생각을 하는데 인공지능이 어떤 동영상을 만들어냈어요. 이것을 갖다 쓴 것에 대해서 중국 법원이 이것도 역시 저작물이 아니다, 이런 판결을 냈습니다. 우리나라에서도 같이 갈 수밖에 없다. 왜냐 하면 우리 저작권법의 정의도 인간의 사상가에서 인간이라는 요건이 있거든요. 그래서 결국 그러면 그 저작물도 아니네. 작품들은 그럼 어떻게 되느냐라고 했을 때 우리 저작권법의 특징은 뭐냐 하면 아무것도 아닌 애는 아무나 쓸 수 있다는 관점에서 설계가 돼 있는 거죠, 배타권이 없으니까. 그렇기 때문에 결국 퍼블릭 도메인에 들어갈 것이다. 굉장히 많은 저작물 유사한 저작물 아닌 것들이 범람을 하겠죠. 굉장히 많은 콘텐츠들이 이제 인공지능에 의해서 창작될 것이다. 거기에 대해서 우리가 생각하는 게 되게 중요하다, 그걸 뒤에 말씀드리고, 그럼에도 불구하고 지금까지 논의는 주로 빅데이터에 맞춰져 있었어요. 알파고가 이기니까 조훈현 구단께서 국회의원이 되셨었죠? 그래서 제일 먼저 한 것이 뭐냐 하면 기보 저작권으로 인정해야 된다. 그런데 저작권법은 문화발전을 위한 법이기 때문에 무조건 다 인간의 사상과 감정의 표현이라고 해서 인정하는 것이 아니고, 그걸 인정했을 때 문화발전에 도움이 돼야 돼요.그래서 서양에서도 체스의 기보를 저작물로 인정하지 않거든요. 그런데 이제 국회의원이 되셨으니까 이제 개정안을 내셨죠. 거기에 대해서 저는 되게 반대했어요. 왜냐 하면 빅데이터로 제가 알파고가 기보를 썼다고 하는데 한번 생각해 보자. 그 기보를 저작권으로 인정한다 그랬을 때 돈낼 사람이 누구냐, 도대체. 첫 번째, 기원이 있을 수 있겠죠. 그런데 기원이 지금 망해가고 있는데 꼭 돈을 받으셔야겠습니까, 이런 질문을 드리고 싶어요. 별로 받고 싶지 않다는 거예요. 그리고 두 번째, 동료 바둑기사들이죠. 이세돌이 바둑을 둘 때 빅데이터를 이용해요. 그분들의 대화를 보면 어떤 식으로 얘기하냐 하면 조치훈 구단이 옛날에 일본에서 무슨 전에서 몇 국의 몇 수째 뒀던 그 수를 뒀을 때 그때는 커제의 몇 수의 국수의 몇 째수를 더해야 되죠, 이런 식으로 대화를 해요. 다 넣고 있는 거죠. 타인의 저작물을 다 넣고 있는 거예요. 기보가 저작물이라면. 그러면 이세돌은 생각해야 돼요. 이 돌을 두고 5년 이하의 징역에 처할 것이냐 아니면 이 수를 포기할 것이냐, 이걸 생각해야 돼요. 이게 안 된다. 오케이, 그건 안 된다. 그럼 돈낼 사람 구글 하나 남았거든요. 그런데 구글은 이걸 빅데이터를 이용해요. 그 빅데이터라는 게 뭐냐 하면 인터넷에 돌아다니는 수없이 많은 정보들을 자기가 긁어가지고 그대로 쓰는 것이 아니라 이걸 가공해 가지고 새로운 변형적인 가치를 창출해내는 그런 산업이거든요. 그러면 2가지를 검토해야 되는데 우선 변형적인 이용이 공정이용이 아니고 저작권 침해냐, 이것을 봐야 되는데 미국 법원이 이미 그것을 공정이용으로 봐요. 그리고 영국은 그것 때문에 법 개정했죠. 일본도 법을 개정했어요. 우리나라도 공정이용으로 볼 수밖에 없다. 그다음에 최근에 플랫폼들은 빅데이터를 와서 압수수색해서 제가 여기 갖고 있다는 것을 잘 입증하세요, 이렇게 착하게 컴퓨터 하나에 넣고 있는 것이 아니라 구름 속에 숨겨놓거든요. 그래서 클라우드 컴퓨팅이라고 그러죠. 클라우드 컴퓨팅의 가장 큰 2개의 특징은 가상화와 분산처리예요. 가상화와 분산처리. 한마디로 막 뜯어놔가지고 그것을 어디에다 숨겨놨는지 모르고 또 중복적으로 숨겨놓고 이런 기술이거든요. 네이버를 경주에서 검색할 때랑 서울에서 검색할 때랑 같은 서버를 쓰겠어요? 절대 그럴 리가 없죠. 같은 구름을 쓰겠어요? 그럴 리가 없죠. 지금 구글도 빅데이터를 어디 구름 속에 숨겨놓고 있는데 입증을 해야 되거든요. 누가 입증하죠? 주장하는 자가 조훈현 구단께서 자기의 기보가 어떻게 쓰이고 있는지 입증해야 돼요. 그럼 신선이 되는 수밖에 없죠. 구름 속을 나가야 되는. 이게 불가능해요. 이거 어떻게 할 거냐. 구글이 돈낼 확률은 없다는 거죠, 제가 볼 때는. 그래서 이런 문제가 생겼는데 어쨌든 중요한 것은 빅데이터는 지금 전세계적으로 공정이용으로 본다. 다만 이제 제한들에 있어서 차이가 있는데, 영국은 빅데이터를 인정하면서 영리적 목적으로 제한해 버렸어요. 저는 그거 굉장히 잘못된 입법이라고 생각해요. 왜냐 하면 빅데이터의 본질은 빅데이터산업에 있는데, 빅데이터산업의 본질은 영리성이거든요. 그런데 영리적 활용을 못하면 연구실에서 장난할 때밖에 못 쓰죠. 그게 잘못됐다. 일본 같은 경우는 2009년에 빅데이터를 허용한다고 하면서, 영리를 관계없이 허용한다고 하면서도 다른 사람이 정리해 놓은 자료는 쓰지 말라는 식으로 개정을 했어요. 그래서 나는 그것도 바보 같은 개정이라고 그랬어요. 그래서 그 2개가 나온 다음에 우리 입법을 할까 막 했는데 그런 식으로 입법할 것 같으면 입법하지 말고 기다리자. 왜냐, 우리는 미국 같은 공정이용 원칙이 있기 때문에 그걸로 해결하면 족하다 그래서 그냥 놔뒀어요. 그런데 아니나 다를까 개정이 됐어요. 왜 그게 바보 같은 입법이냐 하면 빅데이터의 중요한 특징 중에 하나는 자동화된 소프트로봇에 의한 수직단계가 있어요. 그런데 얘가 그 자료가 정리돼 있는지, 안 돼 있는지 어떻게 알아요, 그냥 막 수집하는데. 알 수가 없죠. 그래서 우리나라 관계부처랑 회의할 때도 빅데이터를 제한하는 시점은 수직가공단계가 아니라 활용단계에서 하면 족하다. 유사한 것 빅데이터를 다 수집해서 가공했는데 태백산맥 소설을 만들었네, 인공지능이? 그러면 침해죠, 그것은. 새로운 것을 만들어야죠. 그래서 활용단계에서 하면 족하다 해서 우리는 공정이용 원칙 때문에 미루고 있었죠. 그걸로 충분히 해결이 가능하다. 아니나 다를까 일본은 2019년 올해 1월 1일자 시행되는 것으로 해 가지고 전에 있던 걸 다 지워버렸어요. 지우고 나서 인간이 향유하지 않는 정도라면 이 빅데이터 이용이 괜찮다는 식의 개정을 했죠. 어쨌든 그런 정도의 논의가 있었고요. 그다음에 초연결은 사실 더 복잡해요. 지금 자율주행차 얘기하시는데 자율주행차는 아주 저급한 인공지능이죠. 왜냐 하면 센서를 쓰고 있잖아요. 눈을 쓰고 있잖아요. 그러니까 사고가 나거든요. 그런데 초연결은 어떻게 이해를 하셔야 되냐 하면 인간의 개입 없이 사물끼리 정보를 교환해야 돼요. 그래서 이번에 인천공항 가는 길에서 앞차가 서니까 뒤에 가던 택시가 들이받고 또 다른 차가 들이받았잖아요. 그것은 왜 사고가 나냐 하면 눈으로 그 차를 봤기 때문이에요. 그러니까 늦었죠. 만약에 그 차가 서자마자 뒤차에다가 내가 섰다고 정보를 알려준다면 그 차는 서는 즉시 속도를 줄였겠죠. 이런 게 사물인터넷이거든요. 그래 가지고 정보의 클러스터를 형성하게 되거나 정보의 클러스터에 의해서 많은 일들이 벌어질 텐데 여기서 생기는 책임을 누가 책임을 지냐, 이거 애매해지거든요. 그리고 또 하나는 거기 해킹에 대해서 어떻게 할 거냐, 이게 되게 애매해져요. 초연결은 그게 핵심인데 얘네는 지재권의 문제가 아니거든요. 오히려 지재권의 문제에서는 어떻게 접근해야 되냐 하면 인공지능에 의한 자율주행차의 경우도 미국 같은 데서는 인간보다 낮은 수준의 사고율이라면 보험으로 해결한다, 이런 식으로 돼 있잖아요. 그렇기 때문에 법률에 아주 명확한 해석보다 더 중요한 것이 우선 그런 보험 등등에 의해서 해결할 수 있는 이런 식으로 가는 게 맞다라고 하면서 지재권에서는 사실 블록체인에 초점을 맞췄죠. 그런데 이제 아까 관장님께서도 국회도서관에 있는 서적들을 블록체인 얹어서 뭐 하시겠다, 이렇게 말씀하셨는데 제가 검토한 바로는 좀 어렵다, 이렇게 저는 결론을 내렸어요. 왜냐 하면 블록체인의 중요한 2가지 특징은 첫 번째가 탈중앙화고, 두 번째가 동료들에 의한 신뢰성을 입증하는 것이거든요. 프로토콜을 그렇게 하는 거죠. 그래 가지고 변조할 수 없다는 것인데 또 하나의 부수적인 특징은 뭐냐 하면 블록체인 자체가 전세계를 아우르는 인터넷처럼 생각하면 안 된다는 거예요. 블록체인은 인터넷 위에 있는 특정한 목적을 가지는 하나의 작은 가상의 망이거든요. 그렇죠? 그렇기 때문에 소위 말하는 Virtual Private Network의 아주 특수한 형태예요. Virtual Private Network인데 저작권 문제는 항상 대세적으로 발생하는데 어떻게 저작권 문제를 Private Network으로 한정해서 처리를 할 수 있게, 이건 기본적으로 불가능하다. 한마디로 침해에 대해서는 아무런 역할을 할 수가 없다라는 것이고요. 그다음에 그러면 유통에 대해서는 큰 역할을 할 수 있겠냐, 이렇게 얘기를 해 보면 유통에 대해서도 큰 역할하기 힘들다. 왜냐 하면 지금 비트코인 같은 경우는 콘텐츠를 첨부하기 어려워요. 지금 스마트계약이 되는 것은 다음 버전, 다음 버전이나 되어야지 지금 된다는 것이거든요. 그리고 확장성의 문제도 있죠. 굉장히 거래가 느려지고, 그다음에 뭔가 지급결제수단이 필요한데 특정한 암호화폐에 종속된다는 여러 가지가 있어가지고 이런 걸 다해 보니까 어렵다. 고아저작물에 쓰일까 이런 생각을 해 봤는데 그것도 약간 지금 현재는 어렵지 않은가, 이런 식의 결론을 냈습니다. 시간이 다됐다니까 핵심만 딱 얘기를 드리면 뭐냐 하면 생각해 보니까 오히려 지금 4차산업혁명에서 지재권의 문제는 침해를 어떻게 판단하느냐, 이런 것은 어느 정도 해석론이 전개가 되어 있는데, 문제는 오히려 플랫폼이다. 플랫폼은 되게 중요한데 계속 플랫폼 얘기가 나오거든요. 지금 플랫폼이라는 것은 뭐냐 하면 뭔가를 제공하는 애들이죠, 제공하는. 그런데 옛날의 저작권은 뭔가 저작물이라는 것을 물건형태로 주는 형식이었거든요. 그래서 물건법이라고 얘기를 했는데 지금은 뭐냐 하면 주지 않아요. 다 스트리밍이 돼요. 이용만 하게 하죠. 음악도 그렇고 MS365도 그렇고 스태디아도 그렇고 유튜브도 그렇고 다 이용만 하게 하죠. 이렇게 됐을 때 특히 인공지능의 저작물 창작이 폭증하게 됐을 때 결국에는 저작물에 대한 권리는 굉장히 낮아질 것이다. 거기에 비해서 플랫폼이 갖고 있는 어떤 갑질의 가능성은 굉장히 높아질 것이다. 그래서 이것 어떻게 할 거냐. 더군다나 플랫폼은 다 외국에 있는데. 이런 문제를 해결하기 위해서 우리가 라이센스를 어떻게 해석하고, 그다음에 저작권 남용 어떻게 해석해야 될 것이냐, 이런 논의를 계속 좀 많이 했습니다. 그리고 특히 마젠타 프로젝트를 갖고 온 이유는 마젠타 프로젝트가 아주 특이해요. 구글이 이세돌 이기고 나서 오픈을 했는데, 여기는 인공지능 플랫폼인데 음악을 창작한 인공지능이거든요. 그런데 황당한 게 구글이 이세돌이 이기고 난 다음에, 걔가 알파고 이기거든요. 그 이후에 알파고 제로라는 애를 만들었는데 얘는 빅데이터도 안 쓴대요. 그런데 알파고 제로가 오히려 알파고, 우리를 다 이기고 있다는 거예요. 그런데 그 이후에 GPU를 능가한다는 TPU라는 시스템을 개발했다는 소문이 완전히 정설이거든요. 그런데 TPU는 특허등록도 하지 않았다는 거예요. 그러면 결국 뭐냐, 하드웨어 시스템은 컴피디션하게 유지하고 딥러닝도 컴피디션하게 유지하고 하면서 인공지능 프로그램은 오픈을 해버렸어요. 오픈 소스랑 같이 쓰자, 같이 개발하자. 그리고 거기서 나온 오픈 소스는 네가 집에 가서 아무렇게나 써도 돼. 거기서 나온 음악은 네 거야. 이런 식으로 오픈해서 아파치 라이센스가 그런 뜻을 갖고 있는 라이센스거든요. 오픈 소스 라이센스예요. 그래서 이런 관계에서 우리가 플랫폼 경쟁이 굉장히 중요해졌다. 그래서 각각의 영역에서 지금 플랫폼 개발에 힘을 써야 될 때지 지재권에 힘을 쓸 때가 아니다, 오히려. 이런 생각을 갖고 있는데 다행히도 도서관에서는 플랫폼에 굉장히 큰 방점을 두고 있다, 이렇게 보여집니다. 여기까지가 아주 간단한 제 얘기고 그다음에 도서관 관련 이슈는 간단하게 얘기하고 좀 이따 질문이 들어오면 자세하게 말씀을 드릴게요. 잘 아시는 것처럼 이런 공유와 그다음에 새로운 플랫폼, 이런 관점에서 봤을 때 새로운 이슈들이 나타났죠. 미국의 구글이 Library를 만들고 싶었는데 권위자들에 의해서 즉 저작자들에 의해서 상당 부분 좌절됐죠. 아주 일부만 가능하게 됐죠. 여기에 도서관과 관련된 플랫폼의 특징은 뭐냐 하면 다른 데랑은 달라요. 다른 데는 저작권이 약화되기 위해서 플랫폼을 통해서 저작권이 약화된다고 하면 도서관과 관련된 영역은 기존의 저작자들의 권리를 오히려 더 지금 강하게 주장함으로써 형식을 저해하고 있는 수준이거든요. 제가 2016년도에 30여 개 주제를 하면서 그중에서 하나가 E북과 관련된 것이고 그다음에 보상금과 관련된 것이었는데 저는 출판사가 그렇게 많은지 처음 알았어요. 가서 저 생매장당할 뻔했어요. 그래서 굉장히 첨예한 현실적인 이슈를 갖고 다투시더라고요. 지금 택시기사하고 타다 다투듯이. 그래서 이 세계가 쉬운 세계가 아니구나, 이런 게 있었고요. 그다음에 최근에는 이런 플랫폼이 갖고 있는 링크에 의한 위협이 있다 그래서 특히 유럽연합에서는 구글에 대한 링크세를 부과하는 그런 가이드라인 통과시켰죠. 이런 식의 논의들이 진행되고 있다. 그다음에 도서관에서 가장 관심 있다고 나중에 써달라고 하는 것인데 결론적으로 고아저작물이 현재 저작권법에도 규정이 있거든요. 그걸 가지고 하면 족하다. 그다음에 공공대출권 얘기를 하시는데 이 공공대출권은 반대로 얘기하면 저작자 입장에서는 내 것을 그냥 쓰겠다는 의미거든요. 이게 첨예한 이슈 때문이지 저작권 문제 때문이 아니다. 이것은 협의에 의해서 얼마든지 할 수 있는 계약의 영역이지 저작권법에서 하라 마라 할 영역은 아니다. 그렇게 정리할 수 있고요. 그러면서 오픈 액세스에 대한 논의가 지금 전세계적으로 있는데 오픈 액세스와 되게 유사한 것이 뭐냐 하면 소프트웨어 분야의 오픈 소스 운동이에요. 그리고 일반 저작물 분야의 크리에이티브 커먼즈 라이센스 운동이죠. 얘네들의 특징은 뭐냐 하면 카피라이터가 강화되는 것에 대해서 반감을 느끼고 정보를 공유해야 되지 않느냐 하는 차원에서 카피레프트적인 운동을 한 것이거든요. 이것도 되게 유사하죠. 최근에 어떤 플랫폼이 나오면서 지금까지 누구나 쓰던 이런 교수들의 논문들을 돈을 받고 하니까 이러지 말고 우리 같이 한번 오픈 액세스 하고 같이 플랫폼을 만들자 이런 운동인데, 그전의 사례인 오픈 소스와 그다음에 CCL의 사례는 이것은 자발적 운동이지 저작권법에서 어떻게 할 수 있는 것은 아니라는 거예요. 라이센스를 갖고 자체적으로 하는 운동으로 해서 세력을 키워서 결국에는 극복해야 되는 것이다. 오픈 소스도 안 될 줄 알았거든요. MS 같은 데 하도 강해서 안 될 줄 알았어요. 지금은 소프트웨어기업들이 오픈 소스에 다 무릎을 꿇고 있기 때문에 그렇기 때문에 그런 점을 고려해야 될 것 같다, 이렇게 생각이 듭니다. 너무 시간이 지나서 이만 마치겠습니다. 감사합니다.



주제토론: 4차 산업혁명과 저작권법 개정 이슈

토론: 김성호 국회도서관 법률자료조사관
동영상에 대한 자막정보
김성호: 저는 3월달에 분과위원들도 모시고, 도서관 특히 지역도서관이나 대학도서관에서 당면하고 있는 문제에 대해서 많은 의견들을 내주셔서 3가지 정도만 토론주제로 정해 봤습니다. 첫 번째는 공공대출권 도입과 관련된 것인데요. 아시다시피 지금 저작권자 단체들에서 특히 공공대출권 또는 공공대출보상권이라 그래서 도서관에서 대출을 하는 도서나 음반이 이용되는 만큼 저작자는 판매의 기회를 잃기 때문에 그만큼 보상을 해 줘야 된다, 어떤 형태로든 보상을 해 줘야 한다는 논리고. 현재 영국이나 독일 같은 데서 시행을 하고 있습니다. 그런데 교수님 발제자료에도 나와 있습니다마는 이게 우리 저작권법에서는 내가 예를 들어서 도서를 판매를 하게 되면 판매를 함과 동시에 대표권은 다 소진이 됐다고 보는 것입니다. 그래서 유럽대륙법에서는 그것을 권리소진의 원칙이라고 부르고 미국에서는 최초판매원칙이라고 이렇게 얘기를 합니다. 우리나라랑 미국은 지금 최초판매원칙, 원칙이기 때문에 현재 당연히 공공대출권은 인정이 되지 않고 있죠. 그런데 이제 말씀드린 대로 이런 몇몇의 선진국에서 저작권자의 권리를 보호하기 위해서, 또 경제적 이익을 보호하기 위해서 이런 제도를 도입을 하고 있고, 우리나라의 저작자단체에서도 도입 요구가 굉장히 거센데, 이걸 도입을 해야 되느냐 그러면 또 도입을 한다면 도입주체를 어디에 한정시킬 것이냐. 온라인 저작물도 포함시킬 것이냐. 또 보상을 해 준다 그러면 비용부담은 누가 할 것이냐. 이게 지금 여기 오신 많은 단체들이 다 고민하고 계신 문제거든요. 또 공공대출권을 도입하지 않는다고 그러면, 도서관이 책을 구매할 때는 좀 비싸게 사주면 되지 않겠느냐, 이런 논의도 있고요. 이것하고 관련해서는 교수님께서는 이건 저작권법의 문제가 아니라고 하셨는데, 그러면 이게 관련해서 질문을 드리면 합의는 그러면 합의가 잘 되지 않겠죠. 잘 안 된다는 전제에서 저작자단체에서 이런 요구들을 하고 있는데 이런 이기주의 문제를 어떻게 보호해 줄 것이냐 혹은 사회적으로 어떻게 설득을 할 것이냐. 그걸 하나 질문을 드리고 싶고요. 두 번째, 오픈 액세스입니다. 오픈 액세스는 공공접근이라고 이렇게 번역을 하고 있는데요. 개념 아시다시피 세금이 들어가거나 하여튼 공공자금이 투입돼 가지고 만들어진 학술저작물이라든지 이런 것은 우리가 자유롭게 이용할 수 있도록 해야 한다, 국민의 세금이 투입돼서. 그래서 우리 저작권법에는 공공저작물을 국가나 지자체가 작성, 공표한 문건뿐만 아니라 계약에 따라서. 예를 들어서 대학교수님이나 연구소에 있는 연구원들하고 계약을 하고 산출된 학술저작물에 대해서 국가나 지자체가 지적재산권의 전부를 보유해야지만 지금 아시다시피 자유롭게 이용할 수 있습니다. 지금 영국이나 미국 같은 여러 선진국 10여 국에서 추진하고 있고요. 이것을 도입을 하게 되면 당연한 얘기입니다마는 출판, 유통업계와의 이해관계 조정이 하나 문제가 될 것이고, 토론쟁점 세 번째에 있는 내용을 그때도 가장 많이 말씀을 하셨는데, 특히 대학도서관 같은 데서는 해외자료 구독비용 때문에 도서관 인력을 줄여야 되는 이런 문제까지 당면해 있습니다. 해외저널 중에서 특히 우리나라에서 국가 예산으로 학술저작물을 작성하고, 해외 SCI 논문에 게재를 한 다음에 그걸 다시 역수입을 하고 있는 상황입니다, 오픈 액세스가 되지 않기 때문에. 그럼 이것 관련해서 저작권법으로 해결할 수 있는 문제는 없을 것인가, 이게 두 번째 질문이고요. 마지막으로 지금 Google Books Library Project 말씀하셨는데 다 아시다시피 도서관에 소장되어 있는 책을 당연히 수만권, 수백만권이 소장이 되어 있을 텐데 그 책을 저작자의 동의를 받지 않고 스캔을 해서, 우리가 인터넷에서 검색을 해 보시면 구글사이트에서 검색이 됩니다. 이게 그 프로젝트 때문에 그런 건데 일부 저작자단체에서 미국에서 소송을 했습니다, 2016년에. 그런데 이것은 도서관이 도서저작물을 공정 이용한 것에 해당된다. 미국 저작권법상으로 문제가 없다고 이렇게 판결을 했습니다. 그래서 구글에서 저희 국회도서관뿐만 아니라 서울대학교 도서관 등등 큰 도서관에서 같이 우리 이 프로젝트를 해 보자. 소장하고 있는 도서에 대해서 스캔을 해서 정보 검색용으로 제공하도록 해 보자라고 했는데 아시다시피 지금 국회도서관을 포함한 서울대학교도 마찬가지인 것으로 알고 있습니다. 지금 다 이 프로젝트에 참여하지 않는 쪽으로 기울어지고 있는 것 같습니다. 확정된 것은 아니지만요. 그러면 우리 지금 저작권법상으로 이런, 예를 들면 국회도서관이라 국립중앙도서관에서 소장하고 있는 도서를 전부 다 스캔을 해서 정보검색용으로 제공을 할 수 있을 것인가. 이게 어렵다는 것입니다. 현 저작권법 제31조 때문에. 그러면 우리 저작권법을 개정을 해서 구글이 지금 하고 있는 것처럼 디지털 복제 허용범위를 확대를 하고, 그걸 정보검색용으로 제공한 그런 프로젝트를 우리도 얼마든지 할 수 있고, 또 구글에 뒤쳐지지 않으려면 사실 저는 해야 된다고 생각을 하거든요, 이것은. 그래서 궁극적으로 우리가 구글처럼 그런 구글하고 제휴하지 않는다는 결정이 내려진다 그러면 우리가 자체적으로 안방도서관을 실현할 수 있어야 결국은 도서관에 있는 장서의 이용률을 높일 수 있다고 생각을 합니다. 그래서 세 번째 질문은 우리 현 저작권법 제31조의 타당성이라든지 개정할 수 있을 것인가 혹은 개정 필요성은 있는가, 여기에 대해서 질문을 드립니다. 정진근: 아까 박사님께서 저한테 저작권법 잘 모른다고 하셨는데 엄청 잘 아시네요. 들어보니까 저작권법이 아직 다 안 끝났네요, 끝났다고 생각하고 있었는데. 죄송합니다. 공공대출권에 대해서 우선 말씀드리면 공공대출권이라는 것이 도서관에서 지금 말씀드리는 대로 책을 팔면 책에 대해서는 계속 대출, 대여를 해도 저작권자에게 특별히 보상할 필요가 없다는 것이거든요. 최초 판매 이후에 권리가 소진되는 그런 책인데 여기에 대해서 계속 도서관은 빌려가니까 돈을 내라. 보상규정에 대한 이런 주장이 있죠. 거기에 대해서 우리도 그때 토론을 해 보니까 그때 느낀 건 뭐냐 하면, 여기 있는 여러 당사자들이 관여가 되거든요. 출판사가 관여가 되고, 다음에 그걸 벌어주는 징수단체가 관여가 되고, 다음에 이용자가 관여가 되는데, 오히려 굉장히 찬성하는 사람은 징수단체고, 오히려 출판사는 그렇게 많이 찬성하지는 않더라고요. 그리고 저작권법은 원래 본래 목적이 지식의 확장에 있거든요. 그렇기 때문에 도서관에서 빌려가는 책 자체를 우리가 이렇게까지 할 필요가 있느냐, 이런 얘기도 이용자 입장에서는. 그런데 다만 이제 그것을 E북까지 확장하면, 또 얘기가 완전히 달라지는데, 책을 결국 빌려줄 수 있는 이유는 유체물인 책을 팔았기 때문이에요. 그런데 E북은 유체물이 없기 때문에 권리소득이 되지 않거든요. 그리고 전속이 되기 때문에 배포권의 권리제한이라는 것에 걸리지 않아요. 결과적으로 E북은 계속적으로 빌려주는 것이 저작권을 침해하게 돼요. 그런데 문제는 뭐냐 하면 아까 이제 세 번째 주제하고 관련이 되는데, 이것을 계속 빌려준다고 그랬을 때는 당연히 저작자들, 출판사들의 권리를 너무 많이 해치거든요. 돈을 줘야 돼요. 그런데 여기에 대해서 제가 이제 그때 얘기할 때도, 따로 만나고 해 가지고 여러 가지 안을 제시를 해 봤어요. 왜냐 하면 정책위 결정 때 법을 바꾸니까. 그래서 아날로그 도서관도 해 주고, E북에 대해서 적절한 비용을 도서관이 지급하게 하자, 이런 질문을 했는데, 여기에 대해서 출판사들은 그 비용이 적어지면 사실상 출판업계가 공멸하게 된다는 그런 두려움을 갖고 있고, 또 적절한 보상을 해 주지 않을 것이라는 불신이 굉장히 강하더라고요. 그리고 또 하나 걱정이 뭐냐 하면 만약에 E북에 대해서 종량제 방식의 보상금을 지급하게 한다면 그것을 국회도서관이라고 감당할 수 있을까? 저는 감당할 수 없다고 봐요. 왜냐 하면 내가 제주도에서 조그마한 도서관을 하는데 그러면 사람이 가끔 오기 때문에 책 한권이라도 그 사람 보고 또 다른 사람 보면 되거든요. 그런데 E북으로 인터넷에 올려놓는다 그러면 서울에서도 빌려가고 부산에서도 빌려갈 거 아니겠어요? 제한을 두지 않으면 한 달에 100만권이 발생할 수 있거든요. 곱하기 1000원 계산하면 그것을 감당할 수 있어요, 도서관에서? 그렇기 때문에 출판쪽에서 말하는 종량제 방식이 굉장히 무리한 측면이 있거든요. 잘못하면 도서관들이 다 쪽박차게 된다. 그래서 이 둘의 관계를 의외로 조사할 게 굉장히 많다는 그런 과제를 지금 남기고 있는 상태다, 이렇게 말씀을 드립니다. 그다음에 오픈 액세스에 대해서는 여기 지금 쓰신 대로 공공저작물에 대해서는 이미 저작권법에 반영이 돼 있죠. 그래서 그 공공저작물을 배포하는 법률이 생겼기 때문에 그 문제를 해결하기 위해서 저작권법이 개정이 됐고 그래서 이미 해결이 됐는데, 문제는 오히려 문제로 남은 것은 타인의 저작권이 있는 저작물을 국가기관에서 올리고, 그다음에 개인정보가 들어 있는 주민번호까지 올리고 이런 게 문제가 되는 거예요. 주민번호를 올리면 당연히 개인정보법 위반이 있기 때문에 안 되는 것이고 또 타인의 저작권이 조금이라도 개입이 돼 있으면, 국가가 발주를 한다든가 실제로 저쪽이 저작권 갖는다든지, 아니면 국가기금에서 공동으로 갖는다든지, 이럴 때는 결국 사인의 저작권을 제한해야 되거든요. 공공대출권을 해결하기 위해서. 그런데 사인의 저작권을 이렇게 쉽게 제한할 수 있느냐. 이 문제는 굉장히 신중해야 된다. 그래서 여기 쓰신 대로 당사자들의 이해관계 조정해야 되는데, 이것이 그렇게 쉽지가 않은 문제고, 더군다나 해외저널 문제는 완전히 틀린 게, 해외저널 문제는 제가 굉장히 심각하게 생각하고 있는데 국가의 법적 영향력이라는 게 전세계적이지는 않잖아요. 미국에 있는 애들을 우리가 가서 때리고 그럴 수는 없잖아요. 그러면 결국에는 이번에도 문제가 되는 게 뭐냐 하면 플랫폼들이 값을 많이 올리니까 지금 국립대 도서관들이라든지 여러 협회에서 계속 대항하고 있는데, 그 사람들이 얘기하는 것은 왜 우리한테만 그래. SCI가 비싼데 왜 우리한테만 그래. 지금 이러고 있는 현실이거든요. SCI논문들을 계속 우리가 법률적으로 접근하기가 힘들다. 그리고 국내 플랫폼에 대해서는 물론 접근할 수 있는 방법들이 여러 가지가 있죠. 이미 학술지 내의 논문이 다 탑재가 되고 있는데, 그 데이터베이스를 활용해서 오픈 액세스를 시켜놓으면 될 것을 안 하고 있으니까 저쪽에서 다하고 플랫폼 만들어서 쓰고 있는 것이고, 또 이쪽에서 학진하려다 보니까 그럼 무슨 저작자들의 동의를 받아야 되거든요. 동의를 받아야 되는데, 제가 지금 법학소장인데, 부소장인데, 저희쪽에도 학진이라고 안 하고, 모 업체와 좀더 긴밀히 하기로 했어요. 왜냐하면 저작권료를 많이 준다 그러더라고요. 그래 가지고 결국 오픈 액세스의 이면은 뭐냐 하면 저작자들에게 또 저작권이 지급이 안 된다는 그런 게 있거든요. 그래서 상거래의 영역을 건드리는 것을 신중해야 된다, 이런 말씀을 드릴 수 있을 것 같고 그다음에 구글에 대해서 여기 이제 얘기를 하셨는데, 구글의 공정이용은 전부 다해서 안방도서관 실현하는 것은 아니에요. 정보를 제공하는 것이죠. 다 하려다가 그것까지 안 된다고 해서 제한해서 fair use(공정이용)인정을 받았죠. 그래서 안방도서관까지 되는 것은 아니고 정보 제공하는 것인데, 거기에 대해서 우리 법이, 예를 들면 우리가 좁은 범위만을 활용하고 있는 것은 분명하거든요. 그래서 이번에 고치려고 그랬는데, 지금 너무 많은 사용들이 겹쳐가지고 홀딩해 놓은 상태고, 그럼에도 불구하고, 우리나라는 이 규정만 보면 안 되고, 뭘 봐야 되냐 하면 일반적인 공정이용원칙을 봐야 되거든요. 저작권법 제35조의 3, 이걸 봐야 되는데 그게 얘기가 뭐냐 하면 각각의 개별적인 공정이용 규정에 해당 안 되더라도, 한번 체에 의해서 빠져나온 애들이라도, 공정이용원칙에 해당되면 다시 공정이용으로 보겠다는 것이거든요. 그런데 그 법률을 해석할 때 법원이 미국의 판례를 굉장히 많이 갖다씁니다. 그래서 구글 정도로 했을 때, 우리 법원이 31조를 인정 안 하더라도 35조의 3은 인정할 가능성이 굉장히 높다. 그래서 그런 식으로, 우선은 잇몸으로 버텨야 되는 것이 아니냐. 31조를 개정하려고 하면 너무 이슈가 넘쳐가지고 개정을 못해서 그래요, 35조의 3을 가지고 버텨도 아마 판결이 많아지지 않겠냐, 저는 이렇게 생각합니다. 김성호: 교수님 말씀도 있고 그러면 다 디지털화해도 되는 가능성으로 이해해도 될까요? 정진근: 구글이라는 것만 하시고, 그다음에 소송이 붙으면, 소송이 붙으면 어차피 국회도서관은 형사처벌을 받지 않을까. 판례를 남기는 역사적인 사명을 가지고 한 번 해보시는게 어떠신가.. 다른 도서관들을 위해서 사회자: 그러면 플로우에서 질문 있으신분들 말씀해 주시면 좋겠습니다. 교수님께서 지금 적극적으로 실제 현장에 있던 이야기를 많이 말씀해 주시는데 1시간이 너무 아깝다. 아쉽다. 적어도 1시간 반, 2시간은 할애가 되었어야 우리가 충분하게 토론이 될 수 있었을 텐데 아쉽다라는 생각이 드는데요. 좀 짧게라도 말씀을 해 주십시오. 소속을 말씀해 주시고 질문해 주십시오. 권혁진: 충북 제천에 있는 세명대학교에서 온 권혁진이라고 합니다. 제가 질문드리고 싶은 것은 저희 대학교의 학생들이 도서관에 많이 찾지를 않습니다, 요새. 상황이. 그러다 보니까 여러 가지 행사들도 하고, 그 중에 하나로 저희가 학생들 더 오게 하기 위해서 IPTV를 통해서 영화를 틀어주려고, 아니면 아이돌의 뮤직비디오를 틀어주려고, 이렇게 하고 있는데 지금 앞에 말씀하신 공공저작, 공공대출권 이게 혹시 적용이 돼서 문제가 발생될 수 있는지 여쭤보고 싶습니다. 정진근: 일반적인 상담인데요. 상식적으로 안 하시면 좋으실 것 같아요. 우선은 도서관에서 보통 학생들 보라고 DVD 빌려주고 이렇게 가서 보라고 하는 것 있잖아요. 빌려주고. 이것은 아까 말씀하신 권리소진의 원칙에 따라서 가능하다. 지금 안 되는 것은 음반하고 소프트웨어는 안 돼요. 가능하다. 그다음에 학생들 모아놓고 아예 틀어주는 것 있잖아요, 영화를. 틀어주는 것, 이것은 우리 법이 어떻게 돼 있냐 하면 판매용 음반이나 판매용 영화, 매체 그것을 사서 반대급부 없이 틀어줄 때는 된다, 이렇게 돼 있어요. 해도 되는데, 문제는 옛날에 무조건 다 됐는데, 요즘에는 호프집이라든지 커피숍 이런 데는 평수를 굉장히 좁혀가지고 제한해 놔서 호프 보면서 보기는 힘들어요. 하지만 도서관에서 틀어주면 호프는 안 마실 테니까 가능한데 문제는 여기에 평수 기준이 있는데, 평수가 1000평인가요? 3000평인가요? 그런데 이게 학교 전체로 보면 넘고, 도서관으로 보면 넘지 않는데, 평수 기준의 기준이 애매하기는 한데, 아마 도서관은 가능한 것으로 보지 않을까, 저는 이렇게 생각합니다. 권혁진: 요새 DVD라든지 이런 것들이 생산을 안하면서 업체에서, 그게 문제가 되다 보니까 저희가 온라인에서 그걸 사서 학생들한테 제공할 수밖에 없는 이런 문제... 정진근: 온라인에서 산다는 것은 아니고, 들어가서 스트리밍으로 만약에 틀어주는 문제를 아마 얘기하시는 거면, 이것이 권리소진의 원칙은 왜 생기냐 하면 유체물을 산 것에 대해서 소유자 권리를 보호하기 위해서 생긴 법리에요. 그러다 보니까 이게 스트리밍으로 하는 것까지 적용된다고 보기가 어려워요. 그럼 사셔서 해야죠. 권혁진: 이게 안 파는 걸로. 정진근: 안 파나요? 권혁진: 활용하시면 안 되는 거네요, 지금 말씀하시는 것 보면. 정진근: 그렇겠죠. 사회자: 그럼 다른 분께 넘기겠습니다. 정세찬: 경인교육대학교에서 온 정세찬입니다. 요즘 서체의 저작권 관련해서 제가 질문 드리겠습니다. 제가 학회 학생들과 학과 후에 행사를 진행하면서 안내라든지 자료들을 외부회사에 의뢰를 해서 제작을 하고 PDF를 저희들이 받아요. 그래서 그것을 웹사이트의 홈페이지에 공지를 하고, 학생들에게 안내를 하게 되면 그 부분이 저작권에 위배되는 겁니까? 정진근: 서체는 지금 아주 난리인데요. 그렇지 않아도 문화부에서 서체에 대해서 대응책을 마련하라고 그래서 제가 준비를 하려고 하는데, 서체는 되게 설명하기 어려운데, 쉽게 말씀드리면 서체는 저작권으로 보호가 안 되는데, 서체는 프로그램으로 보호가 돼요. 되게 특이하죠. 그래서 글자체를 쓰는 건 괜찮은데, 글자체를 쓰는 프로그램을 무단으로 컴퓨터에 복제하면 복제권 침해가 되는 그런 구조거든요. 그런데 지금 말씀하신 것은 외부에 맡겨서 그 사람이 뭔가 PDF파일로 만들어줬다는 거잖아요. 그러면 내가 폰트파일을 복제한 적은 없겠죠, 기본적으로. 그렇기 때문에 복제권 침해가 발생할 여지가 없다라는 것이고, 그리고 저기 뭐냐라는 것인데 그런데 요즘에는 PDF파일에 아예 폰트가 임베티드 된 경우가 있다고 하더라고요. 그래서 일부 나온 논문에 의하면, 그런 경우에 내 컴퓨터에 나도 모르지만 어쨌든 폰트파일이 복제되기 때문에 침해다 하는 논문이 나왔어요. 법원의 판례가 나왔던 것은 아닌데, 좀 위험하죠. 이용자 입장에서는. 그런데 그런 경우에도 제가 볼 때는 방어할 수 있는 게 여러 가지가 있습니다. 왜냐 하면 객관적인 사실만으로는 저작권이 침해됐다고 볼 수 있지만, 저작권 침해죄가 되기 위해서는 고의가 있어야 되거든요. 그런데 그런 경우 고의를 인정하기가 쉽지 않아요. 왜냐 하면 외부에 맡겼는데, 내가 겉으로 보고 PDF로 봤는데 그거 PDF에 임베디드 됐는지, 안 됐는지 어떻게 알겠어요. 그렇죠? 그 다음에 민법상으로도 손해배상을 하면 과실이 있어야 되는데, 그렇다면 과실을 과연 인정할 수 있을까? 저는 그렇지 않을 것이다, 이렇게 생각을 합니다. 그래서 어쨌든 간에 폰트는 글자로 쓰는 건 괜찮은데, 지금 말씀하시는 글자로 쓰는 그런 형태인 것 같아요. 하지만 임의로 돌아다니는 폰트파일을 내려받아서 쓰는 것은 침해다, 그렇게 볼 수 있고요. 거기에 대해서는 저작권 침해로 볼 것인지 아니면 디자인권 침해로 볼 것인지, 이런 것들에 대해서 이번에 안을 정확히 마련하자. 그래서 올해 과제가 진행될 것으로 알고 있어요. 정세찬: 그러면 저희들 외부업체에 제작의뢰했을 때, 그 업체가 폰트를 소유하고 있더라고요, 직접 구매를 해서. 그런데도 그런 상황이 폰트 제작 법무팀에서 그런 부분을 계속해서 내용증명을 보내는 그런 사례는 어떻게 보시는지요. 정진근: 거기에 대해서 그렇게 응답하시면 되죠. 우리는 글자만 받았을 뿐인데 그 폰트 제작회사에 폰트가 있는지 거기 가서 따지시라, 이렇게 하면 되죠. 그리고도 계속 내용증명을 보내면 가만히 있으면 거기서 알아서 소송을 걸겠죠. 그럼 가서 애기하시면 되죠. 정세찬: 감사합니다. 사회자: 참고로 부연설명 드리자면 한국저작권위원회에서 문화체육관광부 홈페이지에 가시면 글꼴 저작권 침해 관련해서 안내서가 올해 1월에 올라가 있습니다. 사례별로, 이런 케이스는 침해가 되는지, 안 되는지 자세하게 안내하기 때문에 참고를 해 주시면 좋겠습니다. 정진근: 그리고 거기서 오면 한국저작권위원회 법정위원회지 않습니까? 거기다가 조정신청을 하세요. 그럼 제가 컴퓨터프로그램 분과의 조정위원이거든요. 그럼 제가 조정해드리니까 설명을 잘해 드릴게요. 사회자: 또 다른 분이 계십니까? 임동규: 안녕하세요. 저는 중앙대 학술정보원에 근무하는 임동규라고 합니다. 제가 한 가지 질문을 드리고 싶은 것은 저희가 교수님도 아시겠지만, 대학에서 현재 미소장 조달이라는 그런 도서들이 있잖아요. 정진근: 무슨 도서? 임동규: 미소장. 소장하지 않는 저널이나 전자서류 같은 경우에 컨소시엄을 통해서 그것을 서로 원문 복사를 하다 보면 전자 디지털 형태로 왔다갔다 해요. 그런데 지금 그 상황이 좀 정확히는 모르겠지만, 그것을 이용자한테 바로 디지털자료로 제공하지 못하는 걸로 알고 있는데, 실제로는 또 현장에서는 일부 제공을 한단 말이에요. 그런데 이런 부분에 대해서는 어떤 법적 개정이 필요할 것 같은데, 이런 부분에 대해서 어떻게 진행되고 있는지 그것 좀 알려주시면 고맙겠습니다. 정진근: 소위 말하는 관을 넘어서는 디지털자료의 제공, 사용문제인데 이제 보통은 디지털자료를 쓰기로 하는 계약이, 출판사쪽이랑 있다고 하더라도 한 학교, 한 도서관 안에 한정이 되죠. 만약에 그 밖에, 내가 중앙대학교인데 예를 들어서 연세대학교랑 같이 교류협력하기로 했어요. 그래서 프린트해서 교류협력해서 주죠. 하지만 전자자료를 주기로 한 계약을 서로 MOU를 맺고, 계약을 맺어서 연세대랑 하더라도 그것은 두 분의 문제일 뿐이고, 출판사 현황과 관련된 것은 아니니까 그 부분은 계약법적으로 해결을 하셔야죠. 지금 말씀하신 것은 그렇게 널리 쓰여야 되니까, 우리가 미소장자료에 대해서는 공정용으로 보는 입법을 해야 된다, 이렇게 말씀하시는 거죠. 임동규: 그렇죠. 공공성을 강조해서 만일 실제적으로 대학교 내에서만 제공을 하면, 그것은 어느 정도 법의 예외를 두는 상황으로 그렇게 두는 게 어떤가 하는 게 제 생각입니다. 임동규: 저도 그렇게 생각합니다. 그렇지만 아직까지 개정이 그것과 관련해서는 충분히 논의가 안 된 것 같고요. 미소장자료 중에서 아예 저자를 알 수 없거나 하면 그건 고아저작물이 되는 거거든요. 그것도 한국저작권협회에다가 법적으로 신청을 하면 일정 금액을 공탁하고 쓸 수 있도록 해 줘요. 그런데 그게 만약에 고아저작물이 아니라면 권리자가 살아 있는 것이거든요. 살아 있는 권리자가 있는데도 불구하고 어떤 법에서 제한을 두는 것은 굉장히 신중해야 되는 문제임에 틀림없죠. 임동규: 한 가지만 더 물어보겠습니다. 말 나온 김에 지금 각 대학도서관에서는 출판사에서 바로 전자자료를 구입을 해요. 바로 카드로 결제를 해 가지고, 그러면 그것을 받아가지고 이용자한테 디지털자료로 바로 제공을 해도 그건 큰 문제가 없습니까? 정진근:그건 전자자료 제공에 관해서 출판사하고 라이센스 관계를 봐야 됩니다. 어떤 식으로 라이센스했는지. 예를 들어서 동시 사용자 3명으로 줄 수 있게 했는지 아니면 그런 제도가 전혀 없는지. 무제한으로 줄 수 있는지 라이센스를 봐야 돼요. 계약관계. 어쨌든 말씀하시다 보니까 답답하죠. 원래 법학이 그래요. 다른 사람. 이 사람, 저사람. 이깟 것, 저깟 것, 다 하다 보면, 이게 참 안 된다고 얘기할 게 많죠. 저도 답답합니다.



Data Science & AI

발표: 한선호 Executive(상무), Data & AI, IBM Korea
동영상에 대한 자막정보
한선호: 오늘 제가 말씀드릴 것은, 작년까지 왓슨이라는 브랜드를 총괄하다가 사업부서가 데이터하고 AI가 합쳐졌습니다. 그래서 데이터 & AI도 이번 컨퍼런스 주제하고 같이 맞는 것 같습니다. 또 제가 예전에는 열심히 그냥 잘 팔기만 하면 되는 영업부를 총괄하다가 지금 서비스팀 실제로 제가 팔아오면 구현하는 팀까지 다 같이 맡았어요. 막상 실제 구현하려고 하니까 팔 때는 쉬웠는데 구현하기가 되게 어렵더라고요. 그래서 실제 지난 기간 동안 저희가 해 왔던 일들을 같이 공유 드리면서 과연 데이터하고 AI가 어떤 연관성 있는지 말씀드리겠습니다. 작년에 제가 말씀드렸던 복습을 잠깐 드리면 AI 왜 Enterprise. 기업 혹은 기관에서 필요한가를 말씀을 드렸었는데요. 그 때 이렇게 말씀드렸어요. 우리가 실제 활용할 수 있는 정보화된, IT가 최대한 정보화가 고도화돼서 활용할 수 있는 데이터는 여전히 20%밖에 되지 않고 우리가 사실은 활용하지 못하는 80% 데이터가 앞으로 삶을 어떻게 바꿀 건지가 가장 큰 화두다. 그러면 실제 나머지 80%는 기존에 IT라고 하는 정보기술이 읽어드리지 못했던 다른 방식으로 우리가 활용할 수 있어야 되고 그게 바로 인공지능이 천천히 해 나가야 될 역할이다. 앞서 말씀드렸던 인공지능은 되게 오래된 기술이지만, 우리가 활용할 수 있는 것부터 차근차근 해 나가자고 하는 게 아마 작년에 제가 말씀드렸던 거고 기업에서 실제로 활용을 하려다 보면 첫 번째는 굉장히 많은 디지털 트래픽이 만들어지는 데이터를 가져다가 우리의 고객 혹은 우리 내부의 직원들을 위해서 어떻게 적절하게 활용해 줄 거냐의 측면에서, 1차적으로 AI가 활용이 되고 두 번째는 도서관도 마찬가지일 것 같아요. 굉장히 많은 데이터들을 내가 원하는 때, 원하는 시간에 원하는 정보를 정확하게 받아내기 위해서 제가 예를 한번 들어드렸죠. 그때 네이버 검색, 구글 검색 이런 것들을 우리가 보통 쓰는데 사실은 정보가 없어서 내가 원하는 정보를 못 찾는 게 아니라 너무 많은데 나한테 꼭 맞는 걸 찾아내기가 굉장히 어려운 거죠. 그 속에서 인사이트를 얻어내는데 AI를 활용하고 또 하나는 IT가 굉장히 많이 발달했다 하더라도 사실 프로세스가 굉장히 단순한 흔히 비속어로 얘기하면 노가다성 업무들이 여전히 남아 있죠. 사람이 굳이 하지 않아도 되는데 안 할 수 없는, IT로 하기 어려운 일들. 그런 분절된 IT프로세스를 이제 AI가 하는 역할 3가지를 말씀드렸어요. 제가 작년까지 말씀드렸을 때만 해도 불분적으로 퍼스트 무브라고 먼저 내가 해 볼게라는 분들이 여전히 시장을 주도했는데 이제는 좀 더 바뀐 것 같아요. 지난 1년 사이에 이미 많은 고객분들이 하시고 그걸 가지고 더 이상 AI 신기술을 적용해 보는 experiment, 실험이 아니라 내 비즈니스의 효과를 얻어야 된다라는 게 더 명확해지신 것 같아요. 보시는 것처럼 은행. 주로 금융기관이 많이 하죠. 그래서 아까 처음 말씀드렸던 Customer Engagement. 우리 내부 고객이든 외부 고객이든 우리 고객의 금융서비스를 어떻게 내가 적절하게 해야 돼요. 아까 잠깐 보여드렸던 스피커기반이든 음성기반이든 텍스트기반이든 어떤 형태든 실제로 단순반복적인 것들을 대신 해 준다든가 혹은 사람이 잠자고 있을 때 대신 해 준다든가 하는 서비스를 가지고 보시는 것처럼 실제 비즈니스의 계약을 늘린다든가 실제 콜센터에 콜을 줄여서 비용을 절감시킨다든가 실제로 트렌젝션을 많이 일으켜서 우리 고객을 확보한다든가 하는 데 있어서 이미 쓰이고 있고요. 국내에서 작년에 제가 말씀드린 현대카드도 설명드릴 때 챗봇으로 시작했지만 음성으로 이미 넘어왔습니다. 음성으로 이미 거래를 하고 있고 선결제를 하고 있어요. 선결제 아세요? 한도가 높으신 분들이신 것 같은데 요즘 젊은 친구들은 카드 한도가 보통 300만원 이렇게 2, 300만원 되나봐요. 그래서 카드 쓰다 보면 한도가 차는 거죠. 그럼 내가 어카운팅 계좌 가지고 일부 선결제 서비스를 하는데 그게 현대카드 비즈니스의 70% 콜센터 들어오는 게 다 선결제입니다. 그런데 선결제 하게 되면 상담을 하고 많은 대화를 해야 돼요. 뭐하려고 들어왔고요. 얼마큼 할 거고요. 어디서 계좌에서, 되게 많잖아요. 이러면 실제 대기시간이 굉장히 길거든요. 그걸 바꾼 거예요. 예를 들면 지난달 내 결제금액 중에서 얼마를 어떤 계좌에서 선결제하죠라고 하면 그냥 듣고 처리하는 겁니다. 시간이 거의 한 1분 30초 안에 끝나는 거죠. 기존에 7분, 8분, 심하면 15분, 20분까지 대기했던 것들이 끝나는 거죠. 그래서 이미 국내 기업들도 기존의 텍스트베이스에서 음성으로 많이 넘어가고 있고요. 부산은행은 굉장히 새로운 시도를 했었어요. 지역은행이기 때문에 내가 다른 은행들이 하는 챗봇 똑같은 거 해 봐야 소용없어. 그래서 어떻게 했냐 하면 보통 챗봇은 뭐죠? 약간 reactive 하는 거잖아요, 반응하는 거죠. 말을 걸면 대답해 주고. 부산은행 챗봇은 말을 거는 거예요. 그래서 나의 고객이 앱이나 웹에서 내 사이트에 와서 행동했던 패턴들. 예를 들면 직장신용대출을 한번 열어봤다든가 뭐해 봤다든가 일주일에 몇 번 이상을 우리 사이트에 들어와서 대출과 관련된 것을 검색했다면 이 사람 분명 뭔가 대출에 관련된 뭔가 상담을 받고 싶은 거잖아요. 그랬을 때 먼저 그 사람의 모바일이든 웹에 들어가서 블링크를 해 주고 너 이거 필요하니라고 실제로 먼저 다가가는 형태의 서비스를 하는 걸로 패턴을 바꿔갑니다. 이제는 단순히 기술이 중요한 게 아니라 어떻게 고객의 경험을 바꿔가는지에 대해서 AI를 활용하기 시작했던 것 같아요. 하게 된 것 같아요. 롯데는 너무 잘 아시는 내용이고요. 인사이트측면에서도 완전히 다른 형태를 가져갑니다. 아까 보셨던 것처럼 은행업무, 도서관 마찬가지일 것 같고 증권사업무 다양한 업무들 보면 그 안에 있는 수많은 정보들을 내가 실시간으로 원하는 시간에 받아내기 되게 어렵죠. 그것들을 이미 구현해서 운영하고 있고요. 재미난 것은 롯데제과 얘기는 많이 들어보셨나요? 롯데제과의 과자들이 바뀌어가고 있어요. 그런데 그 바뀌는 과자들이 시중에 시제품으로 나오면서 계속 완판이 되고 있어요. 되게 재미난 것은 뭐냐 하면 이게 다 밀레니얼들, 제너레이션G라고 하는 우리 신세대들을 어떻게 이해하는지가 되게 중요한 건데 그들이 남긴 소셜데이터 관련해서 트렌드분석데이터를 실시간으로 걷어서 그것을 실제 새로운 제품 만드는 데 활용을 하십니다. 깔라만시, 여기 보시면 무슨 버팔로윙, 양파샌드, 이런 것들이 사실은 신세대들이 원하는 테스팅에 대한 트렌드를 읽어서 제품으로 바로바로 만들어낸 거예요. 실제 비즈니스에 엄청난 변화를 가져가려고 하는 겁니다. 이게 바로 마켓센싱이에요. 마켓센싱하는 데도 실제 AI를 이미 활용하고 있습니다. Process Automation도 마찬가지예요. 그래서 요즘 법률, 유통. 되게 다양한 분야에서 예를 하나 들어드리면 브라질 같은 데는 실제로 노동법 관련된 소송이 굉장히 많습니다. 그런데 이 많은 소송들을 처리할 수 있는 법률회사는 정해져 있어요. 그러다 보면 이 사람이 Inquiry(무역용어. 제품에 대한 구매 의향)를 보낸 나의 가슴 아픈 이야기를 잘 분류해서 어떤 건 처리를 넘겨야 되고 이게 소송이 걸렸을 때 얼마나 빠른 시간 안에 처리해줄 지에 대한 실제 처리를 하는 것들이 굉장히 단순반복적인 일들인데 그런 것들 실제 AI 도움 받아서 하고 계시고요. 보시면 사람이 했을 때 한 65% 정확도를 갖는 걸 이미 얘가 80%를 넘어갔어요. 사람을 대체하는 게 아닙니다. 반복적인 일에 계속해서 노동집약적으로 하는 업무들을 일부 실제 AI 도움을 받아서 좀 신속하게 처리하는 거고, 오히려 내가 해야 될 일은 그 사람을 도와서 이 사람이 정당한 판결을 받게 해 주는 데 시간을 더 쓰게 만드는 거라고 보시면 될 것 같아요. 통신사 역시 마찬가지고요. 그래서 되게 많은 진화를 가져가고 있는데 그럼에도 불구하고 저희들에게 또 다른 Lessons Learnt이 있어요. 바뀌지 않는 게 있어요. 바뀌지 않는 건 뭐냐 하면 아직도 여러 고객분들은 내가 만들어오면 알아서 쓰겠지라는 생각을 가지고 AI를 가지고 되게 다양한 챗봇을 만들려고 노력하세요. 그런데 절대로, 여기 계신 분들 사용자라는 관점에서 보세요. 그냥 만들어놓으면 쓰지 않죠. 그렇죠? 한번 호기심삼아 들어가 보겠지만 얘가 정말 나한테 도움주지 않으면 쓰지 않습니다. 여전히 그런 생각을 많이 가지고 계세요. 두 번째는 데이터 관련된 얘기인데 가비지가 들어가면 얘는 가비지밖에 대응 못해요. 그래서 처음에 사람인데 하는데 서비스하려면 잘 응대하는 콘텐츠를 잘 준비하는 과정부터 들어가야지 AI가 먼저가 아니에요. 그런데 여전히 아직도 가비지 가지고 AI를 하려는 고객분들이 있으시고요. 한 번에 너무 큰 것을 만드시려고 하는 경우도 있고 두 번째는 결국은 AI라는 것은 사람처럼 이렇게 reasoning(추론) 해서 확률적으로 제가 전에 말한 것처럼 비가 올 것 같아, 비가 안 올 것 같아? 확률적으로 이게 맞을 것 같아라고 하는 얘기 때문에 여전히 deterministic(결정론적인) 하지 않고 probabilistic(확률론적인)하게 저희가 계속 얘기하는데, 고객분들은 정해 놓고 서비스하는 걸 여전히 원하세요. 바뀌지 않더라고요, 쉽게. 아마 고민은 계속해서 해 보셔야 될 것 같고요. 많은 변화들이 있는데 이제 더 이상 챗봇은 AI에서 벗어나는 것 같아요, 다행히. 제가 작년에 모든 AI가 챗봇으로 왜곡됐다라고 말씀드렸잖아요. 불 꺼줘, 뭐 해줘. 이거 하는 게 사실 AI가 해야 되는 세상을 변화시키는 일은 아니라고 봅니다. 드디어 챗봇을 벗어나려고 하고 있고 이미 많은 고객분들이 AI를 활용해서 테스트를 많이 해 보셨기 때문에 이제는 저희 보고 알아서 다 구현해 줘보다는 좀 도와줘, 여기까지 해 봤는데. 이런 고객들이 많이 늘어나고 계세요. 말씀드렸던 것처럼 더 이상 실험에 대한 과정은 끝났고 실제 나의 업무에 어떻게 적용할지를 놓고 얘기하는 시기라고 이해하시면 됩니다. 드디어 그러다 보니까 겉도는 형태의 할 수 있는 것들 할 때는 별로 민감하지 않았는데 나의 본연의 업무에 AI를 활용하기 시작하다 보니까 데이터에 대한 sensitivity가 되게 높아졌어요. 이게 안 보이는데요. 보이세요? AI는 되게 파워풀해요. 제가 정말 느끼는 게 되게 파워풀해요. 그런데 여전히 잘못 이해되고 있는 게 있습니다. 이건 전혀 안 보이는 것 같은데요. 제가 그냥 설명을 드릴게요. 현재 우리가 많은 부분들 시장에서 하고 있는 AI는 narrow AI라고 합니다. 그래서 문서를 분류한다든가 대화를 응대하는 interaction(상호작용)을 한다든가 하는 되게 특정영역의 narrow AI예요. 조금씩 broad AI로 넘어가고 있어요. 뭐냐 하면 사람하고 논쟁을 한다든가 추론하는 과정이 좀 더 고도화된다든가 하는 broad AI로 가고 있습니다. 그런데 아직도 고객분들은 general AI를 얘기하세요. 그게 뭐냐 하면 사람처럼 생각하고 사람처럼 알아서 공부하고 이것 할 수 있는 것 아니야라고 하시는데, 그렇게 갔으면 좋겠는데 아직까지 기술은 general AI까지가 아니라 사실 narrow에서 broad AI로 넘어가는 과정에 있다 보니까 왓슨이 진짜 할 수 있는 일은 아까 말씀드렸던 우리가 하고 있는 연구라든가 검색을 조금 더 가속화하고 고도화시키는 것 그 다음에 확신을 기반으로 하는 추천서비스. 어떤 고객하고 상호작용을 한다는 부분. 그 다음에 어떤 특정한 compliance 이슈나 프로세스가 하는 리스크가 있을 때 미리 잡고 이것에 대한 리스크를 특정 사람한테 미리 알려줘서 리스크를 완화하는 부분, 그 다음에 지식적인 부분을 확장하는 부분 그 다음에 평가하고 차별하는 것들 선도해 주는 부분, 이렇게 나눠서 있습니다. 실제 이게 왓슨이 할 수 있는 일이에요. 그런데 이 왓슨이 진화하고 있어요. 되게 재미있게 진화하고 있는데 제가 우스갯 얘기로 말씀드리면 저희 사업부는 브로셔를 못 만들어요. 브로셔를 기획하고 제작하고 나오는 데 보통 한 요즘 되게 빨리 하는데도 한 달 반 정도 걸려요. 빨리 하는 거죠. 기술 정리해 가지고 이렇게 해서 인쇄 찍어서 나가는 것 준비하는데. 그런데 한 달 반이면 밖에 있어요. 그래서 브로셔를 안 만든 지가 한 1년 가까이 됩니다. 고객분들 맨날 얘기하세요. 뭐 좀 보내줘봐. 보내드리면 뭐하냐고요, 바뀌는데. 바뀌면 내가 도입하는 데 힘들겠네, 그건 아니에요. 정해진 기능이 바뀌고 기술이 바뀌다 보니까 그냥 그 상태에서 계속해서 진화된 기술을 활용하시게끔 하는 게 AI의 트렌드예요. 기존에 있는 우리 흔히 얘기하는 이제 소프트웨어 솔루션하고 다르게 보셔야 돼요. 그래서 바뀌고 있는데 첫 번째 이 바뀐 게 뭐냐 하면 IBM이 잘나서 바뀐 게 아니라 고객들의 요구들이 되게 다양해졌어요. 그걸 저희가 계속 받아들이고 있어요. 첫 번째는 왓슨에게 각각 개별 요소 솔루션들이, API들이 대개 외부블록처럼 되어 있다는 말씀, 그건 하나의 기능기능 요소들이 솔루션화가 되고 있어요. 그래서 그 자체 하나 API만 가지고 되게 다양한 일들을 할 수 있게 만들었고 두 번째는 비즈니스 솔루션이라고 하는 것은 뭐냐 하면 이제 왓슨은 저희가 수만 개 케이스라고까지 나왔는데, 글로벌링. 그게 되다 보니까 패턴화돼 있어요, 왓슨을 활용하는 게. 그래서 쉽게 가져다놓고 빠르면 4주 안에 나의 업무에 AI를 적용하는 형태의 패턴화된 솔루션을 갖다 쓰시게끔도 만들어져 있고, 두 번째는 드디어 왓슨이 Anywhere라는 걸 선언했습니다, 올 2월에. 쉽게 말씀드리면 왓슨 기존에 클라우드베이스에서 가져다쓰시는 거였잖아요. 왓슨을 고객사에 놓고 쓰실 수 있어요. 설치형 왓슨이 나왔고요. 이 왓슨이 저희가 예를 들면 아마존에다가 설치해서 쓸 수 있고 MS에다 설치해서 쓸 수 있고 구글에다 설치해서 쓸 수 있습니다. 그래서 말 그대로 왓슨 Anywhere예요. 왓슨이 필요하신 모든 고객들이 그냥 가져다가 설치할 수 있게끔 바뀌었습니다. 되게 큰 변화죠. 저는 작년까지는 계속 클라우드를 하셔야 됩니다 외쳤는데 이제 할 말이 없어졌어요. 그래서 올해 왓슨을 설치한 고객이 한국에 들어왔고 서비스를 하고 있습니다. 특히 음성으로 하는 STT 같은 서비스들은 고객의 음성 자체가 biometric 데이터예요. 생체데이터이기 때문에 되게 민감하거든요. 그간에 사실 클라우드로 확대되기 되게 어려웠어요. 그런데 이제 설치용 왓슨이 나오면서 보이스쪽이 굉장히 크게 확대될 것으로 보이고요. 네 번째, 마지막인데 뒤에 설명을 또 드릴 텐데 AI를 위한 AI가 나왔어요. 제가 잠깐 한번 그때 언급은 드렸던 것 같은데 AI가 얘기하는 이 답을 내가 어떻게 믿어라고 하는 거였죠. Transparency trust 얘기를 했었는데 그래서 그 AI가 실제 바이러스되지 않고 정확하게 하고 있는지를 모니터링하고 관리하는 AI가 나왔습니다. 그게 바로 왓슨 오픈스케일 그 다음에 왓슨은 사실은 만들어져 있는 거고 나의 데이터를 가지고 AI를 할 수 있게 되어 있는 왓슨스튜디오라는 제품이 나왔어요. 그래서 더 이상 상용화된 AI를 쓰실 수 있고 내 데이터를 갖고 내가 AI를 만들어 쓸 수 있는 세상이 됐습니다. 그래서 저희가 이것을 챕터2라고 합니다. 그래서 이제는 우리가 챕터2 Reinvention 한다고 하고 있고요. 그래서 AI를 실제 나의 비즈니스에 어떻게 계속해서 확대시킬 거냐가 사실 이제 화두, 올해의 화두. 가장 큰 화두입니다. 여기 우리 회장님 되게 싫어하실 것 같은데 Ginni Rometty 저희 회장이시고 6월달에 IBM 되게 큰 행사 씽크에서 얘기를 하셨어요. 4가지 얘기를 하셨는데 아까 말씀드렸던 Scaling AI. 이제는 실제 본인의 업무에 AI가 많이 들어가야 되고 Bulid Your Own AI가 뭐냐 하면 기존에 왓슨의 상용화된 AI를 쓰시는 게 아니라 고객의 데이터를 가지고 와서 머신러닝이든 딥러닝 알고리즘을 만들어 쓸 수 있는 환경을 IBM이 제공을 해요. 그게 두 번째고 세 번째 아까 말씀드렸던 AI를 실제 모니터링하고 관리하는 애, 네 번째가 실제 AI를 가기 위한 우리 Ladder가 사다리거든요. 그러니까 실제 AI를 뻥 튀고 갈 수 있을 거라 생각했는데 그렇지 않더라고요. 프로젝트 해보면 고객이 데이터가 정말 가비지가 많아서 프로젝트를 못하는 경우도 있고요. 설계만 하고 스톱되는 경우도 있고 데이터는 되게 많은데 쓸 수 있는 게 없거나, 되게 많더라고요. 그래서 실제 이제 AI로 가기 위한 단계적인 접근을 어떻게 해야 되는지가 저희가 갖고 있는 화두입니다. 그래서 보시면 AI Ladder라는 게 결국은 실제 어떤 데이터를 가져다가 활용할 건지부터 고민을 해요. 그래서 실제 우리가 컬렉트하는 데이터부터 되게 많은 고민을 하고 있고 데이터를 모아놨다고 끝나는 게 아니라 내가 데이터를 모아놓고 원할 때 어떻게 카탈로그처럼 이렇게 조합해서 쓸 수 있는지에 대한 환경을 만들어야 되고 그 다음에 데이터를 분석하고 그걸 가져다가 실제 AI에 접목시키는 이런 AI Ladder가 되게 시장에서 화두예요. 그래서 이제 고객들이 아세요. 이제 무조건 AI로 가는 게 아니라 또 무조건 AI 솔루션을 웹에 갖다가 IBM것, 어디 것, 어디 것 갖다가 쓰면 되는 게 아니라 단계적으로 내 데이터를 준비해서 AI로 가야 되는구나라고 하는 것들이 좀더 명확해지시는 것 같습니다. 실제 AI portfolio를 보시면 여기 기존에 왓슨이에요. 왓슨이 만들어준 것 쓰시는데 보시는 것처럼 실제 데이터를 내가 가져다가 개발하고 운영하고 모델을 개발하고 실제 런타임으로 딥플로이시켜서 운영하는 환경까지가 다 portfolio, 확대가 돼서 갑니다. 그래서 기존에 많은 고객분들이 왓슨 자체 말고 내 것 가지고 할 수 있는 방법이 없어라는 얘기를 많이 들었는데 이제는 저희가 전체적인 것을 대응하고 있는 과정이고 그럴 수밖에 없는 것 같아요. 왜냐하면 이제 실제 데이터와 AI의 가장 큰 화두는 Open&Secure예요. 수많은 vendor들이 내가 AI 솔루션이 좋아라고 얘기하지만 사실 그 안에 세부세부 들어가보면 대부분 오픈소스 기반입니다. 어느 그 vendor가 다양한 오픈소스들을 잘 적용해서 수많은 고객들한테 쉽게 적용해 줄 거냐 그 다음에 더 중요한 것은 내 데이터를 어떻게 Secure하면서 가져다 줄 거냐가 가장 큰 화두가 될 것 같고요. 실제로 오픈소스를 가져다가 하는 것에 굉장히 많은 노력들을 하고 있어요. IBM 역시 되게 많은 노력을 하고 있고 그래서 보시는 것처럼 이 시장에 있는 수많은 오픈소스. 여기 보시면 특정 vendor이름은 없죠? 다양한 오픈소스 기반의 AI 알고리즘을 가져다가 되게 다양한 형태의 클라우드든 그런 환경에서 AI를 활용할 수 있게끔 하는 게 지금 현재 화두라고 보시면 되겠습니다.



Library Transformation in the 4th Industrial Revolution

발표: Rob Smith, Microsoft APAC Senior Solution Specialist
동영상에 대한 자막정보
Rob smith: 안녕하세요. 시작하기에 앞서 여러분들에게 사과의 말씀을 드리고자 합니다. 제가 오늘 영어로 진행하게 된 점과 제가 호주사람으로서 호주 영어를 여러분들에게 들려드리게 된 점입니다. 오늘 저를 이렇게 환대하여 주시고, 또 이렇게 미래를 선도하는 회의에 마이크로소프트를 초대 하여주신 점에 대해서 감사말씀을 드립니다. 사회자님께서 저의 경력을 소개해 주신 것처럼 저는 마이크로소프트 아시아태평양 지역 사무소에서 일하고 있고요. 이 지역에는 뉴질랜드나 한국 그리고 스리랑카 국가들이 포함됩니다. 저는 10년 정도 호주에서 MS 기술 부문에서 근무했고요, 이후 MS 싱가포르 지사에서 5년 정도 일해왔습니다. 앞서 3명의 연사께서 아주 환상적으로 잘 설명해 주신 것처럼 저는 오늘 4차 산업혁명에 있어서 도서관 혁신에 대해서 여러분에게 말씀드리도록 하겠습니다. 여러분께서 잘 아시는 것처럼, 지금 현재 일어하는 가장 중요한 일 중 하나는 바로 변화입니다. 변화가 점점 가속화되고 있고 과거에 이렇게 변화가 급변하게, 아주 급하게 일어났던 적은 없었죠. 그리고 변화는 점진적으로 더욱 빠르게 일어나고 있습니다. 4차 산업혁명이 일어나기 전에 여러분이 아시는 것처럼 1차, 2차, 3차 산업혁명이 과거에 있어왔죠. 저는 제4차 산업혁명을 다음과 같이 3가지 분야로 설명하고자 합니다. 첫 번째로 물리학에 있어서는 자율주행자동차나 로봇공학, 3D프린팅 그리고 이전에는 우리가 들어보지 못했던 신소재입니다. 그리고 두 번째는 굉장히 흥미로운 생물 분야인데요. 의약분야의 발전이나 유전자 분석이 여기에 포함됩니다. 의약이나 의학 분야가 앞으로 어떻게 발전할지 굉장히 주목됩니다. 세 번째 분야는 좀 더 가시적이고 포괄적인 분야인 디지털 분야입니다. 디지털 분야에는 사물인터넷, IOT나 블록체인, 인공지능, 퀀텀 컴퓨팅이 포함됩니다. 이 가운데 굉장히 주목해야할 분야가 퀀텀 컴퓨팅이라고 생각하는데요, 비유하자면 지금 우리가 가지고 있는 컴퓨팅 파워의 기술이 기어 다니기 시작하는 아이라면, 앞으로 퀀텀 컴퓨팅은 달나라로 비행하는 정도까지 발전하게 될 것입니다. 4차 산업혁명의 발전 동력은 기술의 혁신이라고 할 수 있는데 이 기술혁신의 변화의 속도가 가히 주목할 만하죠. 기술 혁신의 동력 가운데 하나는 데이터입니다. 데이터는 아주 중요하다고 생각합니다. 저는 데이터 자체는 원유와 비슷하다고 생각합니다. 원유가 정제되지 않으면 그 자체만으로는 별로 가치가 없죠. 클라우딩에 의해서 우리가 이전에는 갖지 못했던 컴퓨팅 파워를 갖게 되고 이것이 과거와의 가장 큰 차이점이라고 생각합니다. 이러한 컴퓨팅 파워의 발전으로 인해서 이제 기계학습(machine learning)이 가능해졌고 앞으로는 AI가 완전히 그 모습을 드러내게 될 것이라고 생각합니다. 이제 인공지능을 통해서, 이러한 발전된 기술을 통해서 앞으로 나아갈 수 있을 것이라고 생각합니다. 과거에도 AI가 존재해 왔는데 과거에 있었던 AI가 미래와 어떻게 차이점이 있는지도 생각해 볼 만하다고 생각합니다. 여러분, 타이타닉이라는 영화 아시죠? 잘 모르시나요? 타이타닉이 개봉된 지는 한 20년 정도 됐습니다. 당시 2000년 정도에는 1테라플롭의 가격이 악 7000만 달러 정도 였습니다. 컴퓨팅 파워의 하드드라이브는 방 전체를 채울 만한 크기였죠. 그리고 이러한 컴퓨팅 파워는 정부나 군대만이 가질 수 있는 것이었습니다. 다시 시간을 앞으로 넘기면요. 20년이 지난 지금에는 그 용량의 6배인 6테라플롭의 가격이 700달러 정도밖에 안 하고, 아이들이 거실에서 이러한 장난감을 통해서 이렇게 거대한 용량을 이용할 수 있게 되었습니다. 이러한 컴퓨팅 파워의 발전으로 인해서 앞으로 퀀텀 컴퓨터가 발전되고 이것이 우리의 혁신이 나아갈 방향이 될 것이라고 생각합니다. 그리고 우리가 지금 이 시대에 발전하고 있는 방향의 최종 목적지는 AI가 될 것인데요. 이것으로 인해 우리의 삶 전체가 변화하게 될 것입니다. 그런데 잠깐만 다시 생각해 볼까요? 기술변화로 인해서 지금 여러분에 몸담고 계신 도서관 분야도 역시 변화하고 있습니다. 여기 있는 미국 자료를 보면서 도서관이 어떻게 변혁을 겪고 있는지 한번 살펴보도록 하겠습니다. 여기 표에 보시면 위에서부터 파란색 박스 안에 있는 6개 분모는 지금 디지털 이니셔티브를 겪고 있는 부분들입니다. 과거에 도서관이 수행했던 역할에서 이제 이용자들이 도서관에게 바라는 역할이 변모하고 있죠. 이런 도서관의 변모는 하나의 커뮤니티로써 도서관이 사람들에게 도움을 줄 수 있고 어떤 기술적인 교육프로그램을 제공할 수 있고 새로운 서비스를 제공할 수 있는 장소가 되는 것입니다. 도서관의 어떤 이용자들이 도서관에 바라는 경험은 무엇일까요? 과거와는 다르게 사용자들은 전자책 단말기나 디지털 기기를 통해서 도서관과 상호작용하기를 원하고 있습니다. 아까 아마존의 전제민 님께서 말씀하신 것처럼 여기 보면 도서관이 더 이상 스마트폰이나 E 리더뿐만 아니라 그런 다른 방향으로 변모하고 있는 것을 알 수 있습니다. 바로 음성인식을 통한 변화도 알 수 있고요. 지금 여러 산업에서 일어나고 있는 변화 그리고 도서관이 겪고 있는 변혁을 바탕으로 우리의 대화를 진행해 나갈 수 있을 것입니다. 마이크로소프트사에서는 디지털 변혁에 대해서 이야기할 때 종종 도서관과 박물관을 동일선상에서 놓고 비교하곤 합니다. 전 세계적인 도서관이나 박물관의 추세를 알아보면 이러한 Transformation Framework를 가지고 있는 것을 알 수가 있습니다. 이 Framework에서는 크게 4가지 중점사항이 있습니다. 제가 언급하고자 하는 것은 주로 외형적인 분야인데요. 장서 보유나 연구에 대한 것보다는 사용자의 경험에 대하여 초점을 맞추도록 하겠습니다. 이러한 도서관의 변혁을 통해서 우리는 도서관의 운영이나 인프라적인 측면에서도 변혁을 가져올 수 있습니다. 우선 디지털화가 의미하는 것이 무엇인가에 대해서 살펴보겠습니다. 도서관의 소장 자료를 디지털화함으로써 우리는 일반 대중에게 정보의 접근성과 발견 가능성을 제공할 수 있고요. 또한, 지식채굴(Knowledge mining)을 통해서 새로운 정보와 지식을 발견할 수 있습니다. Knowledge mining이라는 단어가 좀 낯설 수도 있는데 어떤 의미일까요? 여러분이 가지고 있는 자료가 어떤 물리적인 것이든 디지털화 되었든 혹은 아직 이용 가능한 상태에 있지 않던 간에 Knowledge mining을 할 수 있습니다. 어떻게 할 수 있을까요? 여기에서 마이크로소프트의 Azure Search를 통해서 여러분이 가지고 있는 문서를 Knowledge mining하는 과정을 살펴볼 수 있습니다. 앞서 다른 연사께서 뉴욕시립도서관의 사례를 말씀해 주셨는데 물리적으로 되어 있는 이 자료를 디지털화하는 것이죠. AI를 이용해서 디지털화된 자료를 어떻게 변환시킬 수 있을까요? 우리가 사진에서 활용하는 얼굴 인식이 있고요. 번역기능을 이용해서 텍스트를 이해할 수 있죠. 주요 지형지물을 감지할 수도 있습니다. Azure Search를 통해서 이러한 능력을 이용할 수 있고 여러분의 컬렉션에서 더 많은 지식을 발견할 수 있습니다. Knowledge mining을 통해서 완전히 텍스트로 검색 가능한 풍부한 인덱스를 가질 수 있습니다. 여기 여러분이 보시는 것처럼 제가 말을 하는 즉시 이렇게 영어로 자막이 나오고요. 이제 데모를 하나 보여드릴 텐데요. Knowledge mining에 대한 데모입니다. 1960년대에 암살당했던 미국 대통령 JFK를 기억하시나요? 2017년에 미국 FBI는 JFK의 암살에 관련하여 1차 문서 공개를 했는데요. 이 문서 공개에는 6,000개의 문서, 총 3만 4,000쪽 분량의 문서가 공개되었습니다. 우리는 이것을 디지털화하기로 결정했습니다. 그래서 3만 4,000쪽에 이르는 텍스트와 이미지들을 먼저 디지털화를 했죠. 실제 도큐먼트가 어떻게 생겼는지 보여드릴게요. ‘JFK’를 한 번 검색해 볼까요. 검색기능을 이용해서 JFK라는 글자가 문서 어디에 있든지 이렇게 색깔로 표시되어 나타납니다. 텍스트뿐만 아니라 이미지에서도 JFK를 인식할 수 있는 것이죠. 이러한 연관 관계에 대하여 마인맵이 나와 있습니다. 외부의 위키피디아 같은 소스를 통해서 이러한 마인맵의 연관 관계를 알 수 있습니다. JFK의 암살용의자로 알려진 ‘리 할비 오스왈드(Lee Harvey Oswald)’도 검색해 보겠습니다. 여기 보시면 ‘오스왈드’라는 단어를 검색하면 이렇게 하이라이트 돼서 표시됩니다. 텍스트뿐만 아니라 오스왈드의 사진도 이렇게 나타납니다. 잘 알아볼 수도 없는, 손으로 쓴 이런 필기체도 검색이 됩니다. 굉장히 방대한 양의 이렇게 어려운 텍스트들도 우리가 디지털화해서 Knowledge mining이 가능한 것을 알 수 있습니다. 연구자들이 현재 많이 사용하고 있는 마이크로소프트 Knowledge mining의 아카데믹을 보여드리고자 합니다. 이 서치 기능을 이용해서 인터넷의 모든 아티클을 검색할 수 있습니다. 여러분이 지금 보유하고 있는 장서보다 훨씬 더 많은 20만 건의 문서를 검색할 수 있는 것입니다. 디지털화를 통해서 AI를 이용해서 텍스트를 검색할 뿐만 아니라 의미론적으로 접근할 수 있습니다. 이러한 연구 논문들 가운데 도서관 디지털 변혁에 대해서 한번 검색을 해 보겠습니다. 문서나 지금 연구 결과들을 볼 수 있는데요. 단순한 콘텐츠의 이해뿐만이 아니라. 이념이나 어떤 논문이 가장 영향력이 있는지도 살펴볼 수 있습니다. 이렇게 디지털화를 통해서 Knowledge mining이 가능하고 앞으로 어떤 방향으로 발전할 수 있는지에 대해서 말씀 드렸습니다. 여기에서, 앞에서 말씀드렸던 도서관 변혁에 대해서 이 가운데 특히 도서관 이용자들이 어떠한 측면의 변화를 원하는지에 대해서 말씀을 드리겠습니다. 앞서 언급된 소매업, 판매업에서의 변화가 도서관 이용자들이 원하는 변화에 아주 좋은 사례가 될 수 있을 것이라고 생각합니다. 소매업에서 우리가 많은 교훈을 배울 수 있는데요, 예컨대 월마트에서는 고객들의 행동 양식에 대해서 이미 많은 것을 파악하고 있죠. 월마트는 개별화된 쇼핑 경험을 제공하고 있습니다. 넷플릭스 아시죠? 넷플릭스를 보면 다음에 뭘 보면 좋겠다 하는 추천 기능이 있습니다. 사용자들이 다음에 뭘 보면 좋겠다를 이해하고 있을 뿐만 아니라, 기계는 어떠한 정보가 이용가능한지도 이미 파악하고 있는 것이죠. 그래서 여러분이 가진 데이터나 지식을 어떻게 재고관리에 더 잘 이용할 수 있는지도 알 수 있습니다. 현재 도서관이 제공하고 있는 기능뿐만 아니라 더욱 새로운 기능을 도서관 사용자들에게 제공할 수 있게 될 것입니다. 마지막으로 전 세계 도서관들이 이미 제4차 산업혁명의 디지털 변혁을 겪고 있는 과정의 사례들을 소개하고자 합니다. 첫 번째 예는 싱가포르에 있는 국립도서관위원회인데요. 이 국립도서관위원회에서 이미 빅데이터기술을 활용하고 있습니다. Hillsboro 국립도서관의 경우에는 사람들이 많이 모이는 번화가에서 도서관의 이용 가능한 서비스를 제공하고 있습니다. 도서관이 가져온 이런 경험의 변화를 통해서 앞으로 도서관이 제공하는 프로그램이나 교육훈련이 더 다변화될 수 있고 이것이 지역사회에 더욱 긍정적인 영향을 미칠 수 있을 것이라고 생각합니다. 감사합니다.