본문 바로가기 주메뉴 바로가기 사이드바 메뉴 바로가기

국가학술정보 신경망 조성 프로젝트

발표 : 허용범(국회도서관장)
동영상에 대한 자막정보
국가학술정보 신경망 조성 프로젝트 허용범: 반갑습니다. 우리 송희경 의원님 역시 대단한 실력을 보여주셨습니다. 정말 감동 받고 여러 가지 참 생각할 바가 많았다고 생각합니다. 제가 오늘 발표할 것은 우리 도서관의 이야기입니다. 국가학술정보 신경망 조성 프로젝트를 주제로 길지 않은 시간에 저희들이 생각하는 바를 말씀드리겠습니다. 지금 송희경 의원님께서 4차 산업혁명을 주제로 쭉 얘기를 해주셨는데 4차 산업혁명을 우리가 뭐라고 부르든 독일 같은 데서는 아까 말씀하셨지만 인더스트리 4.0으로 부르든 또 심지어 4차 산업혁명은 실체가 없다, 이렇게 주장하는 사람들도 많습니다. 그러나 뭐라고 부르든 간에 4차 산업혁명이라고 상징되는 변화는 우리 삶 전체, 우리 산업계 전체에 큰 영향을 주고 있는 것은 엄연한 사실입니다. 그리고 그것은 우리 도서관에도 마찬가지입니다. 도서관은 어떤 사람은 그래요. 우리하고 4차 산업혁명하고 무슨 관계있냐. 그렇지 않습니다. 우리가 뭐라고 부르든 전통적인 도서관 서비스 그리니까 책과 종이로 이루어진 도서관의 자료들은 이제 급속히 디지털화되고 있습니다. 어떻게 보면 이제 머지않은 장래에는 이제 디지털화되지 않는 데이터, 디지털 데이터화되지 않는 도서관 자료는 거의 쓸모가 없을지도 모릅니다. 그리고 우리는 이것을 과거에 이용자들이 도서관으로 직접 와서 앉아서 책을 보던 시대에서 이제 대부분이 급속도로 인터넷을 통해서 이용을 하고 있고요. 또 인터넷을 넘어서 이제는 그 데이터를 가지고 인공지능이라든지, 빅데이터라든지 클라우드, 이런 기술을 가지고 재가공해서 활용하는 시대가 되었습니다. 그러니까 도서관은 이제 도서관 서비스의 내용 그리고 도서관 서비스의 방식에서 급속한 변화를 이루어가고 있습니다. 그 기반은 바로 4차 산업혁명이 불러오는 디지털데이터의 문제입니다. 제 제목이 저수지와 숟가락입니다. 이것 아시죠. 제가 얼마 전에 이 도서관데이터 문제를 가지고 우리 정부에 예산을 다루는 굉장히 높은 고위관계자 한 분을 따로 뵀습니다. 그 분한테 이렇게 얘기했습니다. 4차 산업혁명이라는 것은 여러 가지로 우리가 표현할 수 있지만 결국은 디지털데이터와 인공지능기술의 결합이 아니냐. 그렇다면 인공지능기술만 자꾸 개발하고 그 베이스가 되는, 기반이 되는 디지털데이터문제에 너무 소홀하게 되면 이것은 마치 기반 없는데 집을 짓는 격, 말하자면 모래 위에 성 쌓기가 아닌가, 이런 걱정이 된다. 이렇게 제가 말씀을 드렸습니다. 지금 우리 도서관자료는 지금 저희 국회도서관도 마찬가지고 마치 장마 때 홍수가 밀려오듯이 사방에서 도서관자료가 콸콸 쏟아져 들어오고 있습니다. 그게 도서관자료라는 저수지를 형성하고 있습니다. 이게 우리가 말하는 인류 지식정보의 보고입니다. 저장고입니다. 그런데 이것을 디지털화하는 것은 디지털데이터로 만드는 것은 마치 바가지로 물을 퍼내는 격밖에 안 됩니다. 이래서야 어떻게 우리가 4차 산업혁명에 나라의 미래를 걸었다, 운명을 걸었다, 이렇게 얘기할 수 있겠습니까? 너무 도서관자료의 데이터에 소홀한 것 아닙니까? 도서관자료가 왜 중요하냐. 도서관자료야말로 일반 인터넷에 떠도는 그런 일반적인 정보와 달리 우리가 말하는 신뢰할 수 있는 정보. 그리고 우리가 믿을 수 있는 정보. 그렇기 때문에 도서관자료의 데이터는 다른 일반 정보와 다른 정말 우리가 4차 산업혁명에 필요한 기반이다, 이렇게 설명 드렸습니다. 그랬더니 이 관계자께서 참 뜻밖의 답변을 했습니다. 허 관장님, 관장님 말씀 저도 다 알고 정말 동의합니다. 그런데요. 우리나라 도서관들은 지금 도서관자료를 데이터화하는 것을 저수지 물을 바가지로 퍼내는 게 아니라 숟가락으로 퍼내는 것 아닙니까? 이렇게 저한테 반문을 했습니다. 다시 말씀드리지만 저는 그렇게 생각합니다. 우리가 인공지능이다, 빅데이터가 황 교수님 빅데이터 분석이다, 또 클라우드 서비스다, 이 모든 것들, 이 모든 것들은 결국은 데이터의 기반 없이는 그것은 공염불입니다. 데이터가 없이 어떻게 빅데이터 분석을 합니까? 인공지능이 어떻게 개발이 가능합니까? 그것은 사상누각에 불과한 것입니다. 그런데도 우리는 지금 저는 바가지로 퍼낸다고 하는 거예요. 우리나라의 예산을 책임지고 있는 그 고위관계자께서는 숟가락으로 퍼내고 있다. 이게 정말 우리나라가 맞고 있는 현실이고 우리 도서관이 맞고 있는 가장 큰 과제 중에 하나가 아닌가, 저는 그렇게 생각합니다. 구글 북스 프로젝트, 아마 이 자리에 계시는 분들은 다 들어보셨을 겁니다. 구글이 2004년에 전 세계 도서관에 있는 책을 전부 스캔해 가지고 그것을 풀 텍스트, 원문 DB로 만들겠다. 그렇게 해서 구글을 통해서 세상에 서비스 하겠다. 이렇게 아시죠. 그 프로젝트라는 것을. 그런데 혹시 Talk to Books라는 프로젝트를 보셨습니까? 이 Talk to Books는 지금으로부터 불과 한 달 전인 4월 13일 날 구글이 구글 홈페이지를 통해서 서비스하는 새로운 서비스입니다. 말 그대로 Talk to Books입니다. 책에게 말을 건다는 겁니다. 지금 갖고 계시는 핸드폰으로 구글 창에 가서 Talk to Books라고 치면 그 사이트가 구글 사이트가 나옵니다. 열어보시면 이 화면이 나옵니다. 여기에 보시면 알지만 Talk to Books는 Not a traditional search. 그러니까 전통적인 방식의 검색이 아니라 Use natural language, 인간의 자연 언어로 말을 걸듯이 문자 그대로 Talk to Books입니다. 말을 걸듯이 검색을 하는 겁니다. 그러면 뭐가 나오느냐. 책이 나오고 풀 텍스트가 나옵니다. 제가 한번 해 볼까요. 제가 들고 있는 태블릿으로도 해 볼 수 있습니다. 한번 해보겠습니다. 제가 영어가 워낙 시원찮아서 지금은 영어로 해야 됩니다. 제가 한번 해 보겠습니다. Let me know something about the summit between North and South Korea. 제 발음도 다 알아듣네요. 이게 지금 제 컴퓨터상에 떠있는 겁니다. 보시면 놀랍지 않습니까? 단 1초도 안 돼서 제가 물어본 남북정상회담에 관한 책들이 나오고요. 이것은 풀 텍스트로 우리가 필요한 부분을 찾아볼 수 있습니다. 이게 놀라운 점은 우리 바로 도서관이 지난 인류 수천 년 동안 책을 보관해 가지고 그것을 찾아주고 또 경우에 따라서는 그 내용을 검색해주던 그 기능을 바로 이 Talk to Books가 하고 있는 겁니다. 그것도 무슨 책상 앞에 앉아서 타이핑 칠 필요도 없고요. 도서관을 찾아갈 필요도 없고 그냥 자기 핸드폰으로 하면 됩니다. 제가 지금 태블릿으로 하는 것 실제로 보셨지 않습니까? 저같이 촌스러운 영어발음으로도 검색이 됩니다. 지금 이 Talk to Books는 데모버전입니다. 홈페이지 들어가면 그렇게 나옵니다. 데모버전이고 약 10만권을 단행본을 디지털화해 가지고 실험용으로 서비스하고 있다, 이렇게 되어 있습니다. 그런데 이게 지금 10만권의 데모용입니다. 실험용인데 만약에 이게 100만권이 되면 어떻게 하겠습니까? 100만권이 아니라 1,000만권이라면. 1,000만권이 아니라 1억 권이라면. 더 나아가서 1억 권이 아니라 10억 권이라면. 누구나 자기가 들고 있는 핸드폰으로 책을 검색하고 책을 검색하는 것을 넘어서 원문자체를 볼 수 있고 그런데도 사람들은 도서관을 이용하겠습니까? 모르겠죠. 시간이 많이 남아서 도서관에 와서 한가하게 종이책 보고 싶은 사람은 오겠지만 절대적 사람들, 그리고 인터넷에 익숙하고 이 모바일에 익숙한 사람들은 이것을 이용할 수밖에 없습니다. 저는 그런 날이 참 무섭게도 머지않았다고 생각합니다. 이 구글 북스 프로젝트는 여러분께서 아시다시피 2004년에 시작돼서 곧바로 미국에 소송이 걸렸습니다. 미국 출판협회라든지 이런 데서 저작권문제로 소송을 걸었습니다. 무려 12년을 미국에서 법원쟁송을 벌였습니다. 그러다가 12년 뒤인 재작년입니다. 2016년에 구글의 승리로 최종 끝났습니다. 미국 연방대법원이 이것은 소위말해서 Fair 위주, 그러니까 공정이용에 해당된다 그래서 구글의 북스 프로젝트를 허용했습니다. 그게 1년 전입니다. 그 이후로 구글은 2004년에 그 프로젝트를 대대적으로 전개하기 시작해서 지금 전 세계적으로 책을 스캔하고 있습니다. 목표서 뭐냐. 여기 나온 대로 Search the full text of books. 메타데이터나 서지정보 목록이 아닙니다. 풀 텍스트, 원문 DB, 디지털데이터 그 자체를 서비스하는 겁니다. 일본 게이오 대학입니다. 일본 게이오 대학은 구글이 북스 프로젝트를 발표한 직후인 2007년 구글과 협약을 맺었습니다. 그러고서는 저작권 권리 관계가 명확한 서적이라든지 또 아예 저작권이 존재하지 않은 서적, 약 10만권을 디지털화해서 지금 여러분이 사용하는 구글을 통해서 서비스하고 있습니다. 한번 해보십시오. 나옵니다. 중국의 국가도서관, 마찬가지로 구글과 협약을 맺고 자체 디지털화한 원문을 구글에서 서비스하고 있습니다. 어느 정도까지 갔느냐. 현재 7,000만 페이지를 무료로 구글을 통해서 공개하고 있습니다. 이 정도가 아닙니다, 지금. 여기 보시면 이것은 구글에서 구글 북스 프로젝트 홈페이지에 떠있는 내용입니다. 하버드대학교, 컬럼비아대학교, 미시건대학교, 오스트리아 국립도서관, 영국의 옥스퍼드대학교, 아까 본 게이오대학, 이것은 하나의 사례에 불과하고요. 저희들이 조사한 바에 따르면 전 세계 지금 40개국 이상에서 40개 이상의 언어로 지금 책이 스캔되고 있습니다. 어마어마한 양의 책이 지금 원문 DB가 구글에 의해서 구축되고 있습니다. 고백하자면 저희 국회도서관에도 작년 말에 구글에서 찾아왔습니다. 듣자하니 국회도서관이 원문 DB 구축 때문에 수요는 폭증하는데 들어오는 도서관자료는 홍수처럼 밀려오고 고민이 많다는데 돈은 없고 우리가 다 해주겠다, 다 해주겠다. 많으면 많을수록 좋다, 이렇게 제의를 해 왔었습니다. 우리뿐만이 아닙니다. 여기 계시는 몇몇 도서관에도 제가 제의가 간걸로 알고 있습니다. 그러면 도서관이 이제 모든 게 다 디지털화되는데 원문DB 구축도 안하고 예산타령하면서 손도 놓고 있고 그렇다고 국가에서 뾰족한 대책도 없고 그러면서 무슨 4차 산업혁명을 하자는 거냐. 또 구글은 다국적 외국기업이니까 안 되고 이런 복잡한 생각을 하면서 지금 고민에 빠져있습니다. 그렇다면 구글은 왜, 왜 이렇게 전 세계 도서관자료를 Digitize 해가지고 그것을 원문 DB로 구축하려할까요. 답은 간단합니다. 다른 자료가 아니라 도서관의 자료야말로 4차 산업혁명의 원유, 4차 산업혁명의 원유라는 것을 알고 있습니다. 다른 모든 정보자원과 달리 인류지식정보의 축적체, 보고인 도서관의 자료를 Digitizing해서 그것을 원문 DB로 구축해야 이것을 가지고 인공지능을 개발할 수 있습니다. 기술가지고는 못합니다. 데이터가 있어야 될 것 아닙니까? 두 번째, 구글은 이 데이터를 가지고 급속도로 발전하는 정보통신기술과 결합해서 끊임없이 새로운 서비스들을 만들어 내게 됩니다. 그래서 우리는 도저히 엄두도 못내는 그 디지털화를 공짜로 해주겠다는 거예요. 그만큼 우리가 보유한 도서관자료, 4차 산업혁명의 원유, 기반이라는 것은, 데이터라는 것은 그만큼 소중한 것입니다. 저희 국회도서관에서 이와 관련해서 짧은 동영상을 하나 준비했습니다. 잠시 시청하시겠습니다. 잘 보셨습니까? 저희가 준비한 화면이 말하는 것은 단 한 가지입니다. 도서관이 소장한 자료, 도서관자료야말로 4차 산업혁명의 기반이고 원유다. 그렇기 때문에 우리 도서관은 4차 산업혁명에서 결코 벗어나 있거나 4차 산업혁명의 변화를 따라가는 게 아니라 오히려 반대로 4차 산업혁명을 주도할 수 있는 선도적 기관이 될 수 있다. 또 되어야 한다, 이런 뜻을 담고 있습니다. 그리고 제가 앞서 말한 대로 그 모든 기반은 우리 도서관자료의 디지털DB화입니다. 그런데 우리 정부의 고위관계자께서 뭐라고 했습니까? 관장님, 지금 우리나라 도서관은 그 저수지의 물을 바가지도 아니고 숟가락으로 퍼내는 격입니다. 이게 우리나라의 현실이라고 생각합니다. 그러면 아까 송희경 의원님이 많은 예를 드셨지만 우리 말고 이 4차 산업혁명의 우리의 경쟁자인 다른 나라도 우리처럼 이렇게 할까요? 한번 보시겠습니다. 다시 일본의 경우입니다. 이게 일본 국립국회도서관 건물입니다. 일본 국립국회도서관에서는 2004년 구글 북스 프로젝트가 발표 난 직후에 저작권법을 아예 개정을 해 버렸습니다. 저작권법을 개정해서 국립국회도서관이 가진 자료는 무조건 디지털화할 수 있도록 법을 바꾸었습니다. 그렇게 해서 무려 2009년에 127억 엔, 우리 돈으로 1,200억입니다. 1,200억을 국립국회도서관에 줘서 자료를 디지털화하라고 했고 저희가 파악한. 저희가 물어봤습니다. 얼마나 했냐 하니까 266만 책 수준으로 했다, 이렇게. 유럽입니다. 유럽의 경우는 각국별로 따로 하지 않고 도서관, 박물관의 협력모델을 이용합니다. 같이 하는 거죠. 그래서 EDM, LOD, CCO, EDM은 Europiana Data Model이라는 뜻이고요. LOD는 잘 아시는 대로 Linked open data라는 뜻이고 CCO는 Creative Commons zero 그런 네임입니다. 그래서 이 연합을 해서 현재 5,200만 점의 도서관과 박물관의 주요자료를 데이터화해서 공개하고 있습니다. 이 홈페이지에 5,200만 점이라고 나와 있습니다. 이처럼 미국, 일본, 유럽 등 우리와 경쟁해야 되는 나라들에서는 국가 정책적 차원에서 도서관자료 데이터화에 막대한 국가예산을 쏟아 붓고 있는 것입니다. 그렇기 때문에 다시 한 번 강조하자면 우리가 도서관자료를 보유한 바로 주체기관으로서 도서관자료야말로 4차 산업혁명의 원유이고 4차 산업혁명을 성공하려면 도서관자료의 디지털화, 디지털데이터화가 되지 않으면 안 된다는 것을 우리 스스로 알아야 됩니다. 그리고 그러한 도서관자료의 데이터화는 4차 산업혁명의 성공뿐만 아니라 바로 우리 도서관의 생존과 발전 그리고 미래도서관 서비스의 대전제조건입니다. 제 말에 우리 회원기관 여러분들도 아마 공감하시리라 생각합니다. 사실 저희 국가도서관, 국회도서관의 경우는 입장상 조금 이런 부분에 대해서 상대적으로 조금 빨리 대응해본 측면이 있고요. 또 아무래도 그런 측면이 있습니다. 저희 어쨌든 4차 산업혁명이라는 변화, 이 거대한 기술적 변화 그 다음에 서비스방식의 변화, 이런 것에 우리 국회도서관이 어떻게 대비해 왔는지 저희 간략하게 아주 짧게 동영상을 만들었는데 한번 보시겠습니다. 이 동영상은 지난 2월 1일 날 저희들이 마찬가지로 정세균 국회의장님 모시고 4차 산업혁명을 도서관이 선도하자. 4차 산업혁명의 변화를 뒤따라가는 게 아니라 어차피 닥칠 변화라면 우리가 선도하는 기관이 되자, 이런 취지를 담아서 만든 동영상입니다. 한번 보시겠습니다. 역시 이 동영상도 말하는 바는 단순합니다. 사실 4차 산업혁명의 키워드를 꼽으라면 지금 보시는 빅데이터, 클라우드, 인공지능을 꼽을 수 있습니다. 이러한 정보통신기술이 급격한 발달이 가져오는 이러한 기술들을 우리가 뒤따라가지 말고 우리 도서관서비스에 선제적으로 흡수하고 활용하자. 그렇게 해서 그런 기술을 활용해서 우리 도서관이 가진 자료들을 새로운 방식으로 저희 같으면 국회와 국민에게 서비스하자, 이런 취지입니다. 그리고 또 저희 같은 경우는 국가도서관이기 때문에 저희가 4차 산업혁명에 우리가 소위 말하는 미래도서관이라고 말하는 다소 막막한 그 미래도서관의 어떤 모습을 우리가 그릴 때 우리가 먼저 그런 것을 해봄으로써 나중에 수많은 우리나라의 도서관들이 그런 미래도서관 서비스를 어떻게 할 것인가 고민할 때 하나의 롤 모델이나 또는 벤치마킹할 수 있는 모델이 되어 주고 또 우리가 새롭게 만든 시스템에 그 활용을 모든 국민에게 유익하도록 하자, 이런 취지를 담고 있습니다. 그래서 저희 국회도서관 같은 경우는 저희 오늘 발표하는 것과 맥락을 같이 합니다마는 이미 국가학술정보 클라우드 서비스를 시작했습니다. 저희 국회도서관 홈페이지를 통해서 지금이라도 볼 수 있습니다. 저희 국회도서관과 한국연구재단, 그리고 KISTI 한국과학기술정보연구원 등을 비롯해서 학술정보를 가장 많이 갖고 있는 8개 기관이 연합해서 새로운 국가성장 동력으로 학술정보, 여기 숫자 보이시죠. 현재 상태 643만 건입니다. 643만 건을 클라우드상에서 공유할 뿐만 아니라 이것을 국민에게 오픈했습니다. 그래서 학술데이터 LOD 개방형 연결데이터 형식으로 국민에게 오픈해놓고 누구나 사용할 수 있게 지금 서비스 중입니다. 저희들이 K-Scholar라고 부르는 학술연구자 정보 공유사업도 마찬가지로 올해 들어서 시작했습니다. 이것도 저희들이 가진 데이터들을 개방하는 겁니다. 이것은 연구자 중심으로 다양한 학술정보를 연결하는 서비스인데요. 현재 저자전거 약 60만 건을 구축해서 저자를 중심으로 사람을 중심으로 학술정보가 연결되는 것입니다. 이것은 향후 데이터융합기관 조성에 대단히 중요한 서비스입니다. 셋째, 빅데이터 기반한 융합분석 서비스입니다. 이것은 저희 국회도서관이 1999년에 전자도서관을 설립한 이후에 20년 동안 부지런히 축적한 2억 3천만 면 이상의 저희들이 가진 풀 텍스트, 원문을 뉴스와 SNS 그러니까 소셜미디어, 정책세미나 자료, 연구보고서, 이런 수많은 자료들과 융합해서 입법의 주최인 국회의원이 전혀 새로운 형태의 입법 활동을 할 수 있도록 맞춤형서비스를 제공하는 것입니다. 저희 같은 경우는 이미 이런 빅데이터 분석을 실질적으로 활용하기 위해서 2년 전에 저희 독립 과로 데이터융합분석과를 설치해서 지금 계속해서 시스템고도화 작업, 분석고도화 작업을 하고 있습니다. 그런데 저는 여기서 문제가 생깁니다. 그러면 우리가 4차 산업혁명이 가져오는 이런 급속한 정보통신기술의 발달이라든지, 도서관서비스의 확장이라든지, 새로운 방식의 미래도서관 서비스라든지, 이런 것들을 우리가 과연 국회도서관이나 혹은 몇몇 도서관들이 발버둥 치면서 노력한다고 그러면 우리가 미래도서관을 이런 4차 산업혁명의 도전을 극복할 수 있느냐. 저는 안 된다고 봅니다. 국회도서관이 제가 앞서 말씀드린 대로 그 방대한 도서관자료를 데이터화하지 않으면 이것은 서비스가 불가능하다. 이렇게 결론을 내리고 발버둥을 쳐도 장마철에 홍수에 물들어오듯이 자료는 쏟아져 들어오는데 데이터 하는 것은 바가지는커녕 숟가락으로 퍼내는 격입니다. 그래서 답은 이제는 우리가 힘을 합치자. 우리가 힘을 합치자. 협력을 통해서 하자. 저는 이 협력만이 도서관서비스의 새로운 혁신, 그것을 넘어서 이제는 우리가 협력의 방식을 혁신해야 될 때가 아닌가. 협력을 어떻게 하느냐에 대해서 그 패러다임 자체를 바꿔야 될 때가 아닌가. 이런 생각을 정말 많이 하게 됩니다. 그래서 오늘 저희가 많은 연구와 토론과 의견수렴을 거쳐서 만든 것이 국가학술정보 신경망 조성 프로젝트입니다. 이 국가학술정보 신경망 조성 프로젝트의 핵심은 데이터화, 국가적 차원에서 도서관자료를 접근하고 그 데이터화를 협력을 통해서 하고 그 데이터화된 결과를 같이 공동 활용하자. 이런 개념입니다. 왜 그렇게 해야 되느냐. 지금의 데이터가 문제가 아닙니다. 저희 도서관에도 미구축된 도서관자료가 산더미처럼 쌓여있습니다. 분석에 따르면 지금 현재 인류가 사용하는 데이터의 80%는 물론 이 데이터는 디지털데이터입니다. 80%는 2015년 이후에 생성된 거라고 합니다. 그런데 문제는 2018년이 문제가 아니라 앞으로가 문제예요. 앞으로 이 데이터의 양은 지금은 기가 시대죠. 이제는 제타, 벡타, 헥타 수억 배씩 늘어나게 됩니다. 수억 배씩, 매년. 도대체 무슨 수로 감당하겠습니까? 무슨 수로. 결국은 이것도 어느 한 도서관이 열심히 한다. 혹은 몇몇 도서관이 열심히 한다고 될 일이 아니라는 말이죠. 그렇게 해서 우리가 디지털데이터베이스가 없이는 도서관서비스를, 미래도서관 서비스를 할 수 없다는 전제하에서 하나의 도서관이 해결할 수 없다는 데서 출발합니다. 결국은 이제 우리 여기 계신 1,822개 우리 도서관, 저희를 포함해서 우리가 가지고 있는 도서관자료의 데이터화는 국가적 차원에서 접근해야 된다. 국가적으로 데이터라는 자산을 기반을 구축한다. 이런 국가 정책적 차원에서 접근해야지, 도서관 개별적인 노력에 맡겨놔서는 안 된다. 이것은 한계가 있기 때문에 안 된다는 그런 얘기입니다. 그래서 이제는 국가적 차원에서 도서관자료의 데이터화에 접근하고 그것을 우리의 협력 체제를 통해서 구축하고 그래서 구축된 자료를 모두가 공동으로 쓰자. 이런 얘기입니다. 이분아시죠, 클라우스 슈밥. 지금 지금까지 말하는 4차 산업혁명이라는 단어를 2년 전 다보스포럼에서 사용해서 히트를 치고 클라우스 슈밥이 4차 산업혁명이라는 책을 써서 전 세계적으로 히트했습니다. 저도 물론 읽어봤습니다. 그런데 불과 2년 만에 이 사람은 THE NEXT라는 책을 최근에 또 냈습니다. 4차 산업혁명도 힘들어 죽겠는데 THE NEXT, 이 클라우스 슈밥이 이렇게 얘기합니다. 4차 산업혁명의 변화를 어떻게 우리가 극복하고 성공적으로 받아들일 것이냐. 결론적으로 세 가지라고 얘기합니다. 저 위에 써놓은 대로 변화를 위한 첫 번째 공동의 비전을 만들어야 된다. 공동의 비전. 두 번째, 모든 이해관계자와의 협력, 공동의 비전, 협력. 세 번째 혜택의 공유방식의 변화, 혜택의 공동 활용이라는 뜻입니다. 이 세 가지를 제의합니다. 저는 이 클라우스 슈밥이 말한 이 세 가지, 공동의 비전, 공동의 협력, 그 결과물의 공동의 활용, 이것이 바로 우리 도서관이 앞으로 극복해야 될 과제에도 적용되는 바로 그 개념이 아닌가. 클라우스 슈밥이 얘기해서가 아니라 저는 이것이 우리 도서관계가 함께 발전하는 길이고 또 새로운 미래도서관을 개척해 나가는 방식이다, 이렇게 생각합니다. 저는 이렇게 생각합니다. 도서관의 자료가 개인재산이냐, 저는 그렇게 생각하지 않습니다. 저희 국회도서관자료, 저는 국회도서관 거라고 생각해 본적이 없습니다. 국민의 세금으로 구축되고 국민 누구나 이용할 수 있는 자료가 어떻게 개인재산이 될 수 있습니까? 어떤 특정 도서관의 자료, 본인들이 소유권을 갖고 있고 갖고 있을 수는 있지만 국민의 자산 아닙니까? 우리 국가의 자산, 국민 누구나 활용할 수 있는 자산. 그렇다면 이러한 국가적 지식정보자산을 우리가 이제는 반드시 디지털화, 데이터화시켜야 된다면 이제는 국가적 차원에서 접근해야 되는 것 아닌가. 개별이 책을 빌려주던 시대에서 이제는 데이터를 이용하지 않으면 안 되는 그런 시대라면 이것은 그리고 각 도서관마다 그런 역량이 도저히 안 된다면 이제는 국가적 차원에서 접근해야 되고 또 국가적 차원에서 이를 구현할 시스템이 필요하다. 저는 그런 결론을 내렸습니다. 이것이 이번에 제가 지금 말씀드리는 국가학술정보 신경망 조성 프로젝트의 요지입니다. 그러면 국가학술정보 신경망 조성 프로젝트를 어떻게 작동할거냐. 그 원리를 간단하게 설명 드리겠습니다. 이것은 인간의 뇌의 사진입니다. 뇌의 그림입니다. 인간의 뇌는 수조 개에 이르는 뉴런들이 하나의 뇌를 구성합니다. 그 인간의 뇌 안에는 중심뇌가 있는데 그 주변에 수많은 뇌들이 이렇게 붙어있는 게 아닙니다. 수조 개의 이르는 뉴런들이 뭉쳐서 일종의 유기적으로 협력해서 하나의 뇌를 구성합니다. 똑같이 여기 계신 우리 1,822개 회원기관들이 학술정보라는 단일주제를 중심으로 해서 신경망처럼 국회도서관도 A도서관도 B도서관도 모두가 하나의 뉴런이 되어서 하나의 뇌를 구성합니다. 그래서 저희들은 신경망이라는 이름을 붙었습니다. 그러면 기술적으로 어떻게 해야 되느냐. 저희들은 지난 몇 달 동안 이 부분에 대해서 과연 그러면 수많은 이런 도서관들이 뇌처럼 움직일 수 있는 기술이 과연 가능한가, 이런 것들을 검토했습니다. 잘 아시다시피 엣지컴퓨팅, 그러니까 클라우드 시스템에서 훨씬 나간 일종의 분산 클라우드 시스템 아닙니까? 엣지컴퓨팅 기술도 가능합니다. 또 전통적인 클라우드 시스템도 가능합니다. 저희들 국가학술정보 클라우드 공유서비스가 지금 클라우드 시스템에서 움직이고 있습니다. 그러나 저희들이 주목하는 것은 요즘 각광받는 블록체인 기술입니다. 블록체인 기술은 아시다시피 어떤 중앙의 서버를 두거나 중앙에 무슨 리더가 있어서 그것을 주변에 형성돼있는 게 아니라 각 기관들이 독립적으로 존재하면서 같이 하나의 유기적인 덩어리를 만드는 시스템입니다. 그러니까 전체가 각각이 독립적으로 움직이면서 완벽한 공유협력 체제를 구성할 수 있다는 점에서 우리가 추구하는 바로 그런 공유협력 플랫폼의 가장 최적화된, 현재로서는 가장 최적한 기술이다, 이렇게 판단합니다. 지금 보시는 것이 국가학술정보 신경망 프로젝트를 블록체인 기술로 개념화한 것입니다. 보시다시피 A, B, C, D, E 도서관이 각각의 도서관자료를 각자 소장하면서 하나의 블록체인 분산기술을 통해서 하나의 유기체적인 덩어리로 움직이게 됩니다. 또 당연히 이용자는 어느 한 도서관을 통해서 이 모든 정보를 하나의 덩어리 정보로 이용하게 됩니다. 저는 이러한 개념에 그러니까 데이터의 협력적 구축, 공동 활용, 그것을 구현하기 위해서 블록체인 기술을 도입한 어떤 신경망 같은 유기체를 만들자, 협의체를 만들자 하는 개념을 지난 5월 1일 날 우리 협의회의 이사기관 대표자님들과 또 다는 못 오셨지만 관종별 회장님들을 모시고 설명을 가졌습니다. 그 자리에서 제가 똑같은 얘기를 드렸습니다. 정말 전폭적인 지지를 받고 그래 우리도 한번 해보자, 이런 얘기를 들었습니다. 저는 우리가 이 자리에 계신 우리 회원 1,822개 도서관 회원기관 여러분들께서 그래, 해봅시다. 우리가 이렇게 마냥 손 놓고 있지 않고 우리끼리 한번 해봅시다. 그리고 정부의 지원을 요구합시다. 이렇게 뜻만 모아준다면 저는 할 수 있다고 생각합니다. 오늘 우리 정세균 의장님께서 조금 전에 다녀가셨는데 그 바쁜 중에도 왜 여기까지 오셨겠습니까? 왜, 임기 5일 남으셨습니다. 바로 우리 도서관이 가진 중요성, 4차 산업혁명 시대에 도서관이라는 게 어떤 의미를 갖는 건지 너무나 잘 알고 계십니다. 그러니까 이 자리에 와서 축하해주고 지지의사를 보내주시는 겁니다. 지금 잠시 자리를 비우셨습니다마는 우리 신기남 위원장님 도서관정보정책위원장되시고 며칠 만에 저희 도서관 오셔가지고 저하고 장시간 토론을 했습니다. 아까도 말씀드렸다시피 4차 산업혁명의 이 변화에서 도서관이 무슨 방관자나 따라가는 사람이 아니라 선도자라고, 선도기관이 돼야 된다는데 누구보다도 투철한 인식을 갖고 계시고 적극적인 지원의사를 보내주셨습니다. 제가 아마 신기남 위원장님 계시면 좀 더 얘기하려고 했는데 안 계셔서 못하겠습니다. 그래서 결론을 내리겠습니다. 우리 오늘 정말 귀한 시간을 내서 이 총회에 참석해주신 우리 1,822개 회원기관 여러분, 지금 우리 도서관계는 정말로 대전환기에 있습니다. 어쩌면 도서관의 정체성, 도서관의 존재 이유에 대해서 심각한 도전을 맞고 있고 위기에 놓여있는 시대다, 이렇게 해도 아마 공감하실 겁니다. 저는 반대로 이렇게 생각합니다. 그렇기 때문에 우리가 이 시대를 새로운 미래를 열어가는 기회와 도약의 분기점으로 삼을 수 있다. 거꾸로 변화의 따라 갈 거냐. 아니면 변화를 선도할 것이냐. 도서관이 우리 인류역사에서 결코 없어질 수 없고 앞으로도 도서관의 기능이 앞으로도 5천년, 5만년 동안 있어야 된다면 우리는 이 시대적 변화, 4차 산업혁명이라 부르든, 안 부르든 이 시대적 변화를 우리는 선제적으로 흡수하고 활용하고 그러한 변화를 선도하는 기관이 되어야 합니다. 혁신적인 혁명적인 디지털 기술 환경의 진보를 선제적으로 흡수한다. 그 변화를 우리 도서관이 선도해서 미래를 개척해 나가야 된다. 저는 이렇게 믿고 지금까지 일하는데 여러분 제 말에 동의하십니까? 제가 말씀드린 이 국가학술정보 신경망 조성 프로젝트는 다른 게 아니라 대한민국 도서관계가 지금까지 볼 수 없었던 새로운 차원의 우리 공유협력모델을 우리가 주도적으로 만들자, 이런 것입니다. 우리 도서관계가 맞고 있는 제가 일일이 설명 안 드려도 다 아실 겁니다. 우리 도서관계가 맞고 있는 이 변화에 파고, 어쩌면 위기일 수도 있고 어쩌면 기회일 수도 있는 이 변화의 시기를 우리가 다함께 손을 잡고 주도적으로 헤쳐가자. 저는 누구를 탓할 것 없이 이 자리에 계신 우리 1,822개 도서관 대표님들께서 그 뜻과 의지를 뭉쳐주신다면 반드시 성공할 수 있다, 이렇게 생각합니다. 그리고 남들 얘기할 것 없이 저희 국회도서관이 먼저 협력의 손을 내밀고 저희들 것을 나누고 또 여러분과 함께 가도록 함께 앞으로 가도록 이렇게 노력해 가겠습니다. 우리 꼭 저희 도서관과 함께 우리 미래를 열어갈 수 있도록 이 국가학술정보 신경망 조성 프로젝트에 꼭 동참해주시고 도와주실 것을 진심으로 부탁드립니다. 경청해 주셔서 감사합니다.



빅데이터 기반 지능형 학술정보서비스

발표: 오세윤(국방과학연구소 고등기술원 빅데이터 개발 총괄)
동영상에 대한 자막정보
시간이 없으니까 빨리 빨리 진행을 하겠습니다. 그리고 혹시 25분까지 하고 시간이 남으면 레코딩 안하는 조건에서 저희가 개발하는 것 잠깐 보여드리고요. 설명하겠습니다. 저희 연구소 홈페이지에 나와 있는 조직이고요. 루케버그 사이버, 여러 가지 하는 본부가 있고 둘 중에 본부 급으로 어드밴스드 테크놀로지 하는 쪽으로 해서 국방고등기술원이 있습니다. 저는 원래 빅데이터, 이쪽을 업무를 하고 있습니다. 업무를 하고 있는 게 한 채에 몇 백억이 돼요. 하고 있는데 제가 답답한 것들 정리해서 주위사람한테 설명을 해주다보니까 강의를 하게 돼서 회사에서 가끔 시간 날 때 이렇게 하고 있습니다. 그리고 인공지능 빅데이터 쪽에서 제일 유명한 학회 중에 하나가 GPU 개발자회의가 있는데 제가 여기 열심히 다니고 있고 작년에 코엑스에서도 유사한 것을 제가 한 적이 있습니다. 빅데이터 개요서부터 쭉 얘기할건데 빅데이터 플랫폼 기술은 되게 어렵기 때문에 컴퓨터 Science 배운 사람들이 이것을 안 배우고 IT업체에 가서 3년 일한 다음에 할 수 있는 일이에요. 그러니까 제가 가볍게 소개만 시켜드리고 오늘은 70% 시간을 대부분 빅데이터, 머신러닝, 인공지능, 이런 것들 AI Autonomy, 정리를 해 드리겠습니다. 빅데이터에서부터 되게 많이 나와서 요새 클라우드 있고 그런데 IoT 클라우드가 많이 나와 있다. 인트로고요. 컴퓨터 데이터 네트워크 보면 이것 다 돼있어요. 컴퓨터 인터넷 연결이 안 되는 건 이상이 없고 모바일도 거의 다됐죠. 저기 아프리카 이런 데만 없고 이제 IoT 사물과 인터넷이 연결이 되려고 하고 이제 조금만 있으면 여기처럼 구글글래스 약간 망하긴 했지만 이것을 보고 카메라가 있어서 이것을 보면 귀로 설명을 다해 준다. 이것은 우리가 번호를 찾을 필요가 없어요. 여기까지는 여러분이 알고 계시는 데이터 마이닝, 빅데이터 분석 이런 것으로 처리가 되는데 이제부터 데이터가 많기 때문에 이 부분으로 가게 되면 오늘 말씀드리게 되는 빅데이터 분석을 해야 되는 겁니다. 여기 보면 며칠 전거예요. 2018년인데 간호사, 선생님, 다 있어요. 미국에서 1등 직업이 나오잖아요. 앞에서 11만 불 한 1억 3천, 2천. Data scientist 이고 톱10 jop보면 빅데이터 ICT 하는데 15만 불씩 받으니까 한 1억 6, 7천, 이렇게 지금 잘나가는 직업으로 되어 있는데요. 이제 빅데이터 말씀드리겠습니다. 16년 기사인데요. 하우스 오브 카드라는 유명한 미드가 어떻게 만들었냐면 넷플릭스가 제 마음대로 한 게 아니라 빅데이터 조사를 해서 하우스 오브 카드 옛날에 나온 것을 리메이크하지 않고 감독은 데이비드 핀처, 주연배우는 케빈 스페이시가 선호 된다라는 것을 조사를 했어요. 데이터분석으로. 그냥 제작자가 아니라 아무나 써가지고 정성조사를 하지 않았어요. 그리고 직감이 아닌 데이터기반으로 했는데 엄청나게 인기가 있어서 우리나라 정치인들도 이것 많이 봤다고 얘기하고 있습니다. J팝이 구글트렌드라는 것 조금 이따 보여드릴텐데 누구나 알 수 있는 거예요. 옛날에 중요도가 100이었는데 이렇게 줄었고요. K팝이 요새 난리 났죠. 이게 100까지 올라갔어요. 이게 전부 다 빅데이터 분석을 통해서 전 세계 사람 관심이 있는 것 가지고 했습니다. 공교롭게도 작년에 보니까 중국, 일본, 한국이 빅데이터 센터 만든다고 하는데 애로사항이 많이 있습니다. 용어 정리해 드린다고 그랬어요. 오늘 4차 산업혁명 어쩌고저쩌고 하시잖아요. 다 아십니다. 처음에 1차는 기계화 증기기관, 전기, 컴퓨터 지금 여기 온 거예요. 4차 산업혁명이 뭐냐. AI, IoT, 클라우드, 빅데이터, ICBM, 혹은 ICBMS 정보통신부가 이것 옛날에 많이 쓰고 있더라고요. 다 이런 것이어도 되고 4차 산업혁명은 뭔지 모르지만 혁신으로 하려고 한다라는 것만 읽으면 돼요. 파란색만. 그러면 4차 산업혁명이 뭐냐면 아까도 되게 복잡하게 했을 때 딱 두 개만 이해를 하시면 돼요. 뭐냐. 초연결 IoT 됐죠, 빅데이터 됐죠. 초지능 AI 됐죠. 그래서 초연결, 초지능, 이 두 가지가 산업혁명의 특징이고 이 특징을 바탕으로 해서 뭔가 잘해보자. 이게 4차 산업혁명이 되겠습니다. 어디 가서 물어보시면 얘기하세요. Hyper-Connectivity, Super-Intelligence가 산업혁명의 두 가지 키워드야. 이렇게 얘기하시면 되겠습니다. 정보통신기술 보겠습니다. Information Communication Technology 원래 IT인데 Information Technology인데 뭐라고, 뭐라고 돼 있는데 ICBM에다가 AI까지 합쳐서 잘해보자, 그런 얘기예요. 정보통신기술이. 그래서 오늘 보면 IoT랑 클라우드만 딴 방에서 하고 있으니까 제가 거의 설명을 안 할 거고요. 빅데이터-AI 쪽에 관계된 머신러닝, 딥러닝, 이런 것 정리를 해 드리겠습니다. 정보통신기술 잘렸네요. 정보통신기술 한번 설명 드리면 해외는 ICT기술이다 그러면 사장님이 이사회가 즉시 도입을 합니다. 여러분 도서관장이 즉시 도입을 합니다. 그러면 결과는 잘 나올 리가 없잖아요. 그러면서 틀렸지만 그만두지 않고 수정하면서 진행하면서 이렇게 합니다. 외국은. 그리고 지금 쳐다보면 연습문제 풀고 있지 않고 실행단계를 하고 있어요. 그러면 대한민국은 어떠냐. 여러분도 마찬가지일 거예요. 되게 느려요. 도입을 하는 거 콘퍼런스도 하고 컨설팅도 하고 돈도 주고 리포트도 만들고 다 한 다음에 뭘 하냐면 복잡하니까 아, 다음에 합시다. 숙제로 남깁시다. 1억 투자하면 2억 남아? 이렇게 하시는데 이렇게 접속하시면 잘 안 됩니다. 그래서 신규가치창출을 해야 되는데 이것 다른 사람한테 뺏기면 남이 만든 소프트웨어, 남이 만든 인프라, 남이 만든 플랫폼을 차용하셔야 되고 기술종속이 됩니다. 그래서 꼭 여기처럼 하셔야 됩니다. 하나 더 얘기하겠습니다. 월마트가 되게 오프라인 매장이 되게 큰데 아마존은 끝내주잖아요. 온라인매장을 하는데. 이 월마트가 아마존보다 겁나 커요. 그런데 이 온라인에서는 아마존에 상대가 안 됩니다. 그런데 이것을 돌파하는 아이디어를 냈습니다. 어떻게 됐냐. 온라인 전문가를 딱 데리고 와서 네 마음대로 해라. 그래서 어떻게 했냐면 온라인에서 주문을 해요. 그리고 오프라인 매장은 되게 많잖아요. 아마존에는 없는 것. 거기 가서 네가 직접 받으면 몇% DC 해줄게. 그랬더니 사람들이 이것을 이용하기 시작했습니다. 그래서 픽업할인서비스라고 해요. 이게 무슨 소리냐. 남 따라 가려다보면 내내 뒤쳐지니까 우리도 월마트처럼 고민을 해서 극복불가전략 같은 것을 만들지 않으면 계속 기술종속이 된다, 그런 얘기입니다. 그다음에 제가 컴퓨터 Science 전공자가 아닌데 제일 귀찮을 때도 있어요. Architecture, Architecture 그래요. 아셔야 돼요. 설계구조예요. 설계도 플랫폼, 플랫폼 해요. 그러면 하드웨어일 수도 있고 주로 소프트웨어인데 Windows 위에 프로그램이 A프로그램, 한글, SA 탑재될 수 있고 깔 수 있으니까 Windows도 플랫폼이 될 수 있고 당연히 MacOS도 될 수 있고 네이버에 가면 자동차페이지, 메일 페이지, 웹툰 페이지, 그 다음에 물건 파는 페이지가 있으니까 이것도 플랫폼, 페이스북도 플랫폼이 될 수 있습니다. Framework라고 합니다. 복잡하네, 해놓고 이것보다 덜 복잡하게 뼈대구조를 대충 누가 정리해 놓은 것을 쓰는 겁니다. 편리하겠죠. Library, Library하는 게 별 거 아니에요. 그냥 Functional 저장해서 파는 건데 대결을 없애기 위해서 플랫폼이 뭐냐면 여러분들 애기들한테 혹시 레고 사주면 이런 레고입니다. 설계도가 없어요. 레고 블록이 있기 때문에 뭐든지 만들 수 있는데 처음에 뭐 만들려고 하면 되게 힘들어요. 이게 작년 12월에 닉스라고 하는 유명한 학회에서 구글이 발표한 그림에 들어간 겁니다. 그래서 이렇게 된 건데 Framework는 쉽잖아요. 이런 거예요. 이것보다 쉬워요. 헬기를 만들 수 있는 케노, 피보, 프로펠러, 다 갖다놓고 만들 수 있어요. 그래서 금방 헬기 만들 수 있어요. 하지만 이것가지고 탱크를 만들려면 힘들어요. 탱크 만드시려면 이것 쓰셔야 돼요. 대신 훨씬 어려워요. 그래서 많이 쓰시는 저희가 딥러닝하는데 Caffe, Keras, 이런 것들이 있는데 이런 것들이 Framework이고 좀 더 어려운 게 이것이다, 이렇게 이것만 기억을 하셔도 좋습니다. 오픈소스가 뭐냐면 우리는 프로그램을 무조건 돈 주고 사는데 요새 어떻게 하냐면 누군가 프로그램을 짜서 어제 나온 프로그램을 웹에 올립니다. 그리고 같이 share, 같이 씁니다. 기가 막힐 노릇이에요. 워, 하진 않겠지만 2015년에 보니까 대부분의 회사가 여러분 안드로이드, 구글 하시면 그게 다 오픈소스예요. 거기 들어가 있는 앱에 들어가 있는 프로그램 다 오픈소스예요. 그런데 며칠 전에 정부 과기정통부가 벌써 나왔어요. 공개 소프트웨어로 연구개발을 하려면 이렇게 해라. 사람들이 헷갈리니까. 여기 78%였는데 그사이에 2017년 96%, 모든 상용 소프트웨어는 오픈소스를 기반으로 합니다. 아셔야 되고요. 구글에 TensorFlow라고 하는 Framework가 있는데 이거 딥러닝할 때 많이 쓰거든요. AI개발할 때. 이게 144만 줄인데 저 혼자 짜라 그러면 400년이 걸리는 걸 공짜로 줍니다. 이게 오픈소스가 되겠습니다. IBM뿐이 없겠죠. IBM Oracle 같은 것 보면 이게 다 공상이에요. 보면 막 이렇게 써 있어요. 저는 이게 뭔지 몰랐어요. 그냥 이렇게 써 있어요. IBM과 Oracle, 여러분과 밝은 미래를 함께 한다. 이렇게 써 있어요. 그런데 뭘 하는지는 몰라요. 이런 분들이 여러분한테 뭘 프로DB를 만들어 주고 Framework를 만들어 주고 돈을 달라고 그럽니다. 소프트웨어 파시는데. 그래서 이분들하고 잘 콜라보를 하시려고 하면 지금부터 말씀드리는 것 듣고 똑똑해지셔야 된다. 공개소프트웨어가 여기 있죠. 비공개소프트웨어가 저희가 그동안 쓰던 거예요. IBM이 다해 줍니다. IBM이 다해주고 NS가 다해줘요. 돈 주고 샀어요. 기술 지원할 때 돈을 달라도 괜찮아요. 그리고 돈이 많이 드니까 불법카피도 씁니다. 공개소프트웨어는 다 올려놨어요. 수백 만 줄을. 돈을 안들도 제가 고칠 수도 있어요. 그런데 이게 문제가 뭐냐면 이것을 만질 줄 아는 엔지니어, Scientist가 필요합니다. 그래서 협력기술, 이런 게 필요한 거예요. 여기까지만 아시고요. 오픈소스, 여러분 요새 AI, 빅데이터 나오는 것은요. 100% 오픈소스예요. 그러니까 누가 갖고 있지는 않아요. 여기는 넘어가고 IBM Watson도 2011년밖에 안 되고요. 구글이 고양이 사진을 자율 분류하는 것을 했대. 2012년. 그 다음에 구글이 DeepMind을 사서 재작년에 16년에 난리 났잖아요. 산 게 14밖에 안 돼요. 인수를 한 게. 그리고 Baidu가 뭐 하고 Google Car는 1M Miles 무자동 운전하는 게 겨우 2년 전, 3년 전, 알파고가 이세돌이긴 게 재작년밖에 안 됐어요. 보시면 아시겠지만 30년 전에 얼마 안 된 겁니다. 그리고 작년에 제가 뭐있었나 봤더니 이제 알파고가 커서 AlphaGoZero가 됐다가 AlphaZero가 돼가지고 이따가 시간이 되면 보여드릴 Neural Network가 아마 Cryptopay입니다. 오늘의 가장 중요한 그림이 되겠습니다. 제가 제일 헷갈렸던 건데 인공지능을 하는 여러 가지 방법 중에 데이터 마이닝이라는 방법이 있습니다. 그리고 이안에 통계학, 패턴인식, 테이터 마이닝 방법 중에 기계학습이라는 하는 머신러닝이 있고요. 그 안에 지도학습, 비지도학습, 강화학습, 이게 알파고에 쓴 거예요. 이런 게 있습니다. 모르셔도 돼요. Support Vector Machine 이 30년, 50년 전부터 있던 Artificial neural network 이런 게 있어요. 인공신경망, 들어보셨을 거예요. 그런데 인공신경망이 잘 안 되는 걸 Deep neural network 그러니까 인공신경망을 크기를 크게 만든 거예요. 깊게 이렇게 만들어서 머신러닝을 합니다. 그래서 이게 제일 중요하고 이것을 여기서 보면 Deep한 neural network를 가지고 머신러닝을 해서 이것을 합쳐서 딥러닝, 딥러닝합니다. 그러니까 딥러닝이 하늘에서 떨어진 게 아니고요. 얘 밑에, 얘 밑에 머신러닝 기계학습 밑에 딥러닝이 있는 거다. 그리고 빅데터 기술은 오늘 말씀드릴 게 여러분들이 지원을 해주는 건데 이 모든 기술은 컴퓨터과학과 컴퓨터 Science 쪽에 됩니다. 도대체 이게 어디서 나오는지 아셔야 되는데 딥러닝 무서워하면 안 된다, 이게 요지가 되겠습니다. 그래서 간단하게 아주 데이터 마이닝, 머신러닝, 딥러닝, 이런 것을 말씀드릴게요. 데이터 마이닝, 복잡하게 하나도 안 외우셔도 되고요. 뭔가 큰 거를 잘 섞어서 뭐냐. 딱 파란 글씨. 아, 자동으로 뭘 하겠다. 이게 데이터 마이닝 기술이 되겠고 여기 보면 컴퓨터한테 이 숲 속의 갈대밭에 숨어있는 이것은 사람은 패턴인식을 한 다음에 금방 치타를 찾아내는데 컴퓨터는 이게 되게 어려운 일이에요. 이것을 찾는 것을 하는 것을 데이터 마이닝이라고 했고 자동화하는 겁니다. 있는 것을 합친 거예요. 하늘에서 뚝 떨어진 게 아니고. 그래서 데이터 마이닝하는 얘들이 IBM에서 했던 건데 이렇게 해 놨어요. 데이터 마이닝하고 통계, 데이터베이스, 머신러닝, AI, Pattern Recognition 이렇게 돼있다. 그런데 제가 분석을 해 보니까 이게 빅데이터가 아닌데도 자꾸 빅을 붙여요. 데이터 마이닝하는 사람이. 그래서 소셜 sns 서비스분석을 했다는 점, 온라인 쇼핑 히스토리를 추적을 했다는, 그냥 이것 사실은 데이터 마이닝인데 자꾸 빅데이터라고 해서 헷갈리게 합니다. 그래서 빅데이터는 어느 정도 되냐. 최소한 무인자동차, IoT센서, 날씨, 거대구조 우리 GPS, 수백만 사람들의 GPS, CCTV 수만 개, 이 정도는 돼야 빅데이터급이라고 할 수 있겠습니다. 그래서 이게 금방 보신 그림이에요. 고도기술 하는 사람이 만들고 그랬어요. 어떻게 그렸느냐. AI가 다 먹었어요. 데이터베이스도 별로 인기가 없고요. 빅데이터 데이터베이스를 씁니다. 그래서 이렇게 된 것으로 세상이 바뀌고 있다. 계속 맵이 바뀌고 있어요. 머신러닝, 넘어가겠습니다. 머신러닝 유명한 사람이 뭐라고 썼는데 이 말 알 필요가 없고요. 뭐라고 그랬냐면 나 프로그램 안 짤래. 대신에 네가 알아서 해줘. 데이터를 통해서. 이 머신러닝 기계학습은 왜하냐. 이것만 아시면 돼요. 예측을 하려고 합니다. 데이터를 가지고 예측을, 누가 그걸 왜 해? 그러면 예측을 하려고. 서비스예측을 하려고. 수요 예측을 하려고. 무조건 예측을 하려고 하는 거가 머신러닝이이고 이 머신러닝 밑으로 들어가는 게 딥러닝이고 기자들이 자꾸 딥러닝 가지고 인공지능이라고 등치해서 얘기하고 있거든요. 예측을 하는 거예요. 프로그램을 우리가 일일이 짜지 않습니다. 이것이 전통적인 방법입니다. 어떻게 하냐면 데이터가 있어요. 그러면 분석해봐. 그러면 지가 코딩을 합니다. A+B=C이고 다 프로그램 짜고 컴퓨터에 돌리면 덜커덕하고 오, 내년 되면 예측수치가 처음으로 커졌는데요. 이게 저희가 알고 있는 전통적인 방법인데요. 딥러닝, 머신러닝으로 가면 어떻게 하냐면 프로그램을 안 짭니다. 어떻게 하냐면 데이터, 이게 Input이에요. Output 세트를 연습용을 만들어요. 페어로. 이것을 데이터세트라고 합니다. 데이터세트를 주고 정리를 해서 컴퓨터에 넣으시면 지가 프로그램을 짜줍니다. 그래서 사람들이 되게 불편해하는데 프로그램을 짜야 되는데 프로그램을 자꾸 짜지 말라 그래요. 예제를 주면 프로그램이 나옵니다. 계속 설명을 하겠습니다. 어떻게 하느냐. 데이터를 주면요. 입력데이터, X와 Y를 주면 막 프로그램을 지가 알아서 짜가지고 여기서 프로그램이 나와요. 그래 갖고 이 프로그램을 훈련과정 프레임과정에서 빼서 실제 써먹을 때 고양이 사진 같은 것을 예측을 할 때 넣어서 나중에 맞추는 건데 헷갈리시면 설명 더 드릴게요. 데이터 X와 Y를 집어넣어서 프로그램이 나온다할 때 무슨 소리냐면 프로그램 짜지 않고 코딩하지 않고 입력, 출력, 이게 X와 Y예요. 입력, 출력에 의한 예제 세트에 의해서 자동 프로그램 되는 게 딥러닝, 머신러닝이 되겠습니다. 그래서 내가 할 게 뭐냐. X, Y 세트를 많이 모아주면 많이 모아주면 데이터가 많아지겠죠. 빅데이터 세트를 모아주면 알아서 해주게요. 오픈소스를 가지고 할 수 있는 거가 요새 신문에 나오고 알파고 만든 기술이고 AI, 빅데이터 한다는 기술이 전부 이것에 속하는 게 되겠습니다. 머신러닝 과정을 흐릿하게 아시면 안 되니까 머신러닝, 딥러닝을 하려면 4가지가 필요해요. 뭐냐 하면 데이터가 필요한데 그림을 주고 이 그림이 X예요. 그 다음에 이 그림은 항공기다. Airplane이다라고 답을 다줘야 돼요. 세트를 넣으면 이것 가지고 훈련을 하는데 사야 될 것은 이것이 필수입니다. 그리고 아까 제가 Framework해 드렸죠. 뭐냐 하면 헬리콥터 만드는 레고 블록, 누가 다 만들어 놨어요. 제가 혼자 짜려면 400년 걸린 것 갖다 쓰시면 돼요. 짜시면 안 돼요. 이것을 갖다가 쓰고요. 그 다음에 모델을, 어떤 것을 할 건지 제가 대충 어림을 해줘야 돼요. 혼자는 안 돼요. 이 3세트를 가지고 그 다음에 컴퓨터가 있으셔야 돼요. 컴퓨터 GPU라고 하는 컴퓨터가 들어가 있는 큰 컴퓨터를 가지고 4개 가지고 훈련을 해서 훈련이 되면 여기서 고양이가 있고 cat이 있죠. 그러면 다음에 모르는 고양이 사진이 왔으면 우리는 알지만 컴퓨터는 몰라요. 그러면 여기서 훈련된 여기서 훈련돼서 뭔가 Function이 나왔을 거 아니에요. 프로그램이 나왔잖아요. 그 프로그램을 모르는 입력에 프로그램을 넣어주면 cat하고 맞춰내는 것. 여러분도 여기에 나중에 도서관정보데이터가 들어가고 여기 들어가서 나와서 이게 나오면 나중에 모르는 도서정보의 서비스고도화를 예측을 얘가 하게 되는 겁니다. 더 설명을 하겠습니다. 그래서 이게 아주 넘기 힘든 거라 프로그램을 원래 이렇게 짜셨어요. 사람, 머그컵, 보트를 하고 싶으면 우리는 프로그램을 짭니다. 밝기가 얼마면 hats이고 edge가 얼마이면 일일이 다 짜주는데 잘 만난 게 새로운 이벤트가 생기면 또 짜야 돼요. 영원히 프로그램을 짜야 돼요. 이 짓을 안하면 겁니다. 어떻게 하냐면 그냥 X, Y, 고양이, boats, mugs, hats의 세트만 넣어주고 컴퓨터에 넣어주면 나중에 자동으로 프로그램 생성이 되는 이게 머신러닝의 데이터인데 이것을 구분하셔야 돼요. 자꾸 짜시면 안 됩니다. 이 짜는 것은 컴퓨터가 알아서 해줍니다. 여러분은 뭐해야 됩니까? 데이터 세트, 이것이니까 이것이, 이것이니까 이것이를 많이 만들어 주면 스스로 학습을 하게 돼있습니다. 그래서 이게 옛날 거예요. 아까 보신 그림이에요. 데이터가 프로그램, 이렇게 짜면 아웃풋이 나오던 게 아니고 데이터 X와 정답 Y 세트를 주니 컴퓨터가 어떻게 잘하면 미래를 예측할 수 있는 프로그램이 나와서 이 프로그램 가지고 알파고가 지금 바둑을 두고 있는 거예요. 안 본 대국인데 지가 해내고 있는 거예요. 더 설명을 하겠습니다. Supervised Learning, Unsupervised Learning, Reinrofcement Learning, 이게 알파고가 한 건데 이거 뭐냐면 이것은 X와 Y세트를 줘서 훈련을 시킨 거고 이것은 출력 값을 저희가 몰라요. 그러니까 뭐냐면 이것은 고양이 cat 여기는 개 그림, dog하고 세트를 준거고 이것은 고양이, 개인지 인터넷에 다 쓰는 거야. 정리 좀 해봐. 그러면 정리를 합니다. 비슷한 것끼리 그룹핑을 하는, 이게 비지도학습이고 이것은 좀 다른 스타일입니다. 알파고 같은 게 있습니다. 그래서 여기 보면 어느 게 동그라미인지 X인지 가르쳐주고 얘는 그런 거 없어요. 그냥 그룹핑만 하는 거고 이것은 알파고처럼 Reinforcement 하는 거고 넘어가겠습니다. 그래서 진짜 본업으로 들어가는 것, 딥러닝 빅데이터라고 하는데 딥러닝은 파란색만 보시면 되는데 데이터가 아까 그랬잖아요. 겁나 많아야 된다고. 수백 만 개 이상의 X와 Y데이터 세트가 있고 이것을 가지고 훈련을 많이 해야 되니까 컴퓨터가 있어야 됩니다. GPU가 달린. 이 두 가지가 핵심키워드가 돼서 여기 보시면 컴퓨터에 이것 하나가 2억정도합니다. 128개이니까 250억 정도 돼요. 이런 거가 필요한 건 아닌데 이런 컴퓨터가 있으면 도움이 됩니다. 이 안에는 그래픽카드인데 병렬처리를 도와주는 GPU가 탑재가 되어 있고 인공신경망이 돼 있으려면. 기술 트렌드, 갑자기 딥러닝 머신러닝 써서 오, 에러가 줄었다, 에러가 줄었다, 에러가 줄었다, 이런 얘기예요. 이것은 어디 네이버 지식검색하면 다나오는 거니까. 그래서 이게 뭐냐면 데이터가 조금이면 옛날에는 빨간색으로 보시면 데이터가 조금 이면 여기다가 많아지면 쫙 성능이 모아지다가 어느 이상 되면 데이터가 아무리 많아도 더 이상 성능이 좋아지지 않는 게 저희가 갖고 있던 기존기술인데 요새 건 어떻게 하냐면 여기 져요. 데이터가 적으면 빨간색보다 파란색이 성능이 떨어지는데 어느 임계점을 돌파하면 끝없이 물론 100이 끝이겠지만 성능이 계속 좋아지는 데이터의 량이라든가 Neural network가 커지는 빅데이터가 되는 거죠. 이렇게 되는 거가 상태이고 그냥 제가 마음대로 하면 우리 이쯤 어디 있는 것 같아요. 점점점 차이가 벌어지고 있으니까. 그러면 딥러닝, 딥러닝 해서 몇 년 전에 갑자기 난리가 났는데 왜 난리가 났냐. 이게 있어요. 옛날에 제가 Traditional Artificial Neural Network라고 옛날부터 있던 거거든요. 이게 이 파란 입력과 출력 빼고 이 파란색을 여러 줄을 집어넣으면 계산이 안 됐어요. 그래 가지고 인공신경망으로다가 논문을 쓰면 다 망했어요. 그런데 2012년 이때부터 저희가 갑자기 이렇게 깊은 파란색 줄이 많은 이런 것을 계산할 수 있게 됐어요. 왜 이렇게 됐느냐. 3가지 이유가 있습니다. 하나는 뭐냐면 딥러닝을 하는데 저희가 소프트웨어기술이 많이 좋은 에버리지를 많이 받고요. 빅데이터가 많이 생겨서 연습문제가 많이 생겼어요. 연습문제가 없으면 여러분은 연습문제용 데이터 X와 Y세트를 구하러 다니려고 나오게 되는데 벤치마킹 데이터가 무지하게 많이 생겼고요. 여기 보시는 것처럼 그 다음에 GPU라고 하는 이따가 설명드릴 이런 것들이 생겼습니다. 큰일 났네, 시간에 없어서. 그래서 컴퓨팅 구조, 이런 것들 들어가고요. 이것도 넘어가고요. 그래서 예전에는 이렇게 개 그림이 있으면 이렇게 정리가 됐던 건데 지금은 처음부터 끝까지 다 알아서 해 준다. 그리고 여기에 보시면 이게 훈련입니다. 이게 y=W*X 3개의 변수가 있는데 두 개를 알면 하나를 맞출 수 있는데 연습문제 풀 때는 이것을 모르고 이것이 똑똑해지면 나중에 이것을 맞춰낼 수 있다. 넘어가겠습니다. 딥러닝 Framework 있는데 tensorflow 이것을 쓰셔야 된다. 물체탐지가 뭐냐면 이것을 보고 컴퓨터가 맞춥니다. 어, 이게 뭐지? boat, person 맞추고요. Object Detection Neural Network인데 여기 보면 어디에 뭐가 있는지도 맞추고요. 잘 훈련을 시키면. 저절로 되지는 않습니다. 이런 것을 해낼 수 있습니다. 그래서 여기서 소규모 결론을 짓자면 딥러닝은 별 것 아니다. 옛날 Neural Network이고 옛날에는 조금밖에 안 되는데 요즘에는 막 천 개씩, 이런 것들도 할 수 있다. 빅데이터 얘기를 하겠습니다. 하드디스크에서 1TB를 복사할 때 여기서 100Mb/s 정도 되는데 이것을 처리할 때 복사만 하는데 세 시간 걸립니다. 만약에 하드디스크를 1,000개까지 돼있다 그러면 복사하는데 12초밖에 안 걸린다. 이게 분산처리기술 빅데이터 기술이 될 거고요. 마이어 쇤버거거가 쓴 빅데이터가 만드는 세상, 굉장히 좋은 책이니까 읽어보시고요. 시간이 없어서 넘어가겠습니다. 빅데이터가 구글 트렌드 분석하면 이렇게 뜨고 있고요. 인공지능과 빅데이터가 예전에는 끝 단밖에 안 겹쳤는데 요새는 이렇게 겹치고 있습니다. 빅데이터는 기존의 IT기술로 이게 굉장히 중요한 말인데 언제 빅데이터 기술을 써요? 그러면 여러분 컴퓨터에서 다 로딩이 되고 분석이 된다면 이 기술 쓸 필요가 없어요. 현재 여러분 컴퓨터에 로딩도 안 되고 읽을 수도 없고 처리가 안 되는 큰 데이터일 때만 빅데이터를 쓰게 돼있기 때문에 조그만 데이터, 내가 조금 많다 그래서 빅을 붙이시면 안 됩니다. 그리고 이렇게 엑셀 테이블처럼 예쁘게 된 게 아니라 이렇게 비정형으로 막 로그데이터, 사진, 음성, 다 넣을 수 있는 이런 것을 핸들링할 수 있도록 해야 되고 이것도 빅데이터 기술도 아까 똑같습니다. 미래를 예측하려고 하고 있습니다. 프로그램이 오픈소스인데 이렇게 막 미친 듯이 막 1개월, 2개월, 3개월에 공짜로 저희한테 공급이 되고 있고요. 제가 쓰고 있는 프로그램들 보겠습니다. 그래서 빅데이터, AI 기술, 다른 팀이 들어오면 이것을 가지고 저희가 AI를 만들 수 있고 자율주행, 러닝플랫폼, VR, AR, 이런 것들을 할 수 있다. AI랑 자율주행기술이 있는데 이것 헷갈리시는 분들이 많습니다. Intelligence는 Ability이고요. 뭔가 결정할 수 있고 그다음에 Capability는 그 결정된 것을 실행할 수 있는 능력입니다. 그래서 Autonomy, 자율주행기술은 뭐냐면 Self-governing condition이고 이건 Ability예요. 달라요. 그래서 뭐냐면 Capability가 높으면서 노란색처럼 Intelligence가 떨어지는 놈이 있을 수 있고 빨간색처럼 Capability는 떨어지는데 Intelligence가 높을 수도 있고 이게 이렇게 대입해서 각각의 여러 가지 액션 스페이스를 구할 수 있는데 이것을 가지고 자율주행 1단계, 2단계, 하이레벨, 이렇게 얘기하는데 이 두 개랑 이것을 섞어서 보시면 안 됩니다. Intelligence다르고 능력 다르고 자율이 다른 겁니다. 그래서 여기 보면 이상하게 조사를 해 봤더니 가까운 시일 내에 AI가 판칠 거다라고 예상을 하는 건 아시아 사람밖에 없어요. 유럽 사람들은 되게 냉철한데 이 아시아 사람들은 내년에 갑자기 뭔가가 돌아다닐 거라고 하고 있는데. 시간이 없어서 하여간 GPU가 많이 들어가면 4일치 걸릴 게 30분에도 해결이 될 수 있다. 컴퓨터는 되게 비쌉니다. GPU, CPU는 뭐냐면 고급연산자가 있는데요. 고급연산자로 계산하는 것을 나눠주는 건데 뒤에서 설명하겠습니다. 도서관이 나왔습니다. 제가 우연히 갔다 썼는데 이게 Relational DB, 관계형 DB가 되겠습니다. 도서관에 책이 만 권이 있습니다. 물류창고에 물건이 만 개가 있습니다. 천 개가 새로 들어왔어요. 그러면 우리는 건물을 새로 지어야 됩니다. 부속건물을. 여기까지 똑같은데 관계형 데이터베이스는 어떻게 하냐면 가나다라 순으로 정리가 돼있기 때문에 책 천 권이 들어오면 저 뒤에 있는 천 권을 따로 별로 건물에 넣을 수가 없어요. 어떻게 하냐면 이것을 다 밀어야 돼요. 다 제거해서 다 때려 부셔야 돼요. 그래서 여러분이 IBM ORacle한테 돈을 주고 DB를 만든 사람한테 고쳐달라고 하면 돈을 많이 달라 그럽니다. 왜, 이것 다 때려 부셔야 되니까. 물류창고는 어떻게 하냐면 빅데이터 쪽에서 쓰는 것은 물류창고 지을 것을 해놓고 밑에 겹쳐서 그냥 갖다 넣으면 돼요. 이런 식으로 접근하는 게 비정형데이터 노이스케어리라고 하는 이 콘셉트가 된다라는 것 알고 계시면 좋겠고요. 이것 설명하겠습니다. 시간 얼마 남았죠. 큰일 났다. 이것 설명 많이 못하겠네요. 교수님이 50명 채점을 할 수 있는데 총장님이 200명해라고 해서 밤새서 됩니다. 그런데 총장님이 만 명을 해라. 그러면 밤새도 안 돼요. 내일모레까지 평균을 내라. 그러면 어떻게 하셔야 되냐면 이것을 풀기 위해서 50명의 알바를 구해서 채점을 하고 이것을 해야 되는데 채점할 때 누가 국어시험지 갖고 있는지 누가 데이터 잃어버렸는지 이것을 다 관리해 주는 것들이 제가 오늘 하고 있는 빅데이터 처리기술이 되겠습니다. 그래서 빅데이터 기술의 집합체라고 하는 Hadoop데이터 시스템을 쓰고 있고요. 그래서 하드웨어, 소프트웨어 할 수 있고 넘어가겠습니다. 이것도 넘어가고요. 그래서 이것 설명 드리겠습니다. 이게 인프라 플랫폼 서비스인데 여러분이 컴퓨터랑 건물을 사고 아무 것도 없어요. 그러면 인프라 서비스를 사시는 겁니다. IaaS라고 합니다. 거기다가 OS도 넣고 약간의 프로그램도 넣으면 플랫폼서비스를 받는다고 하고요. 도서관처럼 이거 다에다가 도서정보 처리하는 것까지 소프트웨어, 홀랑 다 다 사시면 SaaaS라고 합니다. 소프트웨어 서비스가 되는 겁니다. 이것 구분을 하시고요. 여러분 데이터가 분명히 안 봐도 뻔합니다. DVD서비스는 이렇게 됐고 도서정보는 이렇게 되고 하나씩 하다보니까 아마 이렇게 되셨을 거예요. 이것을 어떻게 하셔야 되냐면 이렇게 바꾸시고 싶은 마음이 있으실 건데요. 이 바꾸는 방법은 이렇게 DATA HUB방법과 DATA LAKE방법이 있는데 넘어가겠습니다. 정리를 해야 되니까 국방 분야 쪽에 저희가 하고 있는 것, 이것을 저희가 데이터를 모아가지고 막 처리를 합니다. 여러분 것은 어떤가 하면 똑같아요. 여기 비행기에서 오는, 자율 주행차에서 오는 이러한 자율을 멀티미디어, 원시데이터, 사용자정보, 비정형데이터, 콘텐츠데이터, 이런 것 다 모으셔가지고 의사결정, 지능형서비스고도화, API설계, 분석플랫폼, 이런 것 하고 싶으신 거잖아요. 그래서 딴사람이 한걸 보셔도 충분하다. 이런 것들이 있고요. 결언을 하겠습니다. 무엇을 하셔야 되는지 제가 정리를 해 드려야 되잖아요. 오늘부터 뭐하시느냐. 사서하고 뭐하시려면 오늘부터 데이터세트 모으셔야 됩니다. 그런데 쓰레기를 아무렇게나 모으시면 쓰레기가 나옵니다. 그래서 여러분이 관심을 갖고 정리해서 모으시면 빅데이터 서비스 고도화를 하실 수 있고요. IT애들이 와가지고 막 뭐라고 하면 공부 좀 하셔가지고 IT를 배우셔야지 이거, 그냥 여러분 호구 잡힙니다. 그래서 좋은 서비스에는 여러분들 같은 숙련된 도서학술정보 하시는 전문기술이 필요하고 그래야 좋은 서비스플랫폼이 나올 수 있습니다. 그리고 계속 자료를 보셔서 기술 트렌드 파악을 하시는데 3가지가 필요합니다. 이런 것 깊이 들어가려면 통계, 학교 때 배웠고요. 수학, 배웠고 이것이 필요합니다. 전문가. problem solve, problem definition능력, 이것은 한 분야에서 10년은 계셔야 하실 수 있거든요. 그래서 이런 능력이 있으셔야 할 수 있다. 여러분들의 적극적인 개입이 없으면 IT애들이 아무렇게나 만들어 놓고 나간다, 이렇게 되겠습니다. 마지막으로 정부3.0에서 이런 것을 했었어요. 이게 뭐냐면 진짜 이것 휴대폰 서비스입니다. 이게 박근혜 정부에서 했었던 정부3.0 휴대폰 단말 서비스예요. 뭐가 뭔지 보이지가 않아요. 여러분이 도서정보 서비스를 만들 때 이렇게 만드시면 안 됩니다. 어떻게 만드셔야 되냐. 이것은 영국 거예요. 영국 것은 정부3.0 비슷한 거 들어가면 이렇게 딱 돼있어요. 제일 중요한 게 앞에 딱 나와 있고 딱해서 들어가서 할 수 있게 사용자의 편리성을 위하게 되는데 여러분은 이게 아니라 이런 것을 만드셔야 합니다. 저것을 만들려면 어떻게 해야 되냐면 시간이 안 되더라도. 1분 동안 얘기하겠습니다. 사용자가 무엇이 필요한 건가. 우리만 할 수 있는 것. 데이터에 기반해서 아이, 귀찮아. 그러지 마시고 수고를 마다하지 않으셔야 되고요. 빨리 빨리 만들고 빨리 빨리 사용자한테 불편한데요, 피드백 받고 반복을 하셔야 되고 할아버지도 쓸 수 있고 젊은 사람도, 애기도 쓸 수 있다는 것을 감안해서 소프트웨어를 주문을 하셔야 되고요. 고려를 하시고 웹 사이트, 아까 정부3.0, 웹 사이트를 만들면 만들었다고 해도 아무도 안 씁니다. 웹 사이트를 만드시면 안 되고 빅데이터를 기반으로 한 디지털서비스를 만드셔야 되고요. 일관성은 지키되 획일적이지 않고 참여하는데 이게 어디서 나오는 거냐. 제가 만든 게 아니고요. 아까 보셨던 영국 정부의 디지털 서비스의 설계 10대 원칙, 여기서 참고 많이 하셔서 사용을 하시면 좋겠습니다. 프로그램 짜시고 하시면 이론은 이런데 실제로는 잘 안 된다는 거예요. 소프트웨어 짜시는 게. 잘 준비해서 하시고요. 저 1~2분 남았나요? 감사하고요. 질문 혹시 있으세요, 궁금한 것? 없으시면 여기서 마치겠습니다. 감사합니다.



클라우드, 연구지원 서비스 패러다임을 바꾸다

발표: 손태익(성균관대학교 학술정보관 팀장)
동영상에 대한 자막정보
손태익: 성균관대학교 삼성학술정보관에서 팀장으로 근무하고 있는 손태익이라고 합니다. 클라우드와 빅데이터와 모바일의 약어 이니셜을 따서 ICBM이라고 하죠. 거기에 이제 요즘은 조금 더 추가해서 ICBMA까지 들어갔어요. Artificial Intelligence 인공지능까지 해서 ICBMA까지라고 말씀을 많이들 얘기를 합니다. 그런데 아니, 뭐 IOT도 지금 버거워 죽겠는데 무슨 클라우드와 빅데이터 이런 거 모바일은 내가 알 것 같아. 이런 얘기들은 아시겠죠. 그런데 사실 이 관계들을 조금 제가 좀 개념을 조금 편안하게 한번 설명을 드려보도록 하겠습니다. 그래야 이게 어떤 식으로 도서관에 접목을 할 수 있을까라는 것들이 이제 조금 생각이 되실 것 같은데 제가 IT를 하고 있어서 여기에 IT를 담당하시는 분들이 얼마나 되시는지 모르겠지만 간단하게 이제 팁을 드리려고 하는데요. IT의 기술은 세 가지만 아시면 되거든요. 하드웨어와 소프트웨어와 네트워크만 아시면 됩니다. 굉장히 너무 쉬운 얘기를. 그런데 하드웨어는 보디 몸이고요. 소프트웨어는 영혼이라고 생각하시면 되고 하드웨어들을 연결하는 걸 네트워크라고 생각하시면 됩니다. 그래서 사실 이렇게 굉장히 기술들이 IT 기술들이 발전을 하고 있는데 많은 사람들이 IT 기술에 대해서 얘기할 때 10년 주기설을 얘기를 합니다. 90년, 2000년대, 2010년대, 2020년대 이렇게 얘기를 하거든요. 90년대 때 저희가 많이 들었던 그것들은 삐 하는 그 PC통신하는 그런 음이겠죠. PC통신 기반이죠. 그런데 2000년대에 딱 가면 웹으로 가죠, 웹. 웹의 시대가 들어오죠. 그리고 2010년 가면 모바일이 대세가 됩니다. 그러니까 이런 것들을 한 10년 정도 주기되는 그 주기의 핵심들은 하드웨어와 소프트웨어와 네트워크들이 얼마만큼 발전하느냐에 따라서 엎치락뒤치락하면서 주도권 싸움들을 하게 됩니다. 지금 2020년대에는 뭐가 될까. 그러니까 제가 마지막에 말씀을 드릴 것 같은데 사실 진짜 감히 이제 말씀을 나중에 한번 드려볼까는 하는데요. 지금 이제 모바일에서 2020년대 가면서 지금 4차산업혁명의 기본적인 기술들이 IoT와 클라우드, 빅데이터 이런 것들을 많이들 얘기하시는데 모든 기본은 저희가 생각했던 하드웨어와 소프트웨어, 네트워크들이 굉장히 빠르게 저희가 생각했던 것 이상으로 빠르게 진화하고 있다는 거에 초점을 두시면 됩니다. 이렇게 생각하시면 되는 게 IoT를 사물인터넷이라고 하죠. 모든 사물의 그러니까 연결이 되어 있어서 데이터를 주고받는다고 생각하시면 되죠. 제4차산업혁명의 가장 큰 핵심 키워드는 연결입니다. 커넥티비티라고 말씀드릴 수 있는 게 하이퍼 커넥티비티라고 그러죠. 초연결혁명이라고 말씀드리는 거죠. 4차산업혁명에서 연결은 가장 중요합니다. 그런데 이게 도서관에서도 가장 중요하게 작용을 할 수가 있습니다. 제가 지금 많이 제일 고민하는 게 어떻게 연결할까. 그걸 많이 고민을 하고 있거든요. 사람과 사물을 어떻게 연결할까. 물론 사물은 굉장히 많습니다. 책도 사물이고요. 공간도 사물이고 센서 여러 가지 것들이 다 사물이라 할 수 있죠. 사람과 사물을 연결하고, 사람과 사람을 연결하고, 사람과 공간을 연결하고, 사물과 공간을 연결하고. 그러니까 이런 연결에 대한 포인트들을 굉장히 많이 고민하고 있는데 실질적으로 IOT들을 생각해 보면 모든 사물들에서 정보를 주기 시작합니다. 걸어 다니는 사람에 대한 정보라든가 각종 그런 데이터들이 사물 IOT들을 통해서 데이터들이 생성이 되는데 그게 예전에는 모든 사물들의 그런 IOT 센서들이 붙지 않았기 때문에 정보가 많지 않았어요. 그런데 이게 IOT들이 엄청나게 많아지다 보니까 그 많은 정보가 사실은 빅데이터가 됩니다. 그래서 IOT에서 나온 빅데이터들이 어디에다 저장이 되어야 하는데 어디에다 저장하지? 그런데 이게 모든 사람들이 같이 써야 하는데. 그러다 보니까 클라우드에 저장하게 됩니다. 클라우드에 저장하게 되면 그 클라우드 기반의 데이터 사인 저장한 데이터들이 분석이 가능해지는 거죠. 그래서 왜냐하면 너무 많은 데이터들이 클라우드에 모이게 되니까 그 클라우드에 모인 데이터들을 이제 분석하기 시작한 거죠. 그래서 거기서 데이터 분석이 나오는 거고 그래서 이러한 그 어떤 큰 흐름들을 생각하시면 됩니다. ICBM이라고 얘기했는데 IoT는 뭐고 클라우드는 뭐고 빅데이터는 뭐고 모바일은 뭐야. 모바일은 결국은 서비스로 떨어지는 거겠죠. 이런 것들을 통해서 생성되는 데이터와 서비스들을 어떻게 접목을 시킬까요? 동영상: 꺄르륵 꺄르륵 공부하는 도서관이라는데 뭐가 그렇게 즐거울까요? 이해가 안 가네. 바닥의 센서를 통해 스마트폰을 인식해 바로 통과가 되는군요. 아니, 무슨 도서관이 인공지능도 아니고 이건 구글에도 없는 기술인데 말이죠. 손태익: 하이패스 게이트라고 얘기를 할 수 있습니다. 동영상: 아, 아직 열람증 앱을 설치 못 한 친구는 이제야 들어옵니다. 이 친구는 도서관 정보를 받아보고 있군요. 에? 열람실 자료를 저기다요? 그게 가능합니까? 모바일에서 앉을 자리를 맡는다? 캬~ 그런데 이건 또 뭔가요? 이번 주 베스트셀러 신간 대출 정보를 알려주고 있습니다. 손태익: 붙여놔서 텍스트가 안 보이는데. 학생들이 저렇게 학생 책을 보고 직접 모바일에서 세트 대출이 가능하게 됩니다. 동영상: 책에 휴대폰을 대기만 하면 대출 완료라고요? 장난합니까, 지금? 뒤에 친구처럼 책을 들고 당당히 데스크에서 학생증 제출하고 확인받고 해야 진정한. 책을 연체했군요. 그렇습니다. 진정한 친구는 말없이 친구의 연체료를 한 방에 계산하는 거죠. 이게 의리입니다, 의리. 손태익: 도서관 내의 공기질 센서가 있어서 그 센서를 통해서 도서관의 어떤 공기질들을 측정을 하게 되는 거죠. 사실 제가 죄송한데요. 여기에 영상이. 제가 담다 보니까 원본이 안 나오네요. 다운받아서. 이거 사실 한 몇 년 전에 업체들이 이 영상들을 가지고 많이 컨퍼런스해서 많이 보셔서 어떤 분들은 보셨을지도 모르겠는데 저희가 직접 제작한 영상이기는 한데 2년 전이거든요. 2016년도에 만든 성균관대 삼성학술정보관의 어떤 비콘이나 IoT를 기반으로 한 어떤 서비스들의 모형인데 고도화가 됐습니다. 그러니까 실질적으로 학생들이 진입했었을 때 그냥 별다른 어떤 터치나 행위 없이도 게이트를 출입하게 되어 있고요. 그리고 도서관 자체에 있는 센서를 통해서 학생들에게 적시에 그에 맞는 정보들을 주게 됩니다. 만약에 희망 도서가 들어오게 되면 희망 도서가 들어왔다고. 아니면 연체가 되었으니까 연체료를 결제하시겠습니까라는 그런 어떤 푸시들이 비콘을 통해서 들어가게 되고요. 그리고 공기질 센서들이 있는데 그 센서들을 통해서 도서관에서 공기질들을 한 9가지를 측정을 합니다. 그래서 거기에 맞춰서 공조를 얘기하게 되는데 자동은 좀 아니고요. 자동까지 하려면 돈이 너무 많이 들어서. 그런 것들을 통해서 좀 도서관에서 IoT나 이러한 서비스들을 어떤 식으로 접목해서 도서관에 직접적으로 상용적으로 확실하게 저희가 서비스를 만들어볼까. 이거에 대한 고민들을 많이 했습니다. 사실 2년 전이고요. 제가 1년 동안 도서관을 나갔다 왔으니까 약간의 공백은 있지만 이제 다시 새로운 도서관 서비스가 오픈을 준비를 하고 있습니다. 그런 부분들이 아마 가시화되면 좀 더 새로운 모습들을 이거보다 업그레이드된 버전들을 말씀드릴 수는 있을 것 같습니다. 그래서 사실 IoT라는 그런 사물인터넷실이 도서관에서 한 단계 업그레이드하는데 굉장히 많은 인프라가 깔리게 됩니다. 학생들의 어떤 동선 트레킹부터 시작해서 물론 개인정보 이슈들은 그 논외로 생각될 수는 있겠지만 학생들이 어느 곳에 밀집해서 많이 활동을 하고 그리고 어떤 열람실을 많이 이용한다든가 이런 것에 대한 기본적인 그런 데이터들이 쌓이게 됩니다. 그러면 그 데이터를 또 문서를 할 수 있게 되죠. 한 1년 정도만 쌓이면 엄청난 빅데이터가 될 수 있다는 거죠. 그래서 저희가 생각하는 도서관의 어떤 모습들은 이러한 데이터 기반의 그런 서비스들을 정책적으로 이반해야 한다. 저희 성균관대학교. 어떤 4차산업혁명을 준비하는 어떤 기조라고 할 수가 있을 것 같습니다. 그런데 이제 본론으로 들어가면 왜 그런 클라우드를. 그 클라우드를 못 할까. 클라우드를 얘기를 해야 하는데 클라우드로 그럼 어떠한 서비스를 할까. 그럼 IoT와 빅데이터 그런 서비스를 통해서 뭘 해야 할지는 알겠어. 그러면 클라우드는 어떠한 식으로 어떤 서비스들을 도서관에 접목시켜볼까. 그런데 사실 연구자의 실적들을 그냥 퍼포먼스들을 평가하고 아니면 아카이브 하는 그런 서비스들은 해외 도서관에서는 2010년 초부터 굉장히 해외 도서관에서는 트렌드적으로 많이 준비하고 있었던 서비스이거든요. 그러니까 사실 이게 사실 다 로컬적인 그런 서비스들로 되어 있습니다. 저희 국내에서는 사실 디스페이스를 커스트마이징한 경우가 굉장히 많습니다. 서울대학교의 S스페이스죠. 이제 이게 저희가 현실적으로 얘기하면 즉 이번 S스페이스를 가지고 국립중앙도서관에서 ONK. 센트럴 포럴 서비스를 준비를 하고 있죠. 연구 실적들을 모으고. 유니스트에서도 디스펜스를 커스트마이징해서 기관 리포지틀리로 준비를 하고 있습니다. 그래서 많은 대학들이 분분히 의견들이 좀 나눠져 있는데 연구처에서 하느니 도서관에서 하느니 이런 것들이 좀 많이들 이야기가 되고 있죠. 유니스트 같은 경우에는 학교 전체 차원에서 학교의 연구 실적들을 저런 리포지틀리에다가 무조건 업로드하고 어떤 교수님들의 연구 실적들을 오픈하는 그런 트렌드 그런 서비스를 하고 있고요. 연세대 같은 경우에는 표어가 있죠. 엘스비어에서 나오는 연구 업적 관련된 솔루션, 성과분석하는 솔루션들이 굉장히 많습니다. PURE 같은 거. 그 다음에 사이버 있고 그 다음에 인사이트 이렇게 굉장히 고가의 그런 솔루션들이 많죠. 그런 것들을 도서관에서 도입해서 연구 업적들을 관리하기 시작했습니다. 그런데 해외는 사실 조금 더 앞서 나가 있는 부분이 제가 코넬대학교 갔었을 때 거기는 도서관 직원들이 330명 정도가 있는데 오픈소스, VIVO 라는 연구 성과물 플랫폼 자체에 대한 팀들이 꾸려져 있습니다. 그래서 여기에서 코넬에서 생성되는 그 많은 연구 실적들을 네트워크화해서 시각화까지 해서 지금 서비스를 하고 있습니다. 그런데 코넬에 아마 이 비보라고 한번 구글에 쳐보시면 버전이 업그레이드됐습니다. 이 버전에서 좀 더 시각화된 버전으로 이제 업그레이드됐습니다. 그래서 전 세계의 연구자들과 연구자, 연구 실적들을 같이 네트워크하는 것들을 한눈에 볼 수 있고 그걸 통해서 다양한 파생적인 서비스들을 준비를 하고 있습니다. 전문가들을 매칭해서 검색을 해 준다든가 아니면 기관의 연구 실적들을 한눈에 보여준다든가. 그런 것들이 보여지는 그런 서비스인데 이건 굉장히 쉽게 오픈소스가 돼 있어서 쉽게 설치를 하고 만들 수가 있습니다. 물론 메타데이터가 좀 구조가 RDF나 이런 쪽에 대한 고민들은 있어야 하겠지만 그래서 생각하는 게 국내 연구지원 서비스들의 문제들이 뭐냐 하면 저희들도 사실 두 가지가 있었습니다. 하나가 리서치 퍼포먼스라는 그런 사이트가 하나 있었고 그다음에 비보도 하나 만들어서 한번 테스트를 해 봤는데 굉장히 로컬적으로 움직이다 보면 힘을 받지 않습니다. 그래서 이제 제가 국회도서관 쪽에 그런 사업들에 대해서 같이 협력을 기획들을 같이한 게 뭐냐 하면 어떤 리즈가 맞았던 것 같습니다. 이제 국회도서관에서도 이제 국가의 어떤 전체적인 학술정보들을 한 군데에서 모아서 서비스를 해 보자. 그리고 그걸 좀 연구자들과 그다음에 일반 이용자들에게 좀 필요한 서비스들. 적합한 서비스를 분석도 하고 그다음에 검색도 해서 한눈에 볼 수 있는 그런 서비스들을 만들자라고 해서 국회도서관 같은 경우는 전체적인 그런 큰 그림을 그리고 저희 성대 같은 경우는 로컬단에서 성대만의 로컬적인 그런 클라우드 베이스의 연구 성과 업적 관리시스템. 서비스 시스템을 만들게 됐습니다. 전체적인 기획들을 좀 하고 디자인하고 했지만 조금 많이 좀 아쉽기는 하지만 전체적인 콘셉트를 한번 설명을 드리도록 하겠습니다. 그래서 전체적인 SKKU라는 메인 화면에서 사실 메인 화면이 조금 뭔가 좀 부족한 것 같은데 만약에 다른 대학들이 참여를 하게 된다 그러면 조금의 커스트마이징이 이제 계속적으로 되겠죠. 연구자들의 논문 검색들을 한눈에 볼 수가 있고요. 빨리 끝내야 할 것 같네요. 이제부터 시작인 것 같은데 전문가 검색이라고 해서 성대에 있는 교수님들의 어떤 전문적인 영역들을 검색 키워드를 넣었을 때 해당되는 교수님들을 찾아줍니다. 그리고 기본적인 기관의 어떤 클라우드 정보들을 보여주죠. 이런 것들은 많이들 보신 거고 단계별로도 정보들을 볼 수 있고 그 다음에 학과의 정보들을 약간 시각화해서 연구자들 간의 어떤 공동연구 현황들을 키워드 기반 시각화로 좀 보여줄 수가 있습니다. 가장 중요한 건 사실 개인 연구자들 교수님들이 원하는 게 뭐냐 하는 건데 교수님들이 가장 원하는 건 심플합니다. 자기 연구 실적 잘 모아놓는 사이트가 있어서 그걸 나중에 어떤 BK산업이나 아니면 그런 산단산업이나 연구제도 이런 산업들의 연구 레퍼런스를 낼 때 좀 자료들을 한눈에 다운받았으면 좋겠다. 이런 것들이 되게 중요하거든요. 연구자들의 그런 CV들을 관리할 수 있는 그런 서비스가 되고 그다음 연구자들 스스로도 내가 봤을 때 내 키워드 클라우드는 뭐지? 그 다음에 내가 지금 주로 많이 했었던 공동연구는 뭐야 이런 것들을 좀 한눈에 알아볼 수도 있습니다. 연구자 관리 시스템에서 가장 중요한 부분은 이따 아마 물어보실 것 같습니다. 그러면 지금 현재 이 서비스를 하려고 그러면 만약에 지금 자기 연구자 학교의 연구자들이 못해도 한 5만 건 연구실적들이 몇 년 치가 쌓여 있을 수 있잖아요. 그랬었을 때 그 연구자들의 맞는 정보들을 실적들을 어떻게 다 매칭해서 모을까. 여기 굉장히 힘든 부분입니다, 여기가. 그러니까 이 부분들은 조금 더 다듬어서 좀 쉽게 접근해서 만들어야 하는 기능이고요. 이런 부분들을 조금 오래 조금 더 국회도서관하고 얘기를 해서 서비스들을 좀 마무리를 해야 하지 않나라는 지금 생각이 조금 있습니다. 그래서 조금 급하게 끝나게 마무리가 약간 마지막에 끝나게 되는 것 같은데 이게 사실 나관중의 소설에서 나온 얘기죠. 항상 생각하는 게 있습니다, 대학에서. 이게 뭔 맨날 뭉쳤다가 분산했다가 집중했다가 분산했다가 이런 것들의 서비스가 대학교에 계시면 제일 잘 아실 겁니다. 이게 대통합제 학문팀 같은 게 하나 있었다가 행정실 하나 있었다가 또 이런 식으로 간다든가. 서버도 큰 서버 하나 있었다가 개별 로컬PC로 갔다가 다시 또 클라우드로 갔다가 그러니까 이게 사실은 제가 클라우드로 얘기했었을 때 많은 기술적인 부분들은 아마 나중에 얘기하시는 분들이 얘기하실 거라 생각하지만 그렇게 중요하지 않습니다. 클라우드나 IOT나 이런 것들은 다 기술적인 그런 용어일 뿐입니다. 저희가 중요하게 생각해야 할 부분들은 저희가 생각해야 할 저희가 앞으로 해야 할 것들에 대한 지켜야 할 것들에 대한 그런 생각이 있습니다. 그래서 많은 분들이 저한테 한마디 물어보십니다. 10년 후에 도서관이 어떻게 될 것 같습니까 묻는데 제가 약간 아마존의 CEO 같은 말을 한다 그러면 10년 동안 변하지 않을 것에 더 집중하는 게 저희 도서관이 살아남는 길이라고 생각합니다. 이게 조금 마무리가 조금 급하게 마무리된 그런 기분은 없지 않아 있지만 이상으로 마치도록 하겠습니다.



클라우드를 통한 디지털 트랜스포메이션

발표: 신용녀(한국마이크로소프트 기술최고임원)
동영상에 대한 자막정보
신용녀: 클라우드를 통한 디지털 트랜스포메이션에 관련해서 설명드릴 거고요. DT라는 얘기를 선생님들께서 들어보셨는지 모르겠는데 한 3년 전만 해도 미국의 공항에 가면 디지털트랜스포메이션이라는 용어가 굉장히 많았습니다. 우리나라도 이제 클라우드 환경이나 IOT 얘기가 많이 나오면서 디지털트랜스포메이션해야 한다. 특히 4차혁명시대 얘기를 하면서 DT 관련된 얘기들이 많이 나오고 있고요. 오늘 시간에는 저희 마이크로소프트가 어떻게 DT를 접근하고 있는지 그리고 사실은 마이크로소프트가 클라우드하는 거 잘 모르시는 분들도 많으세요. 그래서 애저라는 저희 프레임웍이 있는데 그런 것들에 대해서 좀 소개를 드리면서 4차산업혁명 그리고 DT에 관련된 좀 인사이트를 많이 얻어 가시는 시간이 됐으면 좋겠습니다. 어디서나 4차산업혁명 얘기가 많이 나오는데요. 사실은 4차산업혁명시대를 얘기를 할 때는 3가지 콘셉트로 보시면 될 것 같습니다. 4차산업혁명시대를 이룩하기 위해서는 사실은 굉장히 많은 형태 그리고 누적된 형태의 빅데이터. 그러니까 데이터들이 많이 필요한 거죠. 어떤 고객의 정보들을 분석을 해서 이 고객이 다음에 어떤 물건을 살 것인가라는 걸 예측을 빨리 하려면 이 데이터가 필요합니다. 지금 클라우드환경에서는 여러분들이 말씀하시는 것들 화장식이 바로 텍스트로 바뀌어요. 그래서 그 텍스트를 가지고 예를 들면 AWS 같은 경우는 알렉사나 아니면 그런 AI. 요즘에는 네이버나 우리나라 그런 로봇 비슷한 그거 뭐죠? 스피커랑 연동된 것들이 많죠. 그런 것들이 결국 기술적으로 보면 여러분들이 스피치를 하시면 그게 텍스트로 바뀌어서 그 명령으로 얘가 수행을 한다라고 보시면 돼요. 그래서 그런 것들도 사실은 말 자체를 알아듣는 것도 굉장히 많은 양의 데이터들이 필요합니다. 왜냐하면 어떤 사람은 이렇게 얘기하고 어떤 사람은 다르게 얘기를 하기 때문에 그걸 똑같이 인식하기 위해서는 굉장히 많은 데이터들이 필요해요. 그런데 과거에도 클라우드가 나오기 전에도 사실은 데이터들은 많았어요. 그런데 그 데이터들을 빨리 그리고 효율적으로 분석하기 위해서는 뭐가 필요하냐 하면 강력한 알고리즘과 하드웨어가 필요했었던 거죠. 하드웨어를 대신할 만한 대규모의 계산처리 능력이 필요했습니다. 이게 왜 가능하냐 하면 클라우드가 등장하면서부터 이게 굉장히 가능해졌죠. 무슨 얘기냐 하면 예를 들면 여러분들이 슈퍼볼. 그러니까 미국 같은 경우는 슈퍼볼 게임 이런 것들이 굉장히 유명합니다. 우리나라로 치면 야구경기라고 치죠. 그러면 그만큼 인기가 있지는 않지만 어쨌든 아, 예를 들면 최근에 김정은. 우리 대통령님하고 북한의 그분하고 만나셨죠. 그랬을 경우 누구나 TV를 보셨는데 이렇게 굉장히 많은 트래픽이 몰렸을 때 그 트레픽을 효율적으로 처리해 줄 수 있는 기술이 사실은 클라우드의 핵심이라고 보시면 되고요. 예를 들면 그냥 하드웨어 기반이라고 하면 그것들을 처리해 주기 위해서 예를 들면 컴퓨터를 갖다가 계속 꽂았다고 상상을 해 보세요. 그걸 클라우드에서는 바로 오토 스케일이라는 기법으로 얘기하는데 자동적으로 얘가 확장을 해 갑니다. 그게 기술이에요. 그게 마이크로소프트가 가지고 있는 아마존도 각광을 받지만 가지고 있는 클라우드의 핵심 기술이라고 보시면 되고요. 그런 것들이 어떻게 실제 4차산업혁명시대의 실제 비즈니스로 이루어지고 있는지에 대해서 제가 오늘 세션의 설명을 드릴 겁니다. 어쨌든 기존에도 데이터가 많았지만 그 데이터를 효율적으로 분석하는 강력한 알고리즘이 등장을 하게 되고 이런 것들을 효율적으로 처리할 수 있는 대규모의 계산 처리가 가능해진 게 클라우드다. 그래서 클라우드시대가 도래함으로써 실제 여러분들이 4차산업혁명시대에 이르고 계시는 거죠. 그래서 이런 것들이 어떻게 진행이 되고 있는지 설명을 드리겠습니다. 그러니까 미국 같은 경우는 아까도 말씀드렸듯이 DT 이런 얘기들이 예전부터 있었어요. 3년 전부터, 4년 전부터 이미 각광을 받기 시작했고요. 마이크로소프트 대표적인 저희가 사례를 얘기를 할 때 이 머스크라는 해운 회사가 있습니다. 이 머스크에서 마이크로소프트의 애저를 기반으로 요즘 많이 나오는 블록체인을 기반으로 실제로 비즈니스의 효율성. 그리고 DT를 이룩한. 디지털트랜스포메이션을 이룩한 사례입니다. 예를 들면 여러분들이 입고 계시는 옷, 여러분들이 쓰고 계시는 물건들은 전부 다 뭐를 통해서 운반이 되죠? 배를 통해서 운반이 됩니다. 우리가 쓰는 물건들 중에 80% 이상이 이런 해상 물류시스템 이런 것들을 통해서 딜리버리가 되고요. 실제 육로를 통해서 교류되는 것들은 한 20%밖에 안 된다고 해요. 그런데 어쨌든 이 머스크라는 데에서 어떤 물건들을 이렇게 하적해서 비즈니스를 하다 보니까 너무 많은 변수들에 문제들이 생기는 거예요. 예를 들면 가다가 풍랑도 만나고 가다가 태풍도 만나고 이러니까 원래 제대로 도착해야 하는 몇 월 며칠까지 도착해야 하는 그 물건들이 도착이 미뤄진다든지 어떤 업체에서는 빨리 그걸 받아서 비즈니스를 해야 하는데 그것들이 지연이 생겼단 말이죠. 이런 생각지 못하는 리스크들. 그러면 예를 들면 그것들을 효율적으로 부연하기 위해서는 아까도 제가 말씀드렸듯이 실제 송장이나 이런 것들도 인보이스나 이런 것들도 블록체인으로 또 구현이 되어야 하고 그리고 아까 말씀드린 그런 웨더. 날씨에 관련된 그런 것들도 뭔가 저장이 되어서 계산을 해야 하고 이런 일들이 발생을 하게 된 거죠. 그래서 이런 것들을 실제로 전부 다 클라우드 위에 올려서 효율적으로 그것들을 구현을 하게 됩니다. 그래서 실제로 생산성 측면이나 아니면 비용적인 측면. 그리고 아까 제가 말씀드린 제일 중요한 거. 프리딕션. 예상을 예측을 해내기 가능하게 된 거예요. 비즈니스에 있어서 얘가 딜레이가 발생을 할 것 같으면 그것들을 맞추기 시작한 거죠. 그래서 실제 효율적으로 비즈니스의 70% 이상을 효율적으로 이끌어낸 사례입니다. 우리가 이제 기술적인 얘기들을 많이 하는데요. 여러분들이 4차산업혁명. 그 다음에 DT 이런 걸 얘기할 때 실제 기술이 나와서 그 기술을 적용했다고 해서 예를 들면 IoT을 적용하고 Cloud를 적용한다고 해서 그것들이 디지털 혁신을 이루고 여러분들이 4차산업혁명을 이룬 게 아니에요. 기본적인 기술들은 계속 깔려 있는 거예요. 깔려 있는데 그것들을 통해서 여러분들이 뭘 아셔야 하냐 하면 여러분들의 비즈니스에 집중하시고 그런 기술들이 장벽이 안 되게 내가 그것들을. 그것들이 장벽이 안 되게 내가 효율적으로 내 비즈니스를 빨리빨리 구현할 수 있는. 그 환경이 만들어진 것. 그것들을 통해서 실제 DT를 이룩하시는. 디지털트랜스포메이션을 이룩하시는 게 실제 4차산업혁명의 여러분들이 도래했다고 보시는 거지 단순히 IoT를 쓰고 클라우드를 썼다고 해서 그것들이 DT를 이루는 건 아니라고 보시면 됩니다. 더 이상 예를 들면 미국이나 아니면 유럽이나 이런 데에 여러분들의 서버를. 저희는 전문용어로 VM 같은 것들을 얘기하는데 그런 것들을 여러분들이 설치하시는. 저희는 Launch라는 용어를 쓰는데요. 버추얼머신이나 이런 것들을 여러분들이 미국에다가 비즈니스를 하고 싶어요. 그러면 거기다가 제가 서버 하나 띄우는 그것들이 어렵지 않다라는 거죠, 클라우드시대에서는. 어떻게? 클릭 한 번이면 돼요. 나는 북미 지역에 서버를 하나 설치하겠어. 그러면 클라우드 환경 애저 기반으로 들어가셔서 그냥 클릭 하면 걔가 수분 만에 런치가 됩니다. 그런 걸을 통해서 여러분들이 뭘 하셔야 한다고요? 여러분들이 지금 하시고 싶은. 예를 들면 도서관 사업이다. 아니면 여러분들이 나는 스타트업을 하고 싶다라고 하면 그것들의 여러분들이 집중하시는 비즈니스에 집중을 하실 수 있는 그런 환경들이 만들어졌다고 보시면 됩니다. 그게 진정한 DT고 4차산업혁명시대를 이룩했다고 보시면 돼요. 이런 분들이 기반이 되는 건 이제는 익숙하시죠. 웹이나 과거에는 소셜도 사실은 이건 밑바닥에 깔려 있는 과거 기술이죠, 어떻게 보면. 여러분들이 많이 쓰시기는 하지만. 그렇지만 그것들이 도래하면서 그 위에 예를 들면 인터넷 위에 클라우드라든지 아니면 아까 제가 말씀드린 데이터. 데이터 분석이 가능해진 거예요. 그리고 미래를 예측할 수 있는 것들이 가능해졌다는 거죠. 과거에는 어떤 데이터들이 있으면 이걸 분석을 해서 뭔가 효율적이고 아니면 연구를 했다라고 보이지만 이제는 그 더 많은 데이터를 굉장히 빠른 알고리즘. 강력한 알고리즘을 통해서 분석을 해서 미래를 내다볼 수 있는 그리고 고객이 어떤 것들을 원하는지를 바로 바로 캐치할 수 있는 그런 시대로 도래했다라는 거죠. 그런 것들이 예를 들면 IoT나 여러 가지 기술들. 특히 컨테이너 같은 경우는 저희가 버추얼머신라고 그러는데 하이퍼바이저나 이런 가상화 기술을 효율적으로 하기 위해서 나온 기술이라고 보시면 되고요. 클라우드 자체도 퍼블릭 클라우드 그 다음 프라이빗 클라우드가 존재를 하는데 그것들이 약간 컨버전스된 형태. 그래서 그런 것들을 하이브리드 클라우드로 엮은 형태들의 기술들이 도래했습니다. 거기에 이런 기반이 되는 기술에 여러분들이 아까 제가 말씀드린 빅데이터를 분석을 해서 실제 효율적인 알고리즘을 가지고 미래를 내다볼 수 있는 인공지능 기술들이 등장을 하게 된 거예요. 그것들이 예를 들면 딥러닝이나 아니면 뉴럴 네트워크이나 다양한 형태의 그런 것들이 나오죠. 특히 블록체인도 마찬가지입니다. 그리고 이제 앞으로는 저희가 어드벤스된 로봇틱스라든지 공장 자동화라든지 아니면 퀀텀 컴퓨팅이라고 해서 원래 그 디지털이라는 건 퀀텀이라는 용어 들어보신 적 있나요? 그게 이제 새로 들어오는 등장하는 용어인데요. 기술적인 용어인데 나중에 제 세션을 듣고 나시면 퀀텀이라는 걸 내가 들어봤어. 신용녀라는 애가 얘기를 해서 들어봤어라고 하실 수 있을 거예요. 퀀텀은 원래 컴퓨터라는 게 0, 1로 다 존재를 하죠. 그렇죠? 0과 1로 다 존재를 하는데 그래요, 디지털이라는 건. 그런데 이 퀀텀 컴퓨팅은 0도 아닌 것이 1도 아닌 것이 어떻게 보면 빛에 이런 전구가 밝기를 조절하는 것 같은 그런 형태의 데이터라고 보시면 돼요. 그것들을 구현하기 위해서는 특수한 기술들이 필요하고 특수하는 장비들이 필요한데 이 퀀텀 컴퓨팅을 하게 되면 어떤 일이 발생을 하냐 하면 여러분들이 쓰시는 그 반도체보다도 훨씬 더 많은 효율적으로 더 복잡한 계산들을 굉장히 수분 내에 하게 됩니다. 그래서 퀀텀 컴퓨팅을 하게 되면 지금 가지고 있는 암호 알고리즘 이런 것들이 수분 만에 깨진다는 그런 연구 논문들이 있어요. 그래서 예를 들면 대표적으로 마이크로소프트 같은 애들. 그리고 와이비엠 이런 애들이 퀌텀 컴퓨팅을 연구를 하고 실제로 구축을 하고 있습니다. 이러한 기술들이 계속적으로 지속적으로 발전을 하고 있는데요. 그런데 제가 말씀드리는 건 기술에 집중하실 게 아니라 이런 것들을 활용하셔서 여러분들이 원하시는 비즈니스를 얼마나 집중할 수 있냐. 그게 실제 DT라고 생각을 하시면 될 것 같습니다. 왜 지금이냐라고 했을 때는 아까도 제가 말씀드렸듯이 그런 기술적인 패러다임이 쭉 지나오면서 여러 가지 기술적인 변화들이 있었습니다. 그렇지만 그것보다 더 중요한 건 지금 현재의 기존에 있던 데이터들을 강력한 알고리즘을 가지고 실제로 빨리 연산을 해내고 내가 원하는 양으로 그리고 내가 원하는 속도로 컴퓨터들을 계속 붙여서 실제 내가 원하는 연산들을 해낼 수 있는 환경이 됐다라는 거죠. 클라우드, 아까 제가 말씀드렸듯이 들어가서 그냥 클릭하시면 전 세계 어디라도 내가 서버 만들어서 할 수 있습니다. 여기에 등장하는 여러 가지 기술들이 있어요. 그래서 아까 제가 말씀드렸던 클라우드 기반의 AI라든지 인공지능 얘기 많이 나오죠. AI라든지 블록체인 요즘 얘기 많이 나옵니다. 이런 것들은 블록체인 같은 경우도 어려운 게 아니에요. 얘는 암호 알고리즘. 해시 기반의 암호 알고리즘을 쓰지만 사실은 여러 명이 나누어 갖고 한 명이 바꾸는 것들이 인정이 안 되니까 다 바뀌는. 이런 메커니즘을 갖고 있어서 좀 더 안정적이라고 많이 보이고요. 보인다고 사람들이 생각을 해서 블록체인 기반으로 많이 구현을 하죠. 실제로 여러분들이 가상 화폐에 관련된 거래를 해 오셨는지 모르겠는데 한참 열풍이었죠. 지금 금융위기에 이런 정책 내놓기 전에. 그랬을 경우에 거래소들이 국내에 있는 거래소들이 다 클라우드를 썼었습니다. 아마존이라든지 MS 같은 클라우드 기반으로 돌아가고 있고요. 그게 가능한 건 실제로 블록체인이나 이 비트코인 이런 것들에 관련된 가상화폐들을 젊은 친구들이 막 거래를 하는 데 있어서 폭주가 일어난 거예요, 그것들이. 막 거래를 내가 들어와서 막 해요. 그러려면 거래를 하기 위해서는 그 트랜젝션이 계속 발생을 하는데 아까도 제가 뭐라고 말씀드렸냐 하면 클라우드의 핵심 기술은 얘를 스케일. 오토 스케일하게 그러니까 확장을 확 시켜주는 거예요. 그런 트래픽이 발생을 했을 때. 그것들이 아무런 문제가 없이 기술적으로 얼마나 잘해 주느냐가 클라우드의 핵심이거든요. 그런 것들이 가능했기 때문에 아까 말씀했던 거래소들이 거의 다 클라우드 기반으로 돌고 있다라고 보시면 될 것 같습니다. 지금 규제들이 또 만들어지고 있기는 한데요. 그리고 IoT는 아까 바로 전에 발표하신 선생님이 모든 것들이 다 신호를 갖고 있고 모든 데이터들 전송하고 있고 그렇지만 IoT 기반으로는 프라이버시 문제라든지 예를 들면 여러 가지 또 이슈들이 있기는 하죠. 오늘은 시간이 짧으니까. VR이라든지. 이런 것들이 최근에 개봉한 영화 중에 스티븐 스필버그가 개봉한 그 영화 보셨나요? 아마 나중에 한번 보시면 되게 재미있으실 거예요. VR 환경으로 세상이 이루어지는 그런 건데 저는 되게 재미있게 봤거든요. 실제로 VR에 관련되어서는 연구들이 많이 진행이 되고 있습니다. 그래서 이러한 이모징한 기술들이 계속 진행이 되고 있고요. 또 얘기 많이 나오는 게 이미 기술들이 많이 발전을 했기 때문에 어떤 얘기들을 하고 있냐 하면 IoT 시대고 AI고 클라우드 시대인데 사람은 뭔가라는 얘기들도 많이 합니다. 그래서 예를 들면 인터넷 클라우드 기반의 AI의 윤리의 관련된 얘기들을 많이 합니다. 얘 같은 경우는 2017년 10월에 나온 잡지인데 이 그림 잘 보시면 여기 앉아 있는 사람이 누구죠? 돈 이렇게 받고 계신 분이 사람이고 옆에 이렇게 돈 주는 사람들이 로봇입니다. 그래서 클라우드시대 AI시대에서 사람들이 제일 많이 불만이라기보다는 겁내하는 게 뭐냐 하면 자꾸 나의 일자리를 잃는다라는 거예요. 사람들의 일자리를 누가 가져가고 있냐 하면 로봇이 대체할 수 있는 시대로 왔다라는 겁니다. 아까 제가 말씀드린 그런 기술들로 인해서. 그러면서 실제로 저희가 클라우드 비즈니스 하다 보면 많은 시스템 어드민들을 만나게 되는데 그 시스템 어드민들이나 실제 전산실에 있으신 분들이 제일 먼저 질문은 내 밥그릇이 없어지네. 이제 필요 없네. 예를 들면 그런 거예요. 예를 들면 데이터베이스 같은 거 있지 않습니까? 선생님들 데이터베이스 같은 경우가 예전에는 한 10년 전? 15년 전에는 데이터베이스 어드민이 굉장히 각광받는 직업이었어요. 예를 들면 오라클이라든지 여러 DB 시스템들이 있는데 이 DB만의 어떤 유닉이나 아니면 DB의 중요성 때문에 얘를 관리하는 애들이 굉장히 몸값이 높았습니다. 지금 클라우드시대에서는 누가 그걸 다 하냐 하면 클라우드는. 그 어드민이 하는 역할을 누가 해 주냐 하면 클라우드 기술 자체가 해 줘요. 더 이상 OS패치나 데이터베이스가 쓰는 DBMS을 자동적으로 업데이트나 패치를 해 주기 때문에 실제로 DBA라는. 데이터베이스 어드민이 필요 없는 시대로 계속 도래하고 있어요. 이런 식으로 계속 사람의 일자리들을 뺏고 있는 거죠. 그리고 예를 들면 이런 거죠. 예를 들면 여러분들 화장품 사러 가셨어요. 어떤 백화점에 그렇다고 칩시다. 그러면 예전에는 백화점 가실 때 옷 깨끗하게 입고 가시죠. 그래서 내가 물건 사러 왔어 그러면 그 판매원이 좀 빠릿빠릿하신 분이라면 이분이 중요 고객이고 이걸 옷차림이 어떤지 간에 알아내셨을 거예요. 그래서 아무리 부자스럽게 입고 오시건 아니면 가난하게 좀 허름하게 오시건 이분이 VIP라고 생각이 들면 잘 딜링하셨을 텐데 대부분은 그렇지 않죠. 옷차림 보고서 예를 들면 판다든가. 좀 다른 에티듀드를 보실 수 있는데요. 지금은 여러분들이 들어오시는 순간 뭐로 클라우드 기반에서는 얼굴 인식이 다 되기 때문에. 얼굴 인식 어렵지 않아요. 그냥 클릭하면 되거든요. 아까 제가 말씀드린 클라우드 애저 기반의 프레임을 들어가셔서 예를 들면 여러분들이 원하시는 지역에 예를 들면 미국에 내가 서버 하나 런치하고 내가 쓰고 싶은 얼굴 인식 알고리즘을 내가 쓰고 싶다라고 하면 그냥 클릭하시면 그게 만들어져요. 진짜 클릭 몇 번 하시면 돼요. 그런 시대로 왔기 때문에 아무리 옷을 허름하게 입고와도 얼굴 인식해서 이분이 VIP다라는 걸 바로 인식할 수 있다라는 거죠. 그런 것들이 예전에는 사람을 Assign하고 그리고 실제로 기안을 내서 시스템들을 구현하고 그것들을 시스템들 서버들 들이고 이런 것들이 몇 개월. 이렇게 1년 걸렸던 것들이 수분 만에 되는 시대로 도래했다라는 거죠. 그러면서 나오는 게 뭐냐 하면 프라이버시 이슈하고 도대체 사람이 어떤 역할을 할 것인가. 그리고 내 일자리는 어디인가라는 고민들을 하면서 이런 부정적인 얘기들도 많이 나옵니다. 이거 뭐로 보이세요? 또 이게 뭐냐 하면 어느 회사나 오늘의 사원, 이달의 사원 이런 거 뽑습니다. 그런데 이달의 사원에 기존에는 톰이든 마크든 계속 했었는데 이제는 로봇이 그 자리를 대신하는 거죠. 왜? 아까 제가 말씀드린 이미 기술은 그렇게 넘어갔어요. 그러면 여기서 중요한 건 사실은 윤리. 실제로 어떻게 클라우드 기반이나 이러한 발전되는 기술에서 사람을 중심으로 그리고 윤리적으로 뭔가 이룰 수 있는가. 이미 MS 같은 마이크로소프트 같은 회사는 그런 것들에 대한 리서치. 그 다음에 그런 것들에 대한 행위들을 하고 있거든요. 그런 시대로 여러분들은 이미 진입해 계십니다. 졸리시지 않으시죠? 이제 안 조시는데요? 아까 처음에는 좀. 그래서 예전에는 어떤 일이 발생을 하면 왜 발생했느냐. 그걸 집중했었어요. 실제로. 그런데 이제는 아까 제가 말씀드렸던 광범위한. 굉장히 많은. 패타바이트, 페라바이트. 상상할 수 없는 그런 데이터 양을 가지고 여러분들이 강력한 알고리즘을 통해서 예측을 해내는 거예요. 얘가 뭐를 살 건지. 이 사람이 VIP인지 들어와서 무슨 행위를 할 건지가 바로 바로 예측되는 세계로 이미 오셨고요. 그걸 통해서 내가 뭘 할 것인가. 내가 어떤 비즈니스에 집중할 것인가. 내가 어떻게 내 비즈니스를 효율적으로 할 수 있을까를 여러분들이 고민해 보시는 시대가 됐다라는 거죠. 그게 진정한 DT. 디지털 트랜스포메이션이고 디지털던이고 4차혁명시대지 단순히 IoT를 도입하고 클라우드를 썼다고 해서 그게 4차산업혁명시대라고 보실 수는 없는 거라고 생각이 듭니다. 이거 뭐로 보이세요? 이제 마이크로소프트 개괄적인 이야기 드렸고요. 마이크로소프트 실제로 여러분들이 얼마나 쉽게 구현이 가능하신지에 대해서 좀 보여드릴 거예요. 거미라고 딱 대문짝만 하게 나오죠? 사실은 이게 그냥 간단해 보이지만 사람이 인식할 때는 굉장히 쉬워 보이잖아요. 얘가 거미인지를 사람에 따라서는 다르게 또 인식하실 수는 있는데 어쨌든 이게 기술적으로 보면 152개의 레이어를 두어서 이미지 프로세싱을 돌려서 얘가 거미인지를 판단하는 거예요. 실제 클라우드. 애저 기반의 클라우드에서는 여러분들이 예를 들면 햄버거를 인식시키고 싶다라고 하면 아까 제가 말씀드렸듯이 그냥 내가 원하는 지역. 서울에 내가 서버 하나 딱 올리고 거기에 나는 이미지 프로세싱하고 싶다라고 하면 내가 구글이나 이런 데에서 여러분들이 이미지 찾으실 수 있잖아요. 5개만 먼저 트레이닝 시켜요. 트레이닝 시키고 그 다음에 내가 햄버거라는 걸 또 다른 이미지를 갖다 붙이면 얘를 햄버거인지를 인식을 해요. 그게 진짜 몇 번 클릭으로 다 된다라는 거죠. 그 안에 기술적인 건 얘가 152개의 레이어를 쳐서 얘를 거미라고 인식을 합니다. 이렇게 실제로 그런 프로세싱이 일어나는데요. 이거 뭐로 보이세요? 지도죠. 그런데 아까 그 전에 여기 보면 잘 뚫어지게 보시면 뭐가 보이실 텐데요. 보이시는지 모르겠는데 찾기 시켜드려서 죄송한데 저기가 스노우레오파드라고 눈 표범이라는 종이 있어요. 그런데 이 눈 표범이 뭐가 문제냐 하면 얘는 변신에 능해요. 그러니까 예를 들면 바위에 옆에 있다라고 하면 바위 색깔과 똑같아지고요. 나무에 옆에 있다라고 와면 카멜레온처럼 색깔이 똑같이 바뀌어요. 그런데 문제가 뭐냐 하면 얘네들이 종이 멸종될 위기인 거예요. 그런데 도대체 어디 있는지를 몰라서 어디 있는지를 몰라서 얘를 보호할 수가 없는 사태가 발생했어요. 그래서 이걸 연구하시는 분들이 마이크로소프트 협업을 공동연구를 제안을 하셔서 저희가 아까 제가 말씀드린 그런 이미지 프로세싱에 관련된 AI 기술을 가지고서 실제로 눈 표범을 보호하는 그런 프로젝트에 참가를 하게 됩니다. 이때도 쓰이는 기술은 아까도 제가 말씀드렸듯이 딥 뉴럴 네트워크인데 기술적인 얘기는 차차하고라도 제가 말씀드렸듯이 알고리즘. 그 다음에 그런 플랫폼들은 클라우드 기반에서 가능하기 때문에 이런 것들이 굉장히 손쉽게 구현이 가능해요. 그래서 이런 것들을 통해서 실제로 어디 있지, 레오파드가. 이랬을 경우에 실제로 찾아내죠. 패턴을 분석해서 얘가 레오파드인지를 찾아내서 얘가 어떤 동선으로 가는지 그리고 얘를 실제로 보호하기 위해서는 어떠한 보호 행위를 해야 하는지에 대해서 분석하는 그런 것들이 클라우드 기반에서는 굉장히 쉬워졌다라고 보시면 돼요. 그래서 이런 프로젝트 보이시죠, 이제는? 아까는 잘 안 보였는데. 이런 것들이 마이크로소프트에서 굉장히 열심히 노력을 해서 일을 하고 있고요. 아까 제가 말씀드렸듯이 사람 일자리를 뺏는다고 말씀을 드렸는데 노르웨이에 E스마트라는 회사입니다. 이 노르웨이 회사는 애저 기반의 마이크로소프트 애저 기반의 클라우드 서비스를 이용을 하면서 이 비즈니스를 하고 실제로 DT를 이룩한 대표적인 사례가 됩니다. 왜냐하면 얘네들이 무슨 비즈니스를 하냐 하면 여기 보시면 이게 뭐냐 하면 고전력, 고전압의 전선들 보이시죠? 그런데 이게 사람이 닿거나 그러니까 지금 헬리콥터들이 이것들을 관찰하고 이래야 하는데 헬리콥터 타보셨는지 모르겠는데 타보시면 얘가 굉장히 출렁출렁해요. 그리고 조그마한 바람에도 얘가 확확 이렇게 되거든요. 그런데 문제가 뭐냐 하면 이런 전선이나 이런 거에 닿으면 고전압에 닿으면 추락의 위험성이 있어요. 그리고 이것들을 사람이 가서 직접 보기가 그러니까 위험한 지역에도 너무 많다라는 거죠. 이런 것들을 비즈니스를 하기 위해서 실제로 E스마트에서는 드론을 띄워서 실제로 비전. 아까 제가 말씀드린 레오파드와 비슷한 프로젝트로 비전 드론 기반의 클라우드 분석을 통해서 실제로 이런 전선에 어디 문제가 생겼는지 오류가 생겼는지 찾아내는 그런 프로젝트를 하게 됩니다. 그래서 실제 이 E스마트는 처음에는 이런 비즈니스만 하다가 아, 이게 굉장히 내가 비즈니스 잘할 수 있어. 이런 확신을 얻게 되고 클라우드를 통해서 쉽게 구현이 했기 때문에 다음에는 실제로는 진짜 위험한 지역. 고전압뿐만 아니라 사람이 접근하기 굉장히 위험한 지역을 실제 탐사를 해서 뭔가 문제를 해결하는 이런 일들을 E스마트에서 해내게 됩니다. 이게 진정한 DT예요. 어떤 다른 비즈니스를 내가 집중할 수 있겠냐라는 거죠. 저희 아까 제가 말씀드렸듯이 지금 마이크로소프트건 구글이건 아니면 아마존이건 전부 다 음성인식, 얼굴인식 이런 것들은 AI을 통해서 쉽게 할 수 있습니다. 대표적인 예가 예를 들면 음성 기반의 이런 인식들이 샌프란시스코에 관련된 자료인데요. 샌프란시스코에 굉장히 많은 인종들이 살아요. 그래서 실제로 대화를 할 때 영어를 쓰지만 예를 들면 라틴계, 다양한 형태의 영어들이 있을 거 아니에요. 그래서 사람과 사람 사이에도 음성인식. 그러니까 말을 할 때 한 10% 오류가 있다라고 해요. 예를 들면 맥드라이브나 이런 데 가서 맥도날드에 차 이렇게 해서 뭐 주세요. 햄버거 주세요 이런 걸 영어로 얘기할 때 못 알아듣는 케이스들이 생긴다라는 거죠. 그것들이 10%가 넘어요, 사람 간에도. 그런데 클라우드 기반의 애저 기반의 음성인식을 쓰게 되면 오류율이 5.8%밖에 안 돼요. 사람보다 나아진 거죠, 음성인식에 관련된. 그러니까 저희가 귀도 안 좋을 수는 있지만 어쨌든 영어의 타입도 다르고 여러 가지 그 오류율이 10%가 넘는 데도 불구하고 이러한 기술들이 일어나고 있습니다. 마이크로소프트에서는 여러분들은 그냥 윈도우나 얘네들 오피스? 이런 것들 하나 보다 이렇게 생각하실 수 있는데요. 한국에서는 아직 인식이 좀 부족하기는 해요. 왜냐하면 저희가 워낙 그런 비즈니스에 좀 강하다 보니까. 그런데 저희가 DT에 관련된 노력들을 계속적으로 하고 있고요. 그거에 반증하는 게 마이크로소프트 주가가 폭락하다가 이 DT 개념. 그리고 이런 기술들을 발전을 시키면서 주가가 3배 이상 오르게 됩니다. 그거에 결정적인 역할들을 한 것들이 인지 서비스. AI 서비스들입니다. 예를 들어서 컴퓨터 비전이라든지 아까 제가 말씀드린 언어 처리. 그리고 음성, 검색 아니면 놀리지베이스 이런 것들이 쉽게 굉장히 되고 있고요. 특히 아까 클라우드 기반으로 이미지 분석은 굉장히 쉬워졌습니다. 그래서 실제로 사진을 입력하게 되면 얘가 몇 살 정도로 보이고 그리고 얘가 지금 기쁜지 슬픈지도 다 인식이 돼요. 클라우드 기반을 몇 번 클릭하면 이게 된다라고 보시면 돼요. 그래서 이미 다 구현을 해 놨고요. 이걸 어떤 알고리즘을 쓸까 관심을 가지실 필요가 없어요. 내가 뭘 하고 싶은지를 집중해야 하는 게 DT다. 한 번만 더 얘기해 드리면. 딱지 걸리실 것 같은데 일단 이거는 예를 들면 남성이고 지금 뭘 하고 있고 그 다음에 나이가 몇 살이다, 기분이 어떻다. 이런 것들이 바로 바로 가능하고요. 챗봇 얘기 많이 합니다. 그래서 너도 나도 챗봇을 많이 구현을 했는데요. 지금 예를 들면 카카오페이, 카카오톡 나오고 나서 카카오에서 은행 만들고 이러면서 은행들이 좀 긴장을 했었어요. 제가 이제 그쪽 비즈니스를 했었기 때문에. 그래서 어떻게 하면 내가 혁신적인 서비스를 내놓을까라는 생각을 계속하게 됐고요. 그러면서 봇 서비스를 통해서 사람을 쓰는 거 자체. 아까 지금 사람 계속 줄고. 일자리가 줄 있다라고 말씀드렸는데 상담원들이 하는 일들은 단순한 그런 질문에 대해서는 얘가 이미 다 답변이 가능한 거죠. 뭘 통해서? 클라우드나 AI를 통해서 그게 가능합니다. 시간이 벌써 이렇게 됩니다. 봇 서비스를 되게 간단하게 됐다라고 보시면 되고요. 아까 제가 말씀드린 마이크로소프트에서는 지속적으로 이런 기술적인 노력들을 계속해 왔고요. 그걸 통해서 애저 기반의 인프라를 전 세계에 지금 현재로는 50개 이상의 나라에 데이터센터를 지원해 준데요. 클라우드 비즈니스를 하기 위해서. 물론 국내에도 있습니다. 그래서 이런 비즈니스를 하고 있고요. 이 인프라 위에 예를 들면 컴퓨팅이라든지 스토리지. 데이터베이스. 아니면 네트워킹 이런 것들을 가능하게 하고 또 그 인프라 위에 다양한 소프트웨어들이 실제로 몇 번 클릭으로 런치할 수 있도록. 클라우드는 서버를 확장하는 게 아니에요. 클라우드는 뭐냐 하면 그냥 소프트웨어회사라고 보시면 돼요. 예를 들면 여러분들 카드 같은 거 플로드디텍션 시스템이라고 하는데 카드 같은 거 한국에서 쓰시다가 몇 분 만에 미국에서 거래가 발생하면 전화옵니다. 전화 받아보신 적 있나요? 전화와요. 왜냐하면 이게 아까 제가 말씀드린 플로드디텍션시스템에 의해서. 얘가 패턴이 이상하다라고 보시면 카드회사에서 전화가 옵니다. 이런 플로드디텍션 시스템이 기존에는 구현하려면 아까도 제가 말씀드렸듯이 서버 사서 사람 사고 그 다음에 알고리즘 구현해서 여러 1년 이상의 시간이 걸렸어요. 지금은 클라우드 기반으로 그냥 서버 하나 클릭해서 내가 원하는 플로드디틱션 시스템 다 구현돼 있다고 보시면 돼요. 클릭하면 바로 만들어진다고 보시면 돼요. 클라우드회사는 여러분들이 쓰시려고 하는 비즈니스에 집중할 수 있는 그런 것들을 소프트웨어 기반으로 다 만들어 놓은 애들이라고 보시면 돼요. 뭐 위에? 이런 인프라 위에. 그게 클라우드예요. 그래서 이런 식으로 일이 진행이 되고 있고요. 또 여기서 이제 거의 시간이 끝나기 때문에 이 작품만 말씀드리고 이제 그만. 뒤에도 작품을 많이 했는데 이 그림을 제가 왜 보여드리냐 하면 기존에 선생님들이 쓰시던 도서관에서 쓰시던 그런 서버들. 그런 것들을 기존에는 어떻게 보시면 이 안에 있는 집들이라고 보시면 돼요, 집들. 그런데 이 집들을 보호하기 위해서는 어떻게 했을까요? 강하게 보호하기 위해서. 그러니까 도둑들이 왜적의 침입을 방어하기 위해서는 어떻게 했을까요? 해자도 파고요. 성벽도 하나 쌓고 그 다음에 이걸로 모자를 것 같으면 해자 파고 그 다음에 여기다 마거도 좀 풀어놓고 그 다음에 성벽 하나 더 쌓고. 이런 식의 보완 메커니즘으로 작동을 했다라고 보시면 돼요. 그러니까 무슨 얘기냐 하면 이 안에 집들이 하나의 컴퓨터라고 보시면 되고요. 이 컴퓨터들을 보호하기 위해서는 예를 들면 다양한 보완 시스템들이 도입이 됐다라고 보시면 돼요. 안전하게 보호하기 위해서. 적들이 해킹. 요즘 기술 많이 나오는데 그런 것들에 관련된 것들이 침투를 못 하기 위해서는 이렇게 이런 메커니즘으로 갔어요. 그런데 아까 제가 뭐라고 말씀드렸어요. 클라우드환경에서는 저 안의 집들이 어떻게 돼요? 필요가 없으면 집들 나 지금 1채만 있으면 돼라고 하면 쫙 없어졌다가 나는 집이 100채 필요해라고 하면 집이 확 100채로 확장해내는 구조예요. 그게 가능하거든요. 그렇다고 하면 예를 보호하기 위해서는 어떻게 해야 할까요? 1대에 맞는. 그러니까 1대 있을 때에는 1대에 맞는 이런 성곽이 있어야 할 거고 예를 들면 100대로 올라가면 이 100대를 보호할 수 있는 이 보호 메커니즘도 확장이 되어야 하겠죠. 이런 식으로 보완에 관련되어서도 클라우드가 좀 완벽하게 구현이 됐기 때문에 유수의 나사. 아니면 미국의 국방부 이런 데에서 다 클라우드를 도입해서 쓰고 있는 거예요. 그래서 보완적으로도 굉장히 효율적이다. 보완이 100% 안전하다 이런 건 없고요. 효율적으로 운영이 되고 있다. 그리고 마이크로소프트가 클라우드를 하고 있다. 그리고 여러분들이 이렇게 다양한 그리고 어드벤스된 기술적인 환경에 사시고 계시니까 나의 비즈니스에 있어서 그리고 여러분들이 하시는 업무에 있어서 효율성. 그리고 내가 어떤 비즈니스에 집중할 건지를 좀 더 고민해 보셔야 한다라는 말로 발표를 마치도록 하겠습니다. 경청해 주셔서 감사합니다.



스마트홈, 스마트시티, 자율주행차에서의 도서관 IoT 서비스

발표: 최운호(한국지능시스템학회 부회장)
동영상에 대한 자막정보
최운호: 도서관 서비스라는 데에서 이입을 시켜서 얘기를 먼저 드리겠습니다. 제가 오늘 보여드릴 부분은 제가 전시회에서 잠깐 봤는데 모든 프로그램들이 전부 다 아이디, 패스워드 차원의 프로그램만 있는데요. 지금 우리가 알다시피 삼성 갤럭시 S9는 우리가 지문, 홍체, 얼굴까지 들어가 있고요. 또 이런 얘기도 많이 합니다. 차에서 페이도 한다. 결제도 얘기도 하고 또 애플은 사물 인터넷을 시리, 우리가 구글의. 헤이, 구글 하면 내 말도 듣고 또 아마존은 알렉사라고 해서 모든 말을 듣습니다. 그런데 오늘 1층 전시회에서는 이런 부분이 다 빠져 있는. 아직은 좀 옛날 프로그램 같은 부분이 많았고요. 오늘 관장님이 얘기하시는 것까지 한꺼번에 얘기하기 위해서 제가 일단 동영상부터 하나 먼저 보여드리겠습니다. 우리가 이런 얘기 많이 듣죠. 택배 기사들이 이렇게 연락을 합니다. 오늘 몇 시에 계시죠. 또 엔지니어들이 이렇게 얘기를 합니다. 오늘 몇 시까지 계시죠. 잠깐만. 그런데 그런 부분들이 참 이렇게 여기서는 택배가 주인이 없어도 들어와서 택배를 배달하고 또 차 트렁크에도 실어줍니다. 그런데 이걸 책이라고 한번 바꾸고 한번 보십시오. 그러니까 부모님 생일을 잊었어요. 그랬더니 이게 지난주에 발표된 건데. 선물을 내 차로 배달해 주세요. 그러면 여기에 계신 분들이 내가 도서관에 요청을 해서 물건을 내가 없는 데 집에도 배달해 주고 차 안에도 넣어주면 어떨까요? 그런데 그걸 제가 스마트폰으로 볼 수 있어요. 그리고 집에 청소 서비스도 보낼 수 있어요, 내가 없는데. 저렇게 책이 배달될 수 있으면 얼마나 좋을까요? 그리고 제가 없어도 문을 열고 들어와서 책을 배달해 주고 갑니다. 물론 제가 볼 수 있어야죠. 그리고 책하고 꽃다발을 같이 배달하면 어떨까요? 네, 스톱. 제가 왜 이 동영상을 가져왔냐 하면 사물 인터넷. 그리고 우리가 지금 가지고 있는가 스마트폰이 다 생체 인증 폰으로 변했는데 우리는 아직도 1층 전시실 보면 다 아이디, 패스워드. 또 최근에 어떤 일이 있었냐 하면 조금 이따 말씀드리겠지만 앞으로 신용카드도 전부 다 지문이 달려올 거예요. 그런데 우리가 도서관 출입증을 생각하면 아직도 RFID나 태그 가지고 들어오는데 진짜 그 사람인지 모르잖아요. 남의 주소 가지고 들어올 수 있고 두 번째 동영상 부탁합니다. 비자 마스터 카드가 만든 새로운 신용카드입니다. 반지인데 반지 안에 지문 센스가 들어가 있어요. 즉 우리가 스마트폰에서 우리가 지문 누르고 우리 로그인하죠? 그런데 그게 반지로 변했다 생각하시는데 그게 신용카드도 되고 출입증도 되고 차키도 되고. 그러니까 만능 스마트키라고 합니다. 우리가 생각할 때 우리가 하고 싶은 모든 일을 저 반지 하나로. 또는 카드 하나로. 우리가 여태까지 알고 있었던 건 스마트폰으로 다 했었거든요. 그래서 새로 도서관의 많은 서비스를 만들려고 할 때 이런 기본 개념을 가지고 계시면 우리가 1층에서 전시했던 많은 프로그램들을 많은 서비스들을 바꿀 수 있습니다. 두 번 치니까 컴퓨터에 들어가죠? 이건 충전기입니다. 스톱, 한 25만 원 합니다. 역시 가격에 예민하십니다. 그러면 하나를 더 보여드릴까요? 보여드릴게요. 영상 세 번째 것 먼저 보여드리죠. 왜냐하면 우리가 생각하던 클라우드, 4차산업혁명, 사물 인터넷은 너무 땅에 안 와 닿았어요. 오늘 제가 땅에 와 닿는 부분을 말씀드리겠습니다. 스톱. 여태까지 생각할 때는 우리가 이렇게 생각했어요. 우리가 스마트폰에 지문이 달린 이후에 그게 세 가지 변화가 더 있었습니다. 최근 나오는 노트북은 전부 다 지문 센서가 붙어 있어요. 그리고 우리가 쓰는 가장 많이 쓰는 OS인 윈도우10이라는 헬로라는 펑션은 앞으로 여기 계신 분들이 지문이나 음성으로 열어라, 참깨를 할 수 있습니다. 그리고 우리가 여태까지 가지고 있던 플라스틱카드가 지문 신용카드로 바뀌었어요. 그래서 마스터카드, 비자카드가 앞으로 여러분이 계시는 여러분이 들고 있는 신용카드를 한 장으로 바꿔드릴 겁니다. 그런데 이게 그러면 신용카드지. 도서관 출입을 하거나 도서관에 오늘 얘기하신 뉴랄 네트워크도 우리 관장님이 얘기하셨는데 그러면 그거 들어갈 때는 계속 아이디, 패스워드로 할 거냐. 첫 번째 동영상. 제가 UN에서 근무할 때 전 세계 UN 공무원증을 다 지문카드로 바꿔놨어요. 그래서 출입증 한 장으로 지문으로 출입도 하고 그리고 그걸로 컴퓨터도 들어갑니다. 이건 기존 출입증을 얘기하는 거고요. 잃어버리면 남이 쓰죠? 요새 도서관 카드나 대학생들 요새 신용카드 겸용으로 해서 도서관 게이트 들어오는 거 얘기하는데 잃어버리면 남이 쓰잖아요. 그런데 희한하네요. 왜 우리은행 로고가 있고 나라 장터는 조달청을 얘기합니다. 이미 우리나라에서 우리은행이 발행을 하고 있고요. 조달청에 들어갈 때 조달 입찰할 때 저걸로 들어가고 있어요. 왜냐하면 기존에 공인인증서나 이런 걸 담합입찰을 했기 때문입니다. 그래서 이 부분이 올해서부터 보급되어서 UN에 20만 명 공무원이 이 카드로 출입증과 컴퓨터 접속을 같이하게 되고요. 잃어버리면 남이 못 쓰겠죠. 그리고 그걸 마이크로소프트 윈도우가 바꿔줬고요. 제가 1층 전시회에서 하나를 보고 좀 지적을 할까 말까 하다 올라왔는데 새로 나온 이번 5월달에 발표된 인터넷 인스플로러 그리고 구글의 크롬이라는 브라우저. 모든 도서관 시스템의 기본 브라우저죠. 거기는 생체 인증으로 들어갈 수 있게 바뀌었어요. 즉 노트북이 바뀌었고 스마트폰이 바뀌었고 브라우저가 바뀌었고 OS가 바뀌었어요. 그러면 1층에 있는 지금 만들어서 구현해 놓은 시스템들은 다 이걸로 앞으로 바뀌어야 할 겁니다. UN 지문카드는 두 가지인데 하나는 공무원 출입증을 올해서부터 바꿨고요. 두 번째는 전 세계에 있는 UN 난민들이 식량 타는 데 옥수수 타는 데 2시간, 비누 타는 데 2시간, 식용유 타는 데 2시간이었던 걸 앞으로 이 카드 하나로 신분증도 되고 화폐도 되고 신용카드도 되는 그 사업을 제가 2012년부터 4년 동안 UN에서 근무하면서 만들어놨습니다. 그래서 오늘 잠깐 보여드리는데 모든 도서관은 저런 게이트가 있는데 저런 카드를 가지면 지금껏 교체 없이 다 시스템에 적용할 수 있습니다. 잃어버리면 당연히 남이 못 쓰겠죠. 컴퓨터에 들어갈 때는 저는 IC카드, USB 타입으로 그냥 끼우면 들어갑니다. 스톱. 파워포인트로 돌아가주시겠어요. 그러면 오늘 제가 왜 이런 얘기를 드리냐 하면 기존 도서관 환경이 이렇게 외부에서는 싹 바뀌었는데 제가 1층 전시 이렇게 쳐다보다가 저희 도서관 출입증도 있고 반납도 있고 무인투입기도 있고 대차 서비스도 있고 다 있는데 최근에 미국 월마트는 아까 아마존이 그렇게 집에 배달하는 서비스. 이거 2주밖에 안 된 얘기입니다. 저런 서비스를 37개 도시에서 시작했더니 미국 월마트는 이런 걸 했어요. 여기 주부들이 많이 계시는데 집에 들어가서 냉동, 냉장을 구별해서 넣어줍니다. 네, 원리는 간단해요. 제가 뒷부분에서 말씀드릴 때 여기 인터넷뱅킹을 해 보신 분 손 들어보세요. 제가 만들었어요. 청중객: 오~ 박수 한번 치시죠. 최운호: 그런데 지금 불편했던 건 액티브엑스지. 실제 우리가 생각하는 공인인증서는 세계에서 최고로 좋은 겁니다. 오늘 보시는 이 화면에 갤럭시 S9, 카투페이 그리고 애플의 사물인터넷에 다 공통적으로 쓰이고 있어요. 그리고 사물인터넷에 제4차산업혁명하면서 이걸 잊어버리면 안 돼요. 그런데 제가 그러면 저거 정말 어떻게 믿을까 이렇게 생각하실 겁니다. 여기 안드로이드폰 가지고 계신 분 한번 손을 한번 흔들어보세요. 카메라를 들어보세요. 아니, 스마트폰을 들어보세요. 이 자리에서 증명을 할게요. 스마트폰을 열겠습니다. 그리고 환경설정을 들어가 주세요. 그러면 잠금 보안 설정이라는 데를 들어가 보세요. 그러면 잠금 보안 설정을 열면 이렇게 나왔죠. 대부분이 지문. 지문 또는 지문 홍체. 또는 지문 삼성패스 이런 게 나오죠? 생체인식이 이미 몇 개가 들어가 있어요. 그렇죠? 그런데 쭉 내리셔서 기타 보안 설정을 한번 들어가 보세요. 그러면 기타 보안 설정을 터치해 보세요. 그러면 화면 이 바뀌죠? 거기서 한 10cm만 위로 올려주시면 밑에 인증서라는 메뉴가 나옵니다. 거기서 인증서 확인이라는 메뉴를 눌러보세요. 거기에 몇 백 개의 인증서가 깔려 있어요. 우리는 인증서를 버린 게 아니라 4차산업혁명의 모든 데에 인증서가 들어가 있어요. 그러면 지금 말씀드린 지문 홍체와 인증서를 결합이죠. 그렇죠? 우리가 모르는 사이에 삼성도 모든 안드로이드폰에 다 인증서가 들어가 있고 애플도 똑같습니다. 그러면 여기서부터 존재하면 얘기가 좀 쉬워집니다. 아까 이렇게 집에 배달을 했죠. 그런데 사물 인터넷이 어떻게 연결돼 있냐 하면 내 집에 도어록이 연결이 돼 있었고 그걸로 내 스마트폰에 중계를 해 줬어요. 선생님, 저기 책임연구원께서 이것 좀 한 장 반으로 찢어주겠어요? 책임연구원: 반으로 찢어요? 최운호: 네. 뭐 이렇게. 이게 이공계 사람이 이렇게 줘요. 본래는 이제 막 찢으라는 얘기였는데 이게 옛날 동화를 보면 우리가 이런 게 있잖아요. 동전을 반으로 쪼개서 목걸이를 하나씩 해 주고 너희가 나중에 만나면 형제인 줄 알아라. 우리가 개인 인터넷뱅킹 쓰는 건 이렇게 두 가지 키로 구성돼 있어요. 하나는 제가 가지는 개인 키, 여러분 PC에 있습니다. 하나는 공개 키라는 게 지금 은행에 가 있기 때문에 우리가 나중에 이걸 맞춰봐서 너무 정직하게 잘랐잖아. 본래는 이렇게 막 찢어야 해, 이렇게. 어? 또 이렇게 찢어졌네? 어쨌든 하나는 개인 키고 하나는 공개 키여서 우리가 인터넷뱅킹을 하는 거거든요. 그런데 우리 스마트폰에 우리 지금 보시는 그 인증서는 뭐냐 하면 나한테는 개인 키가 있는 거고 공개 키가 삼성에 있기 때문에 우리가 삼성페이를 할 수 있는 거고 여기도 똑같아요. 아마존에 내가 주문을 한 사람 나는 개인 키를 가지고 있으니까 아까 배달한 걸 들여다봤잖아요. 이 공개 키를 하나는 배달하는 배달 기사한테 보내고 하나는 스마트도어록에 보내고 하나는 냉장고에 보내고 하나는 카메라로 보내니까 순차적으로 되는 거예요. 저 배달 기사가 집에 와서 뭘 했어요? 문을 여는데 내가 배달 기사임이 맞는 걸 증명을 어떻게 했냐 하면 스마트폰을 도어록에 댔어요. 그러면 도어록이 아, 주인이 보낸 기사가 맞구나. 도어록 열어줬죠. 도어록이 연결되면서 우리가 사물인터넷은 연결돼 있다고 배웠잖아요. 그러면 이건 연결돼 있으니까 카메라가 바로 오픈해서 주인한테 화면을 보내는 겁니다. 그러면 아까 배달이 이해가 되시죠. 그런데 그렇다면 여기서 책으로 바꿔볼까요? 누군가 제가 도서배달 서비스를 신청했어요. 그랬다가 그걸 집에 사서 저런 딜리버리 또는 배달 업체가 문 앞에 와서 누르면 도어록이 열어지고 필요하다면 내 서재에 꽂아 달라, 어디 해 달라도 되겠죠. 그런데 전자파일을 가져왔어요. 그런데 미안한데 TV 위에 올려줄래? 내가 집에 가면 바로 화면에서 보고 싶어. 또는 스크린워리라고 이 벽에다 좀 해 줘. 또는 우리 애한테 좀 스피커로 읽어줘. 우리 애는 전래동화를 좋아하는데 그 도서관에 올 때 맨날 엄마가 읽어줄 수 없거든요. 그 서비스가 모두 가능한 게 지금의 메커니즘으로 가능합니다. 제가 맨 처음에 이 파일을 보냈더니 국회에서 뭐라고 얘기를 하냐 하면 아, 우리는 도서관 관련 서비스만 얘기해 주세요. 그런데 사물인터넷도 모르고 스마트폰도 모르면 제가 어떻게 설명을 하겠어요. 그렇죠? 그런데 여기에 보시면 저 스마트폰으로 뭔가 누르죠. 차는 요새 콘넥티드 카라고 합니다. 연결이 돼 있죠. 제가 미리 공개 키 하나를 기사한테 보냈고 차량 관리업체한테 얘기해서 우리가 똑같은 키를 보냈더니 이 기사가 맞구나. 그런데 거기에는 함정이 하나 있어요. 내가 승인한 걸 알려면 우리가 인터넷뱅킹 할 때 제일 문제가 됐던 게 해킹 당했다 이런 얘기 있잖아요. 그런데 이 키에는 개인 키에는 뭐가 있냐 하면 내 지문 1, 엄지, 검지, 홍채가 들어 있어야 내가 주인임이 맞고 주인이 발행한 공개 키가 배달한 사람한테도 가야 하고 차 키에도 가야 하고 도어록에도 가야겠죠. 그래서 요즘 이런 얘기 참 많이 합니다. 헤이, 구글, 아마존, 알렉사. 네이버 또는 여러분들이 많이 듣고 계시는 지니. 그렇죠? 그런데 제가 지니를 집에 설치했어요. 집에 설치했더니 저희 막냇동생 여동생이 오더니 어, 오빠 이거 했네? 그러고서 쫙 살펴봐요. 스캔하면 뭘 해요? 자기 가져갈 거 없나. 집에 와서 옷걸이라도 하나 가져가야 하잖아요. 그런데 제 동생이 오빠, 이거 사용할 줄 모르지? 지니, TV 틀어줘. 이러더라고요. 그런데 왜 제 여동생 말을 들어야 해요. 말도 안 되잖아요. 그래서 우리가 집에서 도서관에서 생각할 때는 집과 도서관이 조금 틀리다 생각할 텐데 도서관에 설치돼 있는 사물인터넷이 도서관 직원 말만 들어야 할까요. 아무나 말을 들어도 될까요. 청중객: 주인 말. 최운호: 그렇죠. 그러면 적어도 명령한 사람의 코드가 들어가 있어야 들을 거 아니에요. 이렇게 보면 그런데 우리나라 사물인터넷은 이렇게 해요. 한 6가지 빌려주고 한 달에 1만 4천 원. 그런데 연결만 해 주고 그냥 나가요. 등록을 안 했잖아요. 그렇죠? 그래서 모든 건 사물인터넷은 나한테 등록이 되어야 콘넥티드 카가 되어야 뭐가 되어야 말을 듣겠죠. 자, 그러면 이 뒷부분에 제가 파워포인트를 왜 이렇게 만들었는지 좀 이상하실 거예요. 제가 하도 제 발표 자료 카피를 매우 당해서 제 얘기 안 들으면 절대로 상상할 수 없게 만들어놨어요. 두 번째는 조금 전에 말씀드린 거하고 똑같아요. 최근에 한 지난주인가요? 헤이, 구글 하고 나서 사람이 오늘 관장님도 그 얘기를 많이 하셨는데 자연어처리가 어떻고 인공지능이 어떻고 다 얘기를 해서 이렇게 얘기했어요. 미장원 예약하는 걸 다 앞에서 했어요. 그런데 그 목소리가 내가 주인으로서 야, 미장원에 예약해 줘 하면 스피커가 내 말만 들어야 할 거 아니에요. 그럼 보통 가족은 한 6명이거든요. 6명이 개인 키, 공개 키를 몇 개 가지고 있어요? 이게 항상 쌍으로 다니니까 그리고 제가 스피커에 제 걸 설치해도 6명의 가족에 개인 키 공개 키가 있어야 하고 또 스피커에도 집에 말을 듣는 TV, 냉장고 뭐가 키를 가지고 있어야 하잖아요. 아까 보여드렸죠. 몇 백 개가 있잖아요. 이미 스마트폰에 다 들어와 있어요. 그런데 우리는 꼭 공인인증서 폐지하면 이제 우리 안 쓰나. 이렇게 생각하는 사람들이 많습니다. 그래서 스피커 얘기는 우리나라 여기 1, 2, 3, 4번 혹시 제품 알 수 있는 사람 혹시 있어요? 우리나라는 스마트 아파트를 지금 몇 십 만호를 지어요. 저런 스피커가 들어가는데 등록 개념이 없어요. 그 나머지는 상상에 맡기겠습니다. 그래서 제가 이런 얘기를 해요. 저쪽에서 우리 티머니 택시, 카카오택시를 부르면 이렇게 물어봅니다, 우리가. 제가 부른 차 맞아요? 내지는 번호, 기사 얼굴 좀 다른가 이렇게 쳐다보는데 자율주행차래요. 그러면 기사가 없는데 누구한테 물어봐요. 그렇죠? 그러면 여기 개인 키, 공개 키 이게 죄송합니다. 이게 개인 키고 영어로는 프라이빗 키, 퍼블릭 키라고 하는데 얘가 공개 키예요. 그러면 내가 부른지 증명해야 차도 올 거 아니에요. 그렇죠? 우리 폭탄테러 얘기하면 어깨로 폭탄 두르고 돌진하잖아요. 자율주행차에 폭탄이 오는지 내가 부른 차가 맞는지. 그렇죠? 내가 이런 것도 시킬 수 있겠죠. A도서관 가서 책 5권 빌려오고 현재까지는 쇼핑만 얘기하고 있었거든요. 그렇죠? B도서관 가서는 애가 좋아하는 전래동화 30권 빌려오고 우리 집에까지 꼭 올 것. 오다가 딸내미가 저쪽 앞에서 여의도에서 타는 걸 데리고 올 걸. 다 가능한 얘기예요. 그렇다면 또 이런 것도 있죠. 카풀 A, B, C가 있는데 공유차라고 그래요. 카풀 A, B, C가 진짜 카풀 A, B, C인 걸 어떻게 증명할까요? 그 사람들도 똑같이 뭔가 컨펌을 받은 공개 키가 있어야 차에다 대고 문 열고 들어올 거 아니에요. 그런데 나는 정말 고양이하고 사는 누구는 싫어. 동물을 들고 안고 타는 사람하고 제외죠. 그것도 옵션이 있어야 할 거 아닙니까? 그거 아세요? 카카오택시 기사들이 하루에 한 번 딱 쓸 수 있는 쿠폰이 있어요. 자기가 집에 가고 싶을 때 집에 가는 방향에 지역을 미리 설정해 놓으면 그 당시에 최고의 우선순위를 두어서 제일 먼저 손님 배정해 줘요. 하루에 한 번 쓸 수 있어요. 드론이 있어요. 혹시 드론을 만져보신 분. 조종해 보신 분. 드론은 리모컨이나 핸드폰으로 돼요. 그런데 생채인식없어요. 어떻게 우리 손영성 책임이 주인인 줄 알아요? 만지는 사람이 주인이죠. 저기 드론의 박스에 생일케이크 같아 보이지만 책을 몇 권 배달해라라고 했어요. 폭탄 들었는지 안 들었는지 어떻게 구별할래요. 우리나라는 아파트예요. 어디다 배달할까요? 경비실 위에 옥상에다 배달할까요? 그 루프탑 있잖아요, 맨 위에. 그러면 피자예요. 이게 동영상이 달려 있는데 제가 앞에 시간을 낭비해서 이건 말로만 하겠습니다. 피자와 책을 빌려와라라고 명령하면 가져올 거예요. 폭탄이 들어있는지 안 들어있는지 다른 집에 갈 게 우리 집에 왔는지 아니면 내가 우리 도서마다 조그마한 태그시 하나씩 했기 때문에 내가 주문한 책 30권이 맞는지 그것도 차가 구별을 해 줘야겠죠. 야, 너 잘못 실었어. 알리바바가 셀퍼북숍을 했어요. 요새 아까 송희경 의원님께서 이런 얘기를 했어요. 없어지는 직업도 많지만 생겨나는 직업도 많을 거다. 그래서 제가 오늘 얘기해 드리는 부분은 실제 땅에 와 닿는 사물인터넷, 클라우드, 4차산업혁명을 얘기하려고 그래요. 그래서 무인숍이 생겼다는 건 어, 그러면 우리 직업은 없어지는가? 이렇게 생각할 수도 있지만 저기 무인숍이 우리가 대차 서비스를 하는 것의 무인숍일 수도 있거든요. 아까 밑에 반납기 봤는데 제가 가서 슬쩍 물어봤어요. 다른 도서관 것도 받아요? 물어봤어요. 그렇죠, 안 되죠. 그러니까 오늘 말씀드린 그 모든 것들이 피지컬하게 북이라는 형태로 돼 있는 거하고 디지털화돼 있는 거하고 등등을 구별할 수도 있어요. 그래서 뒷부분에 관장님한테 질문하려고 하다가 안 했던 부분은 조금 이따 하겠습니다. 그래서 혹시 아까 안드로이드만 물어봐서 애플폰에 이런 게 돼 있어요. 홈이라고 돼 있는데 물론 애플폰도 인증서 있어요. 그런데 몇 백 개나 있어요. 그런데 여기 보시면 제가 맨 처음에 사물인터넷을 사오면 스피커를 사오든 TV을 사오든 냉장고를 사오든 박스에 들어가 있을 거 아니에요. 그러면 내가 이미 지문으로 들어갔어요. 저 메뉴로 들어가려면 그러면 생체정보 플러스 아까 얘기한 이 인증서가 들어갔잖아요. 그 다음에 새로운 걸 등록하려니까 눌러요. 그러면 QR코드가. 내가 미리 약속한 제품인 걸 하면 나한테. 그래서 이걸 또 한 장씩 나눠가져요. 그런데 혹시 QR코드가 망가져 있을 수도 있잖아요. 그러면 미리 약속한 코드 8개 맨 마지막을 눌러서 입력하게 돼 있어요. 나한테 등록된 책. 그런데 여기에 왜 이런 얘기를 드냐 하면 우리가 책이나 디지털책이나 파일도 저렇게 등록할 수 있지 않을까요? 왜냐하면 그 키는 이 키밖에 안 되거든요. 그래서 우리나라 스마트폰이나 외국에서 새로운 서비스 나오면 이런 얘기해 주는 사람이 없어요. 우리나라는 뭐만 비교하냐 하면 메모리가 얼마다. 컬러가 뭐다. 거기에 하드웨어가 어떻게 변했다만 얘기해 줘요. 그런데 애플은 이미 이걸 사물인터넷에 애플7에서부터 했어요. 그런데 우리가 보는 헤이, 구글. 어제 발표한 거 등등 이런 건 전부 그 뒤에 사물인터넷을 개인 키, 공개 키 이렇게 인증서로 다 활용하면 됩니다. 그래서 우리나라 키사랑기관인데 거기서 했어요, 이미. 야, 지문이든 홍채든 간에 지문이라는 걸 이렇게 암호화하면 굉장히 사이즈가 커요. 그런데 3평짜리 집에 못 들어가거든요. 왜냐하면 지문 자체가 2층짜리 집이기 때문에 사이즈가 너무 큽니다. 그래서 코드로 넣을 수밖에 없어요. 아까 제가 여기 이렇게 찢었는데 여기에 엄지 이렇게 들어가는 건 조그마한 코드가 들어가는 거고 홍체도 조그마한 코드가 들어가는 거예요. 그래야지 이게 이동이 왔다 갔다 할 수 있겠죠. 그래서 그 코드값을 하려면 얘는 2번은 지문이다, 3번은 얼굴이다 이렇게 다 지정을 해 준 거고요. 그래서 그게 이렇게 됩니다. 우리가 최근 나온 100개의 노트북이 다 지문을 달았어요. 그래서 도서관도 이제 지문으로 접속을 하는 부분을 오픈해 주셔야 할 것 같고 맥북에 보면 이렇게 저 자리에 지문이 있는데 지문 5개를 등록할 수 있어요. 여기 계신 안드로이드폰이나 애플폰을 가지신 분들은 전부 다 지문을 5개까지 등록할 수 있는데 1개만 쓰는 거예요. 보통 2개도 쓰기는 하지만 애플페이까지 연결이 됩니다. 진행자가 자꾸 눈치 줘서 빨리 가겠습니다. 그래서 우리가 생각할 때 여기 이번에 갤럭시9이 뭐 했냐 하면 이렇게 얼굴하고 홍채를 두 개를 했어요. 그러니까 우리가 이미 스마트폰에 4개까지 들어가 있으니까 여태까지 이제 아이디, 패스워드만 생각하던 방식을 이제 지문1, 2를 하셔도 되고 지문, 홍채를 하셔고 되고 뭔가를 하셔도 됩니다. 그래서 아까 말씀드렸다시피 개인 키, 공개 키로 해야 하는데 저렇게 키가 여러 개예요. 즉 여러 가지 용도로 도서관에서 생각했던 많은 서비스를 만들 수 있다는 겁니다. 우리가 얘기할 때 Car to pay라고 그래요. 차에서 집에 전화해서 냉장고에 미리 피자를 배달해서 넣어줘, 어쩌고 이런 동화 속 얘기가 신문기사에 많이 나오는데 그 안에는 저렇게 PK가 들어있어서 가능한 겁니다. 그래서 최근 가상화폐를 해 보신 분이 있는지 모르겠지만 가상화폐까지 전반적으로 가상화폐, 블록체인, 생체인증 지금 얘기한 모든 서비스들은 전부 다 생체인증 플러스 인증서라는 그 공식으로 돼 있습니다. 제일 착한 학생이에요. 고개를 끄덕거려요. 자, 그러면 제가 이렇게 얘기해 드릴게요. 앞으로 모든 서비스들은 이런 걸 겁니다. 기계 하나를 내가 소닉 것만 쓰다가 삼성 거를 붙였더니 잘못됐다 그러면 복구할 수 있어야 하잖아요. 아니면 우리가 Ctrl+Alt+Delete를 눌러서 집안의 모든 시스템을 초기화할 수도 있어야 하겠죠. 복합 인증도 가능하고요. 보통 이 강의 3시간짜리인데 저보고 30분에 하라고. 그리고 또 하나는 이럽니다. 자, 지진이 났어요. 지진일 때 도서관 서비스를 정상적으로 하려면. 그렇죠? 아까 말씀드린 것 중에 지진일 때만 쓰는 정전일 때만 쓰는 키를 하나 더 만들어두면 아주 간단합니다. 지진일 때도 학생들이 들어와서 책 봐도 되고 기존의 서비스 다 사용할 수 있어요. 그렇죠? 우리는 모르는데 많은 나라들이 이런 거 하고 있어요. 카드 한 장에 전자주민증, 운전면허증, 의료보험증, 펜션, 연금 어쩌고저쩌고 플러스 신용카드까지. 그래서 오늘 지금 말씀드린 게 전부 다 이 공식으로 되고 있습니다. 우리가 얘기한 조금 전에 말씀드린 전자주민증, 운전면허증 전부가 하나로 되고 있고 출입증도 되고 PC 로그인도 되고 스마트폰도 되고 그런데 그 모든 공식이 생체인증 플러스 아까 얘기해 드린 인증서. 여기서는 PKI라고 돼 있는데요. 그 패러다임으로도 돼 있습니다. 그래서 제가 오늘 말씀드리는 부분은 도서관에서 생각하는 모든 서비스들이 완전히 패러다임이 다 바뀌었다. 그렇다면 새로 생각하는 서비스는 좀 더 바뀌어야 한다라는 부분이고 아까 관장님이 얘기하실 때 저는 민간기업에 있는 사람으로서 하나 얘기하는 건 학술정보 플러스 특허 서비스를 해야 합니다. 요즘 기업들은 논문 절대로 안 씁니다. 뭘 쓰냐 하면 특허부터 먼저 써요. 논문 발표하고 특허 쓰면 특허가 거절됩니다. 기업들이 요즘 제일 망하는 게 뭐냐 하면 보도자료 먼저 내고 이런 서비스를 하겠다고 하고서 특허 쓰면 너 신문기사 미리 냈잖아. 그래서 제가 오늘 관장님 여기 오시라고 이렇게 초대를 했고 그 다음에 제가 말씀드리는 부분은 앞으로 도서관의 서비스가 학술정보만 해서는 안 되는데 특히 특허 서비스를 같이 해줘야 특허가 미리 기업들이 몇 년 뒤에 할 서비스를 미리 내놓은 거기 때문에 플러스 학술정보가 추가되어야 그런데 거기에서 아까 저보고 개인 정보를 얘기하시라고 해서 한 가지만 더 드리면 자기가 검색한 서비스가 왜 결과가 보존이 안 되죠? 좀 시리즈로 내가 검색할 때마다 조금 있으면 좋겠는데 3년치가 있으면 좋겠는데 그러면 거기에서 제가 검색한 걸 남이 알면 안 되겠다. 폐쇄. 이건 나만 보겠다. 일부 오픈. 왜냐하면 이 정도 정보는 남하고 공개하겠다. 오픈. 내 검색 결과를 남이 봐도 좋겠다. 그러면 도서관에서 얘기하는 학술정보 쪽에서 얘기하는 새로운 서비스 플러스 프라이버시 보호까지 됩니다. 오늘 말씀드린 생체 정보와 인증서, 영어로는 PKI라고 하는데 이 부분을 잘 기억하시면 좋겠습니다. 고맙습니다.



사물인터넷(IoT) 기반 지능정보 기술동향

발표: 손영성(한국전자통신연구원 책임연구원, 한국정보과학회 사물인터넷연구회 회장)
동영상에 대한 자막정보
손영성: IoT 개요는 제가 따로 말씀 안 드려도 될 것 같아요. 왜냐하면 IoT라고 얘기한 건 5년 정도로 계속 얘기를 드렸고요. 조금 전에 아까 스마트폰을 다 들고 인터넷 뱅킹 하셨다고 하면서 사물인터넷의 그 사물이라는 것을 다 하나씩 갖고 계시고 적어도 한 개씩, 1인당 한 개씩, 스마트폰, 그 다음에 자동차도 있고요. 집에 IPTV도 있고 여기 나온 것처럼 로봇 같은 것들도 나오게 될 겁니다. 그래서 이제 우리가 실제 느끼고 있는 사물인터넷 서비스의 세상으로 가고 있는데 근데 느끼기에는 내가 뭔가 누리고 있지 않은 것 같은 느낌이 들잖아요. 그래서 약간 온도차가 있는 것 같아요. 그래서 기술적으로는 오늘 여기가 제일 작은 것처럼 기술적으로 약간 이상이 떨어지는 듯한 느낌 받고 인공지능, 이쪽이 더 뜨잖아요. 조금 그런데 실제로 그 인공지능과 사물이 연계되어서 진행되고 있다. 그리고 약간의 오늘 제가 몇 가지 보여드릴 건데 로봇이 다시 나올 겁니다. 로봇, 로봇의 PKI가 되게 중요할 것 같고요. 그래서 사물인터넷에 사물들 연결시키는 건데요. 지금 저희가 가지고 있는 모든 장비들은 다 연결돼있는 겁니다. 지금 스마트폰 연결돼있고요. 계속 연결돼있고 조금 전에 보고 있던 시계 같은 것들도 연결돼있고요. 이게 아까 반지형태로 될 수도 있겠죠. 그런 것들이 다 연결되어 있는 상태인 것이고요. 그런 것으로 연결해서 잘 안 보이는데 연결해서 저희가 얻을 수 있는 모든 서비스가 다 IoT서비스라고 할 수 있는 겁니다. 그런 장치들 다 연결해서. 그런데 이제 아직까지 안 와 닿죠. 그 안와 닿는 것들을 저희 보면 이것, 이게 작년부터 광고를 많이 했던 거예요. 귀뚜라미보일러 경동나비엔인가, 이런 것들. 그 다음에 이런 장비들이 있는데요. 이게 이제 아주 원시적 형태로 연결만 시켜주는 장비예요. 그래서 사가지고 집에 설치해서 연결시켜 주고 나면 내가 필요할 때 언제든지 볼 수 있다. 그런데 별로 스마트하진 않아요, 솔직히. 왜냐하면 모든 기능을 사람이 일일이 다 제어해야 되기 때문에. 그리고 PKI가 안 들어가 있어요. 되게 위험할 수 있거든요. 그리고 또 최근에 이런 딸기농사 같은 경우에는 비닐하우스에 설치를 해서 그것을 농부들이 편하게 이 딸기를 최적의 딸기를 만드는 것들을 지금 하고 있습니다. 이미. 여기 계신 분들은 농사를 짓지 않으실 테니까 이게 별로 안와 닿을 수도 있는데 여기 이 사업을 하는 분들, 농사를 짓는 분들 입장에서는 이것을 하나놓고 밤에 마음 놓고 잘 수 있는 거예요. 겨울에 예를 들어서 한파가 와서 눈이 왔다. 그런데 그전 같으면 눈 오고 무너진 다음에 아는 거죠. 가면 이미 농사는 끝났어요. 그런데 이제 이 장치를 설치해 놓으면 밤에 자고 있는데 막 울리는 거예요. 지금 추워졌다, 빨리 가서 비가 많이 왔다, 빨리 조치를 하라. 그러면 버튼만 딱 누르면 조치가 돼요. 그 정도로 편의가 됐는데 아직도 안와 닿죠. 그 다음에 공장 쪽에는 많은 부분들이 자동화되고 있고 그런 것들도 IoT라고 할 수 있습니다. 이렇게 있고요. 그런데 문제가 이런 수많은 장비들이 나오고 수 많은 서비스들이 있는데 별로 안와 닿아요. 왜냐하면 개별, 개별, 개별로는 의미가 있는데요. 전체로 봤을 때는 이게 연결이 잘 안 돼요. 현재가 그런 문제가 있고요. 연결되는 것들을 만들어 내는 것들이 지금 필요한 시점입니다. 그래서 그런 기술들 때문에 변화가 있는데요. 예를 들어서 아시죠, 이분은. 손정의 회장님인데 이분 같은 경우에는 이런 IoT 산업을 변화시키기 위해서 소프트뱅크라는 회사의 사장님이시잖아요. 여기서 이 회사가 뭐냐 하면 스마트폰이나 IoT 장치에 들어가는 Chipset을 만드는 회사인데요. 이 회사를 엄청난 돈을 주고 이 회사를 인수를 했어요. 왜냐하면 이 사장님이 볼 때 IoT가 세상을 바꿀 것인데 세상이 너무 더디게 가는 거예요. 왜냐하면 저 Chipset이 좋은 Chipset 안 나와요. 투자를 안 해, 이 회사가. 그래서 자기가 그냥 사버렸어요, 이 회사를. 사가지고 아까 PKI 이런 기능들을 담을 수 있는 좋은 칩을 만들어 내겠다고 이 회사를 인수를 해서 지금 여기 2년 전 얘기인데요. 지금 올해는 그런 제품들이 막 나와요. Chipset. 그리고 이런 지금 스마트워치 같은 것 쓰시는 분들 있으실 텐데요. 스마트워치를 통해서 건강이라든지, 평소에 생활도 할 수 있는 것들도 나오고 있고요. 이런 것들 나오고 있죠. 문제는 이런 앞에 있었던 웨어러블 장비나 내지는 이런 것들이 그리고 스마트팜, 이런 류의 사업들을 하는데 로봇이 할 수 있다는 사람들이 생각을 잘 못해요. 그런데 이제 이런 게 실험용이거든요. 이렇게 이것은 아직 조그마한 테스터로 만들고 있는데 이런, 이런 기술들을 만들어 가지고 IoT기술과 로봇이 접목이 되어서 이런 것들이 만들어져요. 정말 타깃해서 거기만 물을 주거나 아니면 약을 치는 그렇게 할 수 있고요. 그 다음에 지나고 나면 씨를 딱 크기에 맞춰서 그 다음에 다 생산이 되고 나면 그것을 옮기는 것까지 딸 수 있다는 것을, 뭐냐 하면 손으로 하면 딸 수도 있다는 것을 확인해서 그렇고요. 이런 류의 예를 들어서 지금 같은 경우에는 수경 재배하는 거고요. 일본에서 많이 하고 있어요. 국내에도 조금 있기는 한데 일본에서 많이 해서 일본에서 도시에서 생산해서 바로 가는 로컬푸드 음식으로 진행하고 있습니다. 이런 것이 있습니다. 이렇게 있고요. 이것의 끝판왕은 이것이죠. 완전 무인점포로 가는, 무인점포로 가면 Amazon Go 가서 얘가 들고 나가면 결재가 되는, 이런 서비스가 있고요. 이렇게 물건을 집는 행위를 카메라를 통해서 인식을 하는 거죠. 우리가 도서관 같은 경우도 NFC 아니면 물건 같은 경우는 바코드 같은 것을 많이 하는데 그것을 가져가서 문 앞에서 딱 찍고 다시 나가든지 이렇게 해야 되잖아요. 그렇죠. 그런데 이렇게 되면 그 어떤 물건을, 어떤 도서를 내가 픽 했는지를 인식을 하는 형태로 가게끔 조금 더 자연스럽고 어떤 확장성이 더 있다고 볼 수 있는 거죠. 그래서 여기에 위에 기본적인 센서는 있긴 한데 그 센서 안에 말고 카메라들도 있어요. 카메라를 통해서 찾아내는데 약간 문제가 있는 게 동시에 여섯 명이 하면 카메라가 헷갈리기도 한데요. 이게 현실적으로 조금 더 좋은 카메라, 좋은 더 좋은 IoT chipset를 쓰면 해결되거든요. 그런데 이런 게 아까 PKI까지 연결되면 더 완벽한 기술이 되지 않을까. 지금 이렇게 막 던지고 이쪽으로 갖고 오면 저쪽으로까지 다 알아요. 걱정 안 하셔도 돼요. 혹시나 내가 이것을 안 가져갔는데 나는 가져갔다할 수 있지 않을까 했는데 여기 가서 지금 시애틀에 매장이 있어요. 가서 마술사들이 가서 장난을 했는데 대부분 아주 특별한, 그래서 이런 기술을 하면 예를 들어서 우리가 도서관에 가서 이렇다 치면 도서관이 계속 디자인이 바뀌거나 위치도 바뀔 수 있겠죠. 그 다음에 레이어드 하시잖아요. 바꾸는 것을 할 때 시스템을 다 갈아 엎는 게 아니라 카메라 위치만 잘 조절되면 다 해결되는 거예요. 그런 것들이 있고요. 그래서 제가 이렇게 재밌는 사례들과 함께 몇 가지 이슈들을 말씀을 드리면서 했는데 지금 IoT들을 보면 아까 PKI, 제가 말씀 안 드린 것은 그쪽 기술 저는 잘 안 될 거라 생각했는데 아까 앞서서 잘돼서 오히려 안 된다고 하려고 했는데 일단 안 되는 걸로 저는 하겠습니다. 그래서 지금 이제 우리가 어디쯤에 있냐면 지금 한 5년 이상 IoT 얘기를 했어요. 그래서 우리 생각에는 IoT 5년 정도 얘기하면 잘 될 거 아니야? 이렇게 생각하는데 실제로는 그게 아니고 이제 가능성들은 거의 됐고 실제로 우리가 누릴 수 있는 서비스가 될 시점이다. 그런데 그 시점을 넘어가는 게 여기인데요. 여기에 카메라의 아까 인공지능기술하고 그 다음에 로봇이 들어가야 정말 우리가 느낄 수 있는, 그게 아니라 지금 물건 하나 살 때 들고 나가면 찍고 폰을 들어서 막 버튼을 누르고 이렇게 하는 것은 더 불편해요. 그렇지 않아요? 그냥 집에 가서 하면 되지 눌러가지고 좀 그렇잖아요. 이것을 지나고 나면 확 올라갈 텐데 이때가 남아있는 거죠. 지금 올해가 2018년이니까 오늘 하반기 연구부터 2020년까지 있지 않을까. 그리고 스마트시티, 이런 얘기 나오니까 그런 것들이 우리한테 오지 않을까 싶고요. 그리고 이런 류의 아까 예제를 몇 개 보여드렸는데 집에서 채소를 키워먹자, 이런 제품도 있거든요. 그래서 IoT 작품들이 지금 재밌는 작품들이 많이 나오지만 사실 대부분 사용하기가 그래요. 그래서 지금은 제가 저는 유료 메타테스트화의 시대, 정말 내 돈을 들여서 IoT 기술을 투자를 하는 거죠. 그런 식으로 약간 기술을 잘 모르거나 하는 분들은 조금 이따가 사셔야 되지 않을까. 제가 이렇게 얘기해 드리면 이상하긴 한데 삼성전자의 관계자 계신 분 없으시죠, 여기에. 삼성전자 냉장고가 있는데요. 냉장고가 750만원이에요. 기능이 이안에 뭐가 들어있고 그것으로 음식을 뭘 할 수 있다 하는데 제가 볼 때는 750만원이면 그냥 요리사를 한 번씩 불러가지고 지금은 그런 데 조금 더 시간이 지나서 로봇요리사가 나와서 진짜 요리를 해준다. 냉장고를 부탁해, 그게 자동으로 집에서 된다 그러면 750만원 괜찮은데 지금은 아니지 않나. 그래서 제가 기술연구를 하고 있지만 아직도 약간 조금 미성숙한 면이 일부분 있습니다. 특히 PKI 있다고 하려고 했었는데 그런 것이 있다. 연결을 시켜야 되고요. 그 다음에 시장들이 있긴 한데 아주 미미한 상태이고 지금은 약간의 얼리어답터 성향에 계신 분들은 내가 우리 집에 이런 것도 있거든. 그것 아닌 이상은 조금 그렇고요. 그 다음에 이렇게 재밌는 서비스들이 나오고 있지만 여기에서 뭔가 편리한 뭔가가 더 들어가야 되는 거에 대표적인 게 아까 카트가 따라오는 로봇이 아닐까 하는 생각이 들고 그 다음에 인공지능들하고 접목하는 게 나오면 조금 편리하지 않을까. 그런 생각을 하면서 마치겠습니다. 질문하십시오. 최운호: 조금 전에 얘기하신 부분의 일부는 맞고 일부는 틀린 얘기라고 할 수 있는데 애플의 사물인터넷제품을 이렇게 자기한테 접목하는 게 120개 정도가 나와 있고요. 그리고 구글에 우리가 해외 구글 보면 스피커에 연결되는 게 3,000개가 넘었습니다. 그래서 지금 아까 말씀드리는 부분이 시장에 배포되고요. 저희도 채근을 합니다. 한 분야에 있는데 이쪽은 연구만 하고 저는 제품을 까고는 합니다. 손영성: 더 정확히 아실 것 같아요. 그런데 말씀드리면 저도 이 결론을 마지막에 결론은 두 버전은 있거든요. 제가 생각에는 여기 계신 분들이 IoT를 잘 모르실거라 생각해서 지금 이렇게 한 거예요. 잘 아시는 분이 있다, 예를 들어서 기술적으로 잘 아는 분이 계시면 제가 새로운 제품이 나오면 그것을 사가지고 테스트하는 것을 좋아하는 분들이면 사서 해보자라고 저는 얘기를 드립니다. 그런데 잘 안 되잖아요. 문제가 이거예요. 이게 처음에는 했다가 뭔가 갑자기 문제가 생겨서 먹통이 되면 그 다음에 다시 복구하기가 정말 어려워요. 지금까지. 그래서 그런 측면에 봤을 때는 조금 아쉽다. 질문자1: 질문 있습니다. 보여줬던 동영상에 마켓에 물건을 담아서 그런 식으로 가버리면 그게 나인 줄 어떻게 알고 나한테 청구가 되나요? 손영성: 그러니까요. 사실 여기 안 나왔던 건데 말씀하시죠. 최운호: 내용은 간단합니다. 아마존의 서비스의 프라임에 등록을 해 놓으면 우리가 생각할 때에는 그냥 ID, 패스워드 같은데 아마존이 우리가 얘기하는 애플폰, 삼성폰의 그리고 생체인증+키, 모든 IoT 기기에 역시 넣어놨어요. 아까 그 사람이 들어갈 때 개인적으로 뭘 했냐면 찍었거든요. 찍었으니까 나를 아는 거예요. 여기 등록한 카드도 알고. 그리고 그것을 해서 나가는데 굳이 이미 자기네들이 아까 보신 AI 인공지능으로 모션을 했잖아요. 그 사람 행위를 나중에 거절을 봉쇄를 한다고 부인 봉쇄를 한다고 이미 다 기록이 남아있어요. 그래서 그것을 그냥 들고 나가면 이 바코드가 있는데 곳곳에 리더기가 달릴 거고요. QR코드 다 읽었기 때문에 그러니까 고지서가 그대로 들어가는데 그래서 뭘 없앴냐면 우리가 사람을 고용했어야 됐죠. 찍는 장비가 있어야 됐고 꼭 그거에 대해서 영수증발행 했었잖아요. 한 20~30가지 사면 주르륵 나오고 그런 것을 전부 다 없앴다고 보시면 돼요. 아까 말씀드린 이미 많이 구현이 돼있어서 가능합니다. 질문자1: 그러면 우리나라에 쇼핑문화에서 남편이랑 같이 장보러 가서 물건은 내가 사고 돈은 남편에게 지불하게 하고 싶다면 들고 나가게 하는 사람도 남편이어야 되겠네요. 최운호: 아니요, 그것은 상관없습니다. 맨 처음에 들어갈 때 남편 핸드폰을 댔느냐, 부인의 핸드폰을 댔느냐에 따라서 다르고요. 핸드폰에 지문이 5개가 된다 그랬잖아요. 앞으로 10개가 될 겁니다. 그래서 엄지를 누르면 나한테 오고 검지를 누르면 남편한테 가고 충분합니다. 질문자1: 감사합니다. 질문자2: 얘기 잘 들었고요. 기술적으로 최신기술 되니까 많이 행복한데 여기 계신 분들 다 느끼는 거지만 이런 기술들은 계속 발전을 하고 진보되고 또 다음 달되면 또 바뀌고 이렇게 되면 따라잡기도 힘들지만 또 지금 현재 있는 우리 수준에서도 지금 현실이랑 먼 얘기라고 좀 느껴지는데 제가 오늘 느끼면서 질문 드리고 싶은 사항은 뭐냐면 사실 이런 PKI, 가장 진보된 인증기술이긴 한데 사실 쓰는 것은 다 ID, 패스워드를 쓰고 있어요. 문제는 뭐냐 하면 모든 기술이 그렇지만 비용대비효과, 아까 정말 필요에 와 닿는 그런 말씀하셨고 지금 도서관 자체도 보면 사실 좋죠. 대부분이 바코드 쓰잖아요. IC카드 쓰고 싶지만 그렇게 비용대비효과가 없으니까 이런 현실적인 게 있고 또 도서관리시스템도 마찬가지예요. 각 도서관에 자체 시스템을 쓴단 말이죠. 그런데 지금 오늘 얘기한 것들이 핵심 포인트가 클라우드 개념, IoT개념 이렇게 나가는 방향성인데 방향성 맞아요. 맞는데 제가 드리고 싶은 것은 기술적인 큰 Framework을 클라우드나 IoT나 이런 큰 Framework에 그 기술 자체에서도 엄청난 표준화가 돼있기 때문에 비용도 비싸고 그렇기 때문에 문제가 너무 심각해요. 어디 뭘 도입해야 되는지도 아직 분간을 못하겠고 제가 말씀드리는 클라우드라고 한다면 정부 주도의 아까 신경망 네트워크 좋아요. 정부 주도의 클라우드를 주신 다음에 중소규모의 1,800개 되는 도서관시스템을 하나로 합치는 거예요. 바꿀 수만 있다면 그런데 그것을 무료로 해줘야 돼요. 그게 바람직한 현상이고 그 다음에 IoT도 마찬가지예요. IoT도 수많은 기술들, 표준코드 다 다르잖아요. 그러나 그것을 어떤 주도적으로 그것이 아까 인증서도 마찬가지인데 인증서도 여러 가지가 있단 말이에요. 그것을 하나로 딱해서 이것은 얘다 해가지고 그것을 주도적으로 클라우드에서 한다면 서비스로 오픈소스나 아니면 오픈 APL으로 서비스를 해 준다면 각자의 돈 없는 기관들은 아니면 돈 없는 그런 것들은 이동하는 방향성으로 가야 된다는 게 제 생각인데 선생님의 생각은 어떠신지. 최운호: 우리가 ID, 패스워드는 언제부터 썼냐면 1967년도부터 썼어요. 그리고 최근에 전 세계 우리가 알고 있는 아마존이든 구글이든 전 세계 뭐라고 표현하냐면 이번 5월 달에 ID, 패스워드는 보여주는 것이다. 그래서 5가지가 발동된다. 우리가 얘기하는 윈도우나 OS 운영체계 바뀔 것이고 그리고 그 위에 쓰는 브라우저 같은 것들 바뀔 것이고요. 그리고 새로운 노트북이나 PC의 환경도 바뀔 것이고요. 그리고 지금 말씀하신 우리가 PKI라는 것은 1989년도부터 써왔어요. 우리나라에 2000년에 도입한 거고. 다만 그때 잘못된 게 뭐냐 하면 아까 제가 키 얘기 계속 했잖아요. 개인키, 공개키에다가 내가 주인이다를 넣어야 되는데 그때 돈이 많이 들었어요. 그래서 그때는 16평짜리 집인데 100만 명짜리 특별한 서비스인데 꼭 그렇게 복잡하게 만들어야겠느냐, 최 박사. 그랬는데 그래서 제가 해야 됩니다. 그랬는데 안하다가 나중에 OPT도 넣고 뭐도 넣고 무더기가 된 겁니다. 우리가 쓰고 있는 PKI라는 것은 이미 25년, 30년 된 좋은 기술이고요. 새로 나온 아마존이나 구글이나 우리가 삼성이나 모든 서비스들이 우리 도량형 표준화죠. 1m. 1평방미터하고 똑같이, 같은 기초로 쓰고 있는 기술입니다. 그래서 지금 말씀드리는 부분은 새로 어떤 기술이 많이 올라가는 것을 저도 동감을 하는데 이미 그 부분에서는 앞으로는 생체로 가자. 그리고 그를 그냥 두면 안 되니까 아까 인증서로 암호화하고 내가 주인임을 증명하자. 그 부분은 이미 표준이 통일이 됐고 제품까지 나온 겁니다. 그래서 그 부분은 제가 앞으로 사물인터넷을 하든 클라우드를 하든 똑같은 기술이고요. 다만 거기에서 비용대비효과로 우리가 모르모트가 되는 거죠. 우리 그동안 많은 전자제품 썼잖아요. 좋다고 썼는데 몇 달 뒤에 있다가 바뀌었다고 하고 냉장고 바뀌었다고 하고 그것은 쓴소리니까 할 수 없는 것 같고요. 앞으로 많은 기술들이 제자리 될 때까지 변하지 않는 원칙은 제가 봤을 때는 스마트폰입니다. 그것은 이미 전 세계가 통일을 했어요. 우리나라에도 이미 삼성, LG에서 모든 정부, 은행까지 다 통일을 한 거고요. 그래서 아까 인증서라는 부분은 여태까지 정면에 있었잖아요. 왜냐하면 주인님을 밝혀라를 패스워드로 했잖아요. 그런데 앞으로는 다 뒷면에 들어가 있으니까 우리가 모르는 사이에 계속 쓰시게 된 겁니다. 질문자3: 두 번째 질문을 받아주시죠. 클라우드 IoT 손영성: 그런데 그게 저희가 매몰비용 때문에 못하는 것도 있긴 하죠. 새로운 기술이 나오는 것도 좋은데 그것을 도입하려면 지금 되고 있는 게 이미 많아가지고 전환비용 이런 문제도 있는데요. 문제는 아까 IoT 회사가 Amazon Go 서비스 같은 경우에는 카메라만 있으면 돼요. 따로 NFC 태그 인식이나 바코드 인식이 필요가 없어요. 좋은 카메라만 있으면 돼요. 그런데 좋은 카메라도 지금 Amazon Go에 들어가 있는 카메라들 수천 만 원 짜리 카메라 있는데 그런데 CCTV 칩들이 좋은 칩들이 많이 나와요. 몇 십만 원짜리도 그 정도 기능이 나와요, 이제. 그래서 그 말은 무슨 말이냐면 어느 날 그것을 안들이고도 이것을 할 수 있게 되는 거예요. 예전 같으면 도서관 하나 정부사업 할거라 하면 몇 십억 들잖아요. 그런데 카메라만 설치하고 나면 그게 거의 비슷한 수준으로 지원을 할 수 있게 될 가능성이 있어요. 다시 말하면 한계비용이 되게 낮아지는 가능성이 있거든요. 그런데 아직 기술적으로 완전하지 못해서 문제이지. 조금만 지나면 제가 볼 때는 2020년 정도라고 보는데 그 선 안에 몇 가지 대안들이 나오고 클라우드는 특히 비용이 안 들잖아요. 설치하는 게 아니잖아요. 그런 것은 카메라만 설치하면 되는 거니까. 그러면 더더군다나 그런 전환비용이 적어지니까 그러면 새로 짓는 도서관부터 아니면 이렇게 할 수 있겠죠. 충분히 가능하다고 봅니다.



4차 산업혁명 시대의 지식공유와 협력

토론: 조현양(경기대학교 문헌정보학과 교수), 정재영(서강대학교 로욜라도서관 팀장)
동영상에 대한 자막정보
이흥용: 서강대학교 도서관 팀장이신 정재영 박사님의 토론을 듣도록 하겠습니다. 정재영: 반갑습니다. 어젯밤에 굉장히 회포를 푸시느라고 힘드셨을 텐데 이렇게 많이 참석해 주신 걸 보니까 대학 도서관뿐만 아니라 공공도서관, 국회도서관 특히 미래가 굉장히 밝다고 생각을 합니다. 개인적으로 이 구글북스에 대한 소개라든가 그에 따른 대응 방안에 대한 논의가 이 시점에서 진행된 것에 대해서 저는 굉장히 다행스럽게 생각을 합니다. 향후에 만약에 더 진행됐다거나 한 경우보다 지금 시점에서 서로의 기본적인 논의가 필요한 시점이 아닌가 이렇게 생각을 합니다. 어제부터 세미나를 들으신 분들은 다 느끼셨겠지만 4차산업혁명에 있어서의 핵심은 빅데이터를 기반으로 한 인공지능과 그리고 그를 통한 고품질의 데이터 제공인 거죠. 그런데 고품질의 데이터의 수집과 제공이라고 하는 부분이 결국은 도서관의 역할이기도 하기 때문에 구글북스를 비롯한 다양한 IBM도 비롯해서 기술적인 발달이 어떻게 보면 굉장히 기대가 되는 것도 사실지만 우려가 되는 것도 또한 개인적으로 사실이라고 생각을 합니다. 이러한 논의가 어제부터 진행된 이런 디지털화라든가 이런 기술의 발전에 대한 접목에 대한 논의가 결과적으로는 도서관의 보전과 이용이라고 하는 도서관의 가치 자체를 상승시키는 데에 기여할 수 있을 것이다라고 생각을 합니다. 디지털화에 대한 논의는 사실 도서관계에서만 벌써 한 20년 전부터 시작돼 왔기 때문에 기술에 대한 축적은 어느 정도 축적이 돼 있다고 생각을 하고 다만 이제 도서관을 비롯한 그 주위에 있는 기관들과의 사이에서 발생하는 다양한 문제들. 여러분들 잘 아시다시피 웹DB의 문제라든가 저작권의 문제, 원격이용 이런 쪽의 문제들이 하나가 해결되기 전에 또 다른 문제가 자꾸 발생을 하면서 조금 헤매고 있지 않느냐라는 개인적으로 생각을 하고 있고요. 어떻게 보면 지금 시점에서 4차산업혁명을 맞이하는 지금 시점에서 시장, 도서관을 비롯한 시장과 기술과 그리고 법률에 있어서의 세 가지의 트렌드가 서로 잘 맞춰가고 있지는 않다. 여기서 문제가 있는 것이 아니냐 저는 개인적으로 이렇게 생각을 합니다. 사실 어떤 논의가 여기서 저희가 진행이 된다고 해도 기술의 발전은 어차피 진행이 될 거고요. 온라인을 통한 자료의 제공은 당연히 계속될 거다라고 생각을 합니다. 그런 차원에서 향후에는 도서관 쪽에서의 전략적인 대응이 필요하지 않냐라고 생각을 합니다. 이 세션의 핵심 주제가 여러분 지금 방금 들으셨듯이 구글북스에 대한 내용이고 시간이 많지 않기 때문에 그 부분에 대한 간략적인 저의 의견을 말씀드려보겠습니다. 제 개인적으로는 지금 금방 구글에서 발표를 하신 걸 들으면서 지식의 바벨탑이라고 하는 인간의 궁극적인 목적을 위해서 진행되고 있는 이와 같은 사업이 이와 같은 프로젝트가 이 결과가 어떻게 될 것인가에 대해서 굉장히 기대가 되는 것도 또한 사실입니다. 궁금해요. 그리고 세상의 모든 지식을 수집하겠다라고 하는 건 사실 도서관에서 먼저 시작을 했죠. 알렉산드리아 도서관에서 전 세계 자료들을 다 수집하겠다라고 했던 시점도 있었죠. 그 당시야 당연히 교통의 상황이라든가 여러 문제 때문에 되지는 않았겠지만 지금과 같이 인터넷이라든가 컴퓨터라든가 모바일이 활성화된 시대에서는 이론적으로는 충분히 가능하지 않냐 이렇게 생각을 합니다. 구글의 발표를 들으면서 여러분들이 혹시 제 생각에 한 반 정도는 굉장히 기대가 된다라는 생각을 하셨을 것 같고 또 한 3분의 1 정도는 조금 우려가 되는 것이 아니냐라고 하시는 분도 계실 거라고 생각을 합니다. 그래서 저는 여기 계시는 국회도서관장님도 굉장히 기대가 크신 걸로 알고 있는데 역할이 역할이니만큼 근본적인 문제에 대한 그런 제기부터 다시 여러분들하고 나눠보도록 하겠습니다. 첫 번째 구글의 있어서의 목적에 대한 부분을 조금 말씀을 제 개인적으로 말씀을 드려볼까요. 제가 그렇다고 대단한 애국자도 아니고 여러분들한테 애국심을 강요할 생각도 전혀 없습니다. 그렇지만 한 국가가 보유하고 있는 지적 재산을 영리를 추구하는 외국 기업과의 어떤 협약을 통해서 제공하는 것에 있어서의 근본적인 문제가 있지 않느냐. 여기에는 저작권의 문제라든가 아니면 접근성의 문제와는 조금 다른 차원의 접근이 필요하지 않느냐라는 게 제 개인적인 생각이고요. 도서관의 자산은 당연히 공공재죠. 공공재가 디지털화된다라는 것은 어떻게 보면 지적 유산이 되는 거고요. 그러면 그런 어떤 지적 유산을 상업적 기관과의 연계를 협약하는 것에 대한 근본적인 문제에 대한 검토는 짚고 넘어가야 할 부분이다라고 생각을 하고 예를 들어서 2016년에 구글에서 5천 분의 1 지도인가요? 5천 분의 1 지도에 대한 반출을 요청한 적이 있었어요 그때도 국내 저희 사정이 그러니까 굉장히 민감한 자료이기 때문에 반출을 허용하지 않는다라고 하는 국내 전체적인 반대여론이 형성돼 있다는 걸 여러분들도 아마 아실 거라고 생각을 합니다. 따라서 이 문제에 대해서도 그러니까 어떤 그 자료에 있어서의 디지털화라든가 이걸 구글과의 어떤 협약을 통해서 넘겨준다는 이와 같은 문제도 명분의 있어서의 싸움이 굉장히 필요할 거다라고 생각이 들고 국내 정서에 있어서 반대 정서를 도서관뿐만이 아니라 국내 전체적인 차원에서의 반대 정서를 어떻게 해결할 것인가에 대한 문제가 분명히 존재한다라고 생각을 합니다. 그리고 모든 지적 유산물의 구글에 다 구축된다라고 하는 것은 누구나 알다시피 독점의 문제가 초래될 가능성이 분명히 있다라고 하는 게 제 생각입니다. 구글은 구글 쪽에서 하는 얘기는 당연히 다른 기업과의 계약도 가능하고 그 다음에 비독점이라고 얘기를 합니다. 그렇지만 이미 모든 도서가 구글에 구축이 돼 있으면 사실 시장의 상황에 따라서 얼마든지 독점화될 수 있는 가능성의 여지는 있지 않느냐라는 게 제 생각입니다. 제가 너무 비관적으로 얘기하는 것 같죠. 짚고 넘어가자는 뜻에서 말씀드린 겁니다. 예를 들어서 4월 26일에 신문을 보신 분도 계시겠지만 네이버에서 인 링크를 맺고 있는 언론사 125개에 공문을 보내죠. 그래서 인 링크를 유지할 것이냐. 아니면 아웃 링크로 전환할 것이냐에 대한 공문을 발송해요. 그런데 형식은 의견을 수렴한다라고 돼 있지만 사실은 그건 의견을 수렴하는 게 아니죠. 어떻게 보면 우리가 계속 얘기하는 우월적인 지위 그러니까 시장 지배적 지위를 악용한 갑질에 해당된다라고 저는 개인적으로 생각을 해요. 그런 사례들이 구글이 지금 전 세계 검색시장에서의 굉장한 지배적인 시장을 장악하고 있잖아요. 그런 입장에서 보면 이와 같은 사례들이 유사한 사례가 발생할 여지가 있지 않느냐라는 생각을 하게 됩니다. 그리고 한 가지만 더 말씀드리면 도서관에서 바라볼 때 도서관에서 여러분들이 계시니까 상황이 저희가 웹DB라든가 전자자료를 도입할 때의 상황과 뭔가 유사점을 갖고 있지 않느냐라는 우려도 하게 됩니다. 다시 말해서 처음에 저희가 웹DB을 도입할 때도 그랬죠. 처음에 도서관과 이용자를 위한 편리한 제공 방법을 소개하겠다. 이후에 샘플과 무료 이용을 제공해 주고 그 다음에 가격을 그 이후에 끊임없이 올려가는 상황에서 지금은 갑이 을이 되고 을이 갑이 되는 그런 상황 아닙니까? 그런데 그런 상황에서 이와 같은 사례가 구글에 이와 같은 디지털라이제이션의 사례에 또 하나의 사례가 될 수도 있다라는 게 저의 생각이고요. 결론적으로 구글에서는 검색의 효율성을 통한 이용의 첨단화라고 얘기를 하지만 아까 그 구글의 공동창업자가 말씀을 한 것처럼 AI와의 완전한 협약. 이걸 완전한 결합을 목적으로 한다고 했잖아요. 그러니까 결과적으로 궁극적으로 어떻게 보면 인공지능에 있어서의 완성을 노린 것이 아니냐. 그리고 궁극적으로는 전 세계 정보의 최종 헤게모니를 지겠다는 것이 아니겠느냐라는 생각을 개인적으로 하게 됩니다. 그리고 더불어서 법률적인 문제를 한번 짚어보겠습니다. 법률은 어느 국가나 마찬가지로 다 국지주의죠. 그 나라 법은 그 영토 안에서는 그 나라 법이 적용되도록 돼 있습니다. 아까 구글에서도 말씀하신 것처럼 2005년에 미국작가협회에서 소송을 제기해서 2016년에 최종 결과가 났죠. 영리를 목적으로 하는 것이 아니라 검색을 위한 새로운 용도. 즉 변형적 이용에 해당됨으로 공정 이용에 가깝다고 해서 판결이 났어요. 그러니까 저작권에 대한 문제가 이제 어느 정도 해결이 됐다라고 얘기를 하지만 이 상황이 만약에 한국에 들어왔을. 다시 구체적으로 전개가 된다고 했을 때 이대로 계속 이거와 똑같은 결론이 날 수 있겠느냐라는 건 사실 누구도 장담할 수는 없다는 거죠. 그러니까 물론 참고가 되고 사례가 될 수는 있겠지만 이와 같은 것들에 있어서 도서관의 있어서의 똑같은 국내의 있어서의 그런 사례가 결과가 되지 않을 수 있다라는 게 제 생각이고요. 변형적 이용이라고 하는. 제가 조금 아까 말씀드렸던 그 저작권 문제의 해결 방안의 있어서의 저작 변형적 이용이라고 하는 부분이 현재는 공정 이용이라고 하더라도 구글에서 진행하는 스캔이 사람을 위한 게 아니잖아요. AI를 위한 거잖아요. 그런데 그런 차원에서 보면 디지털화에 따른 인공지능에 의한 분석이라든가 인공지능이 지속적인 학습을 통해서 기능과 역할이 진화되어 간다면 저작권의 침해냐, 아니냐. 공정 이용이냐 아니냐에 대한 문제는 또 다른 차원에서의 논의가 될 수 있고 지금과 같은 차원하고는 다른 차원에서 결론이 날 수도 있지 않느냐라는 게 저의 생각입니다. 제가 문제점을 말씀드려서 혹시 대안까지는 말씀을 드리고 싶은데 시간이 없어서 일단 조 교수님의 얘기를 먼저 듣도록 하겠습니다. 이웅용: 구글북스의 사업은 시대의 흐름이지만 현실적인 문제를 심도 있게 설명해 주신 서강대학교 도서관 정재영 박사님 감사합니다. 다음은 경기대학교 조현양 교수님께서 토론을 해 주시겠습니다. 조현양: 제가 이 자리에 앉아서 제일 먼저 고민하는 부분이 제가 사서일까 아니면 이용자일까 고민을 많이 해 봅니다. 아무래도 저는 문헌정보학과를 졸업하고 문헌정보학과의 학생들을 가르치는 입장이니까 이용자보다는 사서라는 입장에서 먼저 좀 생각을 해야 할 것 같다는 생각이. 요즘 앱에서 주로 인공지능 기반한 챗봇으로 그게 넘어가는 것 같아요. 그러면 결국 이용자 입장에서 볼 때는 어떤 대화를 통해서 필요한 물건이나 이런 부분을 구입하기가 굉장히 편리해지게 되겠죠. 그렇죠? 이런 기술을 우리가 도산이 받아들이지 않는다는 건 말이 안 되고 받아들여야 하는데 문제는 이런 겁니다. 우리가 구글북스에서 책에 대한 위치나 그 다음에 책을 구입할 수 있는 연결점에서 끝이 나면 참 좋은데 구글은 궁극적으로는 갈 겁니다. 책의 내용을 다 분석하고 책의 내용을 대화식으로 왓슨처럼. 대화식으로 해서 책에 대한 내용을 이용자들이 질문에 따라 전달해 줄 수 있는. 결국 그렇게 되면 제가 염려하는 부분 중에 하나는 이용자는 편의를 추구하게 되고 결국은 책을 읽지 않을 거라는 생각이 드는 거죠. 구글한테 가서 물어보면 답이 나오는데 내가 뭐 힘들게 책을 다 읽어. 이런 부분이 저는 조금은 염려가 됩니다. 그렇죠? 우리 다음 세대들이 과연 책을 읽을까? 책 읽지 말고 그냥 한번 구글 아까 구글톡스라고 그랬던 것 같은데 들어가서 물어보고 필요한 답을 구하고 이러면 되지 않을까 하는 그런 측면에서 결국은 구글이 추구하는 구글도 살고 도서관도 살고 그 다음 저작자들도 살고 하는 부분이 어느 순간에 가서는 그런 유통 사이클이 무너질 수도 있겠다는 그런 염려를 해 봤습니다. 구글이 좋은가에 대한 부분은 많이 말씀하셨으니까 저는 주로 부정적인 부분에 한번 가보겠습니다. 우리 정재영 박사가 여러 가지 이야기를 하셨는데 저는 그 부분에 다 동의를 하고 한 가지 또 더 필요한 부분 중에 하나가 구글이 사생활을 침해할 수 있다. 결국 어떤 사람이 어떤 책을 읽을 어떤 유형의 책을 많이 읽고 그 사람이 어떤 데 관심이 있고 하는 부분을 알게 될 것 같아요. 여러 책을 지금까지 쭉 구글의 로그를 해 보면 이 사람들은 들어와서 뭘 했고 하는 게 다 남아 있겠죠. 결국은 구글은 이익을 추구하는 기관이기 때문에 이용자의 어떤 사생활이나 침해에 관한 부분을 다 파괴를 하게 될 테고 우리가 구글 지도 이용하는 데에서 전부 다 그 부분이 드러나지 않았습니까? 그런 부분이 조금 걱정되는 부분 중에 하나입니다. 그 다음에 저는 또 한 가지 염려되는 부분 중에 이런 게 있습니다. 제가 요즘 전에는 길을 잘 찾아다녔는데 어느 순간 내비게이션을 달고 다니면서부터는 어디 가는 거에 대한 부분을 제 머리에 의해서 가는 게 아니고 기계에 따라 쭉 움직이게 되는 그런 부분들이 있더라고요. 물론 이제 계산기 쓰는 것도 그렇고 옛날에는 웬만하면 숫자는 암산을 하고 전화번호도 제가 웬만하면 외우고 그랬는데 모든 게 이제는 머릿속에서 다 떠나버리는 거예요. 자꾸 기계에 대한 의존도가 점점 더 높아지는 것 같다. 물론 구글이 그걸로 인해서 우리를 좀 더 편하게 해 주는 그런 부분들도 있겠죠. 제가 얼마 전에 신문을 잠깐 봤더니 요즘 세대들은 인스타그램에서도 한줄이 넘어가면 보지를 않는다고 그러고 그 다음 신문 기사도 3줄 이하로 요약하지 않으면 보지 않는다라고 합니다. 그래서 서머라이즈쓰리라는 게 등장을 했고요. 그 다음에 네이버 같은 경우에도 뉴스나 이런 부분들 요약해 주는 요약봇이라는 게 등장을 했죠. 이제 결국 모두에 말씀드렸던 대로 이런 부분들이 참 생활의 편의를 가져올 수는 있는데 사람을 기계에 자꾸 종속화시키는 부분들 구글이 아마 추구하는 궁극적인 목적은 그럴 것 같아요. 지금은 도서관도 살리고 그 다음에 이용자한테 편의도 제공하고 그렇기는 하지만 결국은 구글이 모든 걸 갖게 되는 그런 부분이 조금 염려된다. 이렇게 볼 수 있는 거죠. 그러면 그렇다고 우리가 기술을 받아들이지 않아야 할 거냐 하는 부분은 굉장히 논란의 여지가 있습니다. 경제 원칙에 보면 수요가 공급을 촉진한다고 그러지만 거꾸로 역으로 될 수도 있는 거죠. 지금 구글은 아마 역으로 가는 것 같아요. 공급을 지속적으로 해서 수요자들이 따올 수 있도록 하는. 그게 이제 우리가 표현할 수 있는 유행이라는 걸로 표현이 가능할 것 같아요. 사람들은 자꾸 지속적으로 유행을 따라갈 테고 거기에 또 의지하게 될 테고 결국 구글은 그런 형태가 되고 있겠죠. 여하튼 제가 볼 때는 정보 기술은 먼저 공급을 하고 수요가 따라가는 그런 형태가 될 거다. 그래서 여기에서 고민해야 할 부분들은 아마 국회도서관에서 저를 왜 토론자로 앉혔을까 하는 부분을 저도 많이 고민을 했습니다. 우리 관장님이 어떤 관심을 가지고 계실까요. 관장님보다 더 중요한 국회도서관의 사서분들이 더 중요하죠. 관장님은 제가 볼 때 길게 하셔도 10년 이상 하실 것 같지 않으니까 국회도서관은 100년을 가고 1천 년을 가야 하는 거니까. 국회도서관 사서분들이 어떻게 생각하고 계실까 하는 고민을 해 봤습니다. 아마 사서분들 입장에서는 당장이라도 이용자한테 조금 더 접근하는 게 더 중요할 것 같다 하는 부분이 많이 강조를 하실 거라는 그런 생각을 해 봤습니다. 단지 여기서 우리가 독자적으로 가야 할 거냐 구글하고 협력을 해야 할 부분에 관한 부분은 저는 정말로 개인적인 생각입니다. 저는 협력이 필요하다고 생각합니다. 단지 구글에서 어떤 조건을 내걸지에 관한 부분은 전혀 고려치 않은 겁니다. 구글은 궁극적으로 기업이기 때문에 기업이 이윤을 추구하게 되겠죠. 그런데 구글이 만약에 도서관하고 정말로 상생하는 걸 우선적으로 친다. 그 다음에 이용자를 우선적으로 친다. 그 다음에 우리 도서관하고 절대적으로 협력이 필요하다고 지속적으로 아니면 장기적으로 그런 관심을 갖고 있다면 저는 협력을 해야 한다고 봅니다. 물론 국회도서관이나 우리나라 국립중앙도서관은 다른 국가에 비해서는 사실 디지털화가 빨리 돼 있는 편입니다. 그래서 구글 입장에서 볼 때는 물론 타 국에 비해서 중요한 정보가 적을 수도 있지만 사실은 시작한다고 그러면 훨씬 더 빨리 시작할 수 있는 그런 기반이 잘 갖추어져 있는 거죠. 그래서 국회도서관 입장에서 볼 때 우리가 구글하고 협력을 해야 할 거냐. 아니면 우리 국내 이해당사자들 생산자나 출판자나 그 다음에 도서관들이나 이용자들이나 다 협의를 해서 협력 쪽으로 국내에서 독립적으로 갈 거냐 하는 부분에 대한 고민이 필요할 것 같습니다. 그러나 저는 결론적으로 말씀을 드려서 우리가 가지고 있는 것을 제공하지 않으면 남의 것을 얻을 수도 없다는 생각을 기본적으로 하고 있습니다. 그래서 조금 더 고민을 해 보시고 하여튼 구글이 양보를 하지 않으면 오늘 아침에 트럼프가 판을 깨서 저도 상당히 걱정이 되고 있는데 구글이 먼저 양보하시고 그 다음에 구글이 장기적으로 살아남을 수 있으려면 결국 도서관이라는 바탕이 필요할 것 같고요. 그런 측면을 충분히 고려하신다면 그런 좋은 협력관계가 될 것 같습니다. 이웅용: 네, 감사합니다. 구글북스의 사업에 있어 사서의 입장을 설명하시면서 도서관계의 우려를 말씀해 주신 경기대학교의 조현양 교수님 감사합니다. 정재영: 잠깐만요. 이흥용: 다음은 질의응답 시간. 정재영: 아니, 잠깐만요. 제가 굉장히 긍정적인 사람인데 지금 부정적인 얘기만 좀 한 것 같아서 한 말씀만 지금 시간이 조금 있기 때문에 한 3분 정도만 더 사용을 하도록 하겠습니다. 대안을 얘기하고 싶은데 사실 시간은 없고요. 그건 다음 기회가 있으면 그때 하도록 하고 지난 4월 20일에 국립중앙도서관 그 큰 강당에서 문헌정보학회하고 비블리학회가 공동개최를 한 게 있어요. 디지털 트랜스포메이션이라는 주제를 가지고. 그때도 구글에서 고문변호사가 참석을 해서 구글북스에 대한 소개를 했었고요. 문헌정보학계의 각 층에 있는 교수님들. 지방에 계신 분들 서울 다 포함해서 올라오셔서 논의를 하는 걸 봤어요. 봤는데 문제는 그 논의는 다 좋은데 끝에 말미에 한 학생이 일어나서 질문을 했어요. 그런데 그 학생이 자기소개를 하는데 문헌정보학과 학생은 아니고 신문방송을 전공하는 석사학위 학생이더라고요. 뭐라고 질문을 했냐 하면 나는 구글을 통한 검색이 굉장히 매력적이라고 느낀다. 그리고 여기 있는. 그러니까 그 당시에 거기 있던 사람들. 대부분은 도서관계 쪽 사람들이죠. 그러니까 도서관계 쪽에 있는 사람들의 생각이 이게 구글이 외국 기업이고 영리를 추구하는 업체이기 때문에 거부하는 것이 아니냐. 국경이 사라진 4차산업혁명시대에 이게 맞느냐. 그러면 도서관의 목적이 결국은 서비스인데 가장 좋은 파트너가 구글이 아니겠느냐. 만약에 도서관계 쪽에서 반대를 한다면 대안이 뭡니까 이렇게 질문을 했어요. 사실은 도서관과 구글의 문제다라고 생각을 해서 저도 생각을 했었는데 어느 순간엔가 이용자가 살짝 빠져 있었던 거죠. 그래서 사실 첫 번째는 그 학생이 혹시 구글에서 파견이 나온 학생이 아닌가. 농담입니다. 워낙 질문도 잘하고 준비가 돼 있던 것 같아서. 그런데 그 얘기를 들으면서 사실 뒤통수를 한 대 맞은 듯한 그런 느낌이었어요, 개인적으로. 아까 발표자분도 얘기했지만 현 세대는 어쨌든 간에 자료를 찾기 위해서 도서관보다는 인터넷 검색을 먼저 시작을 하죠. 그렇죠? 그리고 편리성과 신속성을 가장 최우선으로 추구하는 그런 시대들이고요. 그런 차원에서 구글의 사례를 보니까 2015년 10월 현재 제가 통계를 보니까 저작권이 소멸된 데에서 530만 권을 포함해서 약 1,370만 권 가량의 도서가 디지털로 벌써 제공이 되고 있고 저도 한번 검색을 해 봤어요. 존 밀턴의 실낙원을 찾으니까 원본이 처음부터 끝까지 다 뜨더라고요. 굉장히 편리하기는 하더라고요. 그 다음에 2016년에 미국을 비롯한 236개 국가에서 617만 명이 벌써 이용을 하고 있다라는 통계가 나와 있어요. 그러니까 도서관에서 이걸 할 거냐, 안 할 거냐에 대한 문제보다 이용자들이 어떤 걸 선호하느냐에 대한 문제가 사실은 또 하나의 고려사항이 되어야 하지 않느냐라는 제 생각이고요. 만약에 도서관이 구글하고 협력을 한다면 구글하고 협력을 한다면. 5분 남았답니다. 기술적인 장점이 굉장히 있을 거라라고 생각을 합니다. 그러니까 다른 기술과의 연계 가능성도 굉장히 크기 때문에 이용자들의 있어서의 이용도 그 다음에 매력적일 거다라고 생각을 하고요. 흥미를 당연히 끌 거다라고 생각을 하고요. 그런데 도서관과 구글이 추구하는 목적을 가만히 되짚어보면 근본적으로 고품질의 데이터를 확보해서 서비스를 하겠다. 어떻게 보면 고품질의 데이터를 확보해서 최첨단 방식으로 서비스하겠다. 도서관의 목적과 사실은 구글의 목적이 다른 게 아니다라는 생각은 합니다. 그런 차원에서 지금 이 시점에서의 논의는. 가장 지금 이제 시작되는 시점이기 때문에 구글 측과 어떻게 보면 서로의 필요로든가 요구에 대한 접점을 찾아가는 시점이 아니겠느냐. 지금 교수님이 말씀하셨듯이 그런 시점에서의 출발점을 어떻게 잡느냐. 양보까지는 아니더라도 서로의 접점을 서로의 요구를 어떻게 서로 캐치할 수 있느냐가 가장 중요한 포인트가 될 거다라고 생각을 하고요. 미래의 가능성을 위해서 협력이 됐든 그게 그렇지 않든 미래의 가능성, 협력을 염두에 두고 많은 사람들. 저를 비롯한 많은 사람들이 가지고 있는 의심이라든가 논란이 해소될 수 있을 때까지의 시간이 조금 필요하지 않느냐라고 생각을 하고요. 그래서 지금과 같이 초기 단계에서 신뢰를 쌓아가는 과정. 우려를 제가 아까 말씀드렸던 다양한 우려들을 해소해 나가는 과정이 필요하다. 밟고 갈 필요는 분명히 있지 않느냐라는 생각을 합니다. 이상입니다. 이흥용: 이용자를 생각하시는 좋은 말씀 감사합니다. 다음은 질의응답 시간을 갖도록 하겠습니다. 도서관장님께서 질문을 하시겠습니다. 정재영: 질의응답도 있었어요? 허용범: 저는 질문하면 안 됩니까? 이흥용: 됩니다. 허용범: 어제 잘 주무셨습니까? 목포. 여기는 영남이지만 목포가 떠들썩하리라고 예상했는데 그렇지 않은 것 같습니다. 사실 어제 제 강연을 들으신 분들은 저의 강연과 오늘 구글북스 내지 톡트북스가 하나의 연결고리로 연결돼 있고 제가 제기한 문제제기와 같은 맥락에서 흘러가고 있다는 것을 잘 아실 겁니다. 저도 이 구글북스 프로젝트에 대해서 한편으로는 굉장히 우려를 갖고 있고 한편으로는 굉장한 기대를 갖고 있어서 저희 국회도서관에서 바로 여기 사회 보시는 이흥용 과장님이 몇 달에 걸쳐서 구글북스 프로젝트를 연구를 했습니다. 연구를 했어요. 이게 도대체 우리 도서관의 어떤 영향을 미칠 것인가. 우리는 구글과 손을 잡아야 하느냐 말아야 하느냐 어제도 제가 그 얘기했지 않습니까? 제가 오늘 토론자 선생님 말씀을 들으면서 한 가지 정말 질문을 하고 싶어요. 그럼 아까 그 학생이 물었다는 대로 그러면 우리가 우리 자료를 우리가 움켜쥐고 있고 움켜쥐고 있고 50년 된 거 100년 된 거 아무도 쳐다보지 않는 서고 밑에 있는 저 밑에 있는 거 그거 그렇게 갖고 있다 치죠. 그걸 디지털화해서 모든 국민, 인류 모두가 그걸 활용하도록 하는 게 우리 도서관의 존재 이유인데 그러면 구글이 해 주겠다는데 안 하고 그럼 다른 대안이 있냐. 대안이 있습니까? 움켜쥐고 있어서 어떻게 하겠다는 거예요. 그래서 제가 특정사를 얘기하면 안 되죠. 아까 말씀하셨잖아요. 우리 특정 국가의 국가 자산을 상업적 목적의 다국적 기업에 통째로 넘겨줘도 되느냐. 정서상 안 될 수 있죠. 그러면 대안이 있느냐. 제가 국내에 최고 잘 나가는 기업에 물어봤어요. 너희들 할래? 너희들 줄게. 할 이유가 없다는 거예요. 우리는 구글처럼 그런 다국적 서비스를 할 의사도 없고 그럴 능력도 없고 그럴 목표도 없고. 대안이 있느냐, 대안이. 그럼 정부에서 한 1천억 원 정도 줘서 국회도서관이랑 국립중앙도서관에 있는 저 밑에 있는 거 전부 디지털화해서 국민에게 서비스해라 이렇게 해 주면 좋겠는데 그렇게 해 줄 가능성도 제가 보기에는 없고요. 그래서 대안이 있느냐 그러면. 두 번째 우리는 구글의 모든 서비스, 기능, 안드로이드부터 시작해서 모든 걸 다 활용하지 않습니까? 또 미국에도 가서 삼성이 우리나라 가서 미국에서 온갖 것 다 팔지 않습니까? 그런데 구글이 미국에 기반한 다국적 기업이라고 해서 우리가 여기에 만약에 거부감을 갖는다? 어느 글을 보면 지식 주권을 지킨다 이런 표현을 쓴 것도 봤어요. 그러면 그렇게 지식 주권을 지키는 게 그러면 뭐냐. 반대말로 어떤 글에는 그걸 문화쇄국주의라. 새로운 심판 문화쇄국주의다 이렇게 구한말에 이렇게 표현한 것도 봤는데 그러한 모순점. 그러니까 아까 정 선생이 말한 대로 우리가 그럼 구글. 그러니까 이걸 대안이 있느냐. 또 하나는 이게 문화쇄국주의가 아니냐 혹시나. 지식 주권을 지킨다는 명분으로. 이런 쟁점에 대해서는 어떻게 생각하는지 한번 여쭤보고 싶습니다. 정재영: 질문보다는 강의를 더 하셔야 할 것 같은. 이 문제를 심도 있게 논의하려면 하루 더 묵었다 가야 할 것 같은 생각이 듭니다. 우려하시는 지금 시각에 있어서의 우려하시는 관장님의 생각을 정확하게 읽겠어요. 무슨 뜻인지. 그리고 제가 맡은 역할이 문제점이라든가 단점을 주로 얘기를 하다 보니까 그렇게 비춰질 수도 있고요. 혹시나 해서 뒤에 제가 그래서 가능성도 말씀을 드렸는데도 불구하고 저는 그렇게 생각해요. 대안이 있느냐. 능력이 있느냐 도서관계 쪽에서. 저는 관장님이 도서관계를 좀 과소평가하고 계신 게 아닌가라는 생각을 저는 합니다. 대안을 제가 여기서 아, 이거다라고 내가 좀 길게 말씀을 드리고 싶지만 그렇게는 시간이 없을 것 같고요. 간단하게만 말씀드리면 이런 거죠. 지금은 어차피 시작 시점이에요. 그러니까 구글북스로부터 우리는 조금 자유롭잖아요, 아직은. 지금 유럽 같은 데에 유럽피아나가 있고 구글북스는 당연히 북미 쪽에 중심이 되어서 있고 한국을 비롯한 이 동양권에는 아직까지는 그거에 대한 영향이 미치고 있지는 않다라고 저희가 판단을 합니다. 그러면 지금 시점에서 그거에 대한 우려를 충분히 느꼈던 유러피아나 쪽에서 유럽에서 시작을 했던 유러피아나가 하나의 모델이 될 수도 있지 않느냐. 물론 무슨 거기에는 또 다른 문제가 있죠. 유러피아나가 박물관, 기록관, 도서관에 있을 자료들을 약 한 3천6백만점 이상을 지금 확보를 하고 있지만 문제는 이 부분은 마케팅 부족으로 인해서 사실 활용도가 그렇게 높지 않다라는 게 사실 그쪽의 문제예요. 그러면 우리는 문제도 알고 있잖아요. 그러니까 자체적으로 어떻게 보면 국가 지식 인프라 구축을 위한 협의회를 구성한다든가 아니면 동양권을 한국에서 주도해서 유러피아나가 대안이 될 수 있을 정도의 그 정도의 상황을 만들어 가는 노력도 하지 않은 채 구글밖에 없다. 이렇게 얘기하는 건 저는 좀 어폐가 있지 않느냐라고 생각을 하고요. 말이 나왔으니까 한마디만 더 말씀을 드릴게요. 법률적인 측면에서 우리가 지금 있는 것도 이용 못하잖아요. 국회도서관 같은 경우에 지금 2018년만을 기준으로 보면 거의 한 500만 권 이상이 지금 디지털화 돼 있잖아요. 국중도 2017년 말 기준으로 약 한 90만 권이 지금 디지털화 돼 있어요. 그리고 앞으로 약 한 10년 동안의 1,033억 원을 투입해서 디지털화하겠다라는 계획을 가지고 있더라고요. 그렇지만 문제는 그와 같은 자료들을 구축하는 게 아니라 이용할 수 있어야 디지털화가 제대로 됐다라고 하는 거죠. 디지털 좋다라는 게 그런 거 아니겠어요? 언제 어디서든 누구나 편리하게 이용할 수 있게 된다라는 관점에서 보면 지금 저작권법 31조에 보면 도서관 등에서의 복지에 보면 도서관이랑 다른 도서관 안에서밖에 이용할 수가 없도록 되어 있잖아요. 그렇죠? 그런 차원에서 도서관에서 구축되어 있는 자료 자체도 자유롭게 이용할 수 없는 그런 상황에 대한 극복의 노력도 사실은 우선이 되어야 한다라고 보는 거죠. 그래서 저작권법 31조가 저작권리자의 입장으로 돼 있는 그게 잘못됐다는 건 아니에요. 그렇지만 저작권리자의 시점과 관점에서 이제는 시대가 좀 변해 가니까 이용자와 이용의 편리성을 위한 쪽으로 중심을 잡아가는 쪽으로 개정의 노력이 필요하지 않느냐. 그런 정도의 노력을 하면서 이것도 안 되겠다. 그때 구글을 찾아야 하는 게 아닐까라는 게 저의 생각입니다. 길게 해서 죄송합니다. 이흥용: 좋은 질문, 좋은 답변 감사합니다. 조현양: 저도 한마디만 잠깐. 관장님 질문하신 대안이 있느냐 하는 부분은 지금 당장 답은 드릴 수는 없지만 지금이라도 대안에 대한 답을 찾지 못하면 앞으로 대안은 전혀 없습니다. 존재할 가치가 없어지는 거고요. 그 다음에 정보 쇄국주의에 관한 부분은 저도 거기에는 전적으로 동의를 합니다. 그런데 여하튼 조금 더 고민을 해 보시고 다양한 의견을 들어보시고 국회 내에서 토론으로 국회도서관 내에서 토론으로 결정 날 부분은 아닌 것 같고요. 도서관계에서 한번 전체적으로 한번 토론을 해서 움직이면 같이 움직여주는 게 저는 맞을 거라는 생각이 들고 그래서 조금 더 토의가 되어야 할 부분이 아닌가. 저는 쇄국주의를 절대로 반대는 하지만 너무 단칼에 어떤 결정을 내리는 좀 많이 고민을 해 보셨겠지만 그렇게 생각하고 있습니다. 이웅용: 감사합니다. 시간관계상 더 이상 질문은 받을 수 없겠습니다. 이것으로 AI퍼스트시대의 디지털 도서관이라는 주제로 진행된 세션3 콘퍼런스를 마치겠습니다. 감사합니다.



DATA & AI

발표: 한선호(Watson Sale Leader, Watson Platform IBM Korea)
동영상에 대한 자막정보
안녕하세요. IBM Watson그룹의 한선호 실장입니다. 브레이크가 너무 없으셔서 제가 좀 기다리고 있는데요. 전체 시간이 있으셔서 그냥 진행을 하겠습니다. 일단 작년에 이어서 또 초대를 해주셔서 감사드립니다. 아마 작년에 제가 망치지는 않았던 것 같아요. 작년에는 제가 아마 기본적으로 AI가 어떤 영역인지에 대한 정리를 다시 한 번 드리고 또 실제 Watson이라는 녀석이 어떻게 활용할 수 있는지를 말씀 드렸던 것 같고요. 올해에는 제 개인적으로는 그런 원론적인 얘기를 계속 말씀드릴 게 아니라 실제 어떻게 적용을 하고 있고 또 여기 계신 분들이 만약에 AI를 한다면 나는 어떤 준비를 해서 하면 되겠다라는 것들을 다른 고객 분들의 목소리를 통해서 고견을 드리는 그런 형태로 진행을 해 보겠습니다. 시간이 많지 않아서 일단 바로 진행을 하겠습니다. 제가 원래 영상 잘 안트는데 밖에 계신 분들 들어오시게 하려고 틀었습니다. 어떠세요? 내용 보시니까 어떤 것 같으세요? 그냥 광고하는 프로모션 같으세요? 어떠셨어요? 자막을 다 무조건 틀어놓도록 하겠습니다. 지금 보셨던 것이 광고가 아니라 실제 Watson이 적용된 케이스들을 다 일일 찍어서 저희가 올해 발표한 내용입니다. 2014년부터 상용화됐던 Watson이 지금 사실 이제는 더 이상 미래기술을 얘기하지 않고요. 아까 잠깐 보셨던 Let's put smart to work이라고 하는 게 새로운 IBM의 슬로건이에요. 제가 2000년에 IBM에 입사해서 처음 받았던 게 E-business Transformation이었고 2007년 오면서 다시 스마트 플래닛이라는 주제로 얘기했고 또 다시 바뀌었습니다. 아마도 저희는 슬로건 자체가 AI, 블록체인, 클라우드라는 얘기를 하고 있지 않아요. 무슨 얘기냐면 세상을 바꾸는 어떤 가치에 대한 value를 가지고 있고 그 뒤에 어떤 기술을 활용할지를 가서 고민하는 회사가 IBM인 것 같고요. 제가 계속 IBM을 다니는 이유인 것도 같아요. 실제로 AI, AI 하나 가지고 뭔가 해결할 수 있는 것 없습니다. 그러니까 AI는 사실은 새로운 음식을 만들 수 있는 MSG 같은 게 될 수 있어요. 미림 같은 게 될 수 있어요. 기존에는 낼 수 없었던 것들을 새롭게 내는 거죠. 결국은 실제로 베이스는 뭐냐면 고객의 경험이에요. 고객이 경험을 어떻게 바꾸느냐. 그 고객이 실제 여기 계신 분들이 도서관에서 업무를 하고 계신 분들, 내부 고객일 수도 있고 외부에 계신 고객 분들이 될 수도 있어요. 그분들이 어떻게 바뀌어가는 경험을 우리가 따라갈 건지에 따라서 사용하는 활용의 수단일 수 있습니다. 그래서 AI는 하나의 주요한 Component인건 맞고요. IBM하면 아마 작년에는 이런 말씀 안 드렸는데 IBM하면 떠오르시는 게 대부분 PC, 하드웨어, 이렇게 많이 이해하실 것 같아서 혹시 IBM이 전 세계에 어느 정도 비즈니스 하는지 궁금하실 것 같아서 그냥 몇 개만 봤어요. 되게 많이 줄었죠. 저희가 보통 130조 정도 계속 했던 회사예요. 2000년 초반, 중반만 해도. 굉장히 많은 숫자가 줄어들었는데요. 실은 그동안 했던 저부가가치의 하드웨어 쪽, PC쪽은 거의 다 매각을 시켰고 실제 지금 하고 있는 코아는 소프트웨어 쪽 알고 계시는 AI, 클라우드 포함한 소프트웨어 쪽, 서비스 쪽이 거의 메인입니다. 되게 많은 회사들을 인수하고 있고 실제로는 한 10%만이 하드웨어 비즈니스예요. 그러니까 되게 작은 Portion이고요. 대부분은 소프트웨어 서비스 드림을 하는 회사이고 사실 많이 안 알려져 있어요. 되게 보수적이기 때문에. 사실 알고 계시는 구글, 아마존, 마이크로소프트처럼 약간 젊어 보이는 느낌이 아니라 사실은 100년 넘은 되게 보수적인 회사의 이미지를 아직 지우지 못하고 있습니다. 실제적으로는 이런 형태의 레코드를 만들고 있고 특히 새로운 기술 영역, 특히 AI 쪽 관련해서는 계속해서 독보적인 랭킹을 가져가고 있습니다. AI을 왜 해야 될까요. 잠깐 Recap을 한번 해볼게요. AI 왜 해야 될까요. 아까 구글에서 되게 중요한 말씀하셨는데 실제로는 이렇습니다. 제가 예시 두 가지를 말씀드릴게요. 의사 분들이 작년에도 한번 말씀드린 것 같은데 신경외과 교수님이 환자를 치료하기 위해서 하루에 읽어야 될 임상논문이 250개입니다. 250개 논문을 읽고 들어가서 환자를 치료해야 사실 도덕적 해이가 없는 거예요. 하지만 현실은 가능하지 않죠. 그러면 최소한 그 많은 내용들의 엑기스라도 발라서 이 분들에게 제공을 해줄 수 있는 게 필요한 거죠. 그러게 여러분들 알고 계신 Watson for Oncology 기반이 됐던 계기이고요. 미국에 있는 세무사가 우리 연말정산 하듯이 할 때 그 해에 떨어지는 새로운 시행규칙이 700건입니다. 그런데 그 모든 세무사가 그것을 다 읽고 세금 신고하는 사람들을 가이드해 주지 않죠. 못하죠. 사람마다의 전문성이 차이가 발생될 수밖에 없고 결국 누군가는 손해를 볼 수밖에 없는 구조도 있습니다. 결국 저희가 보고 있는 것은 뭐냐면 시장에 있는 데이터, 존재하는 데이터의 20%만 갖고 저희가 항상 뭔가를 대응하고 있고 사실 숨어있는 80%의 데이터가 여전히 되게 가치가 있는데도 불구하고 활용하지 못하는 것들, 이유는 뭐냐 하면 제가 기존에 전통적으로 갖고 있는 IT structure는 IT 전문가들만이 이해할 수 있는 언어로 되어 있는 프로그램에 의존해 왔기 때문이에요. 그러면 사람이 이야기할 수 있는 언어, 영상, 소리 같은 것들을 똑같이 활용해서 할 수 있다면 저 80% 중에 또 90% 정도는 활용을 할 수 있을 거라고 보고 AI 중요성을 얘기하고 그래서 AI를 해야 된다고 얘기하는 게 대부분적인 이론입니다. 그런데 AI 플랫폼, 이런 형태로 AI를 도입해서 하는 서비스를 하면 어떤 모양새일까를 한번 질문을 던져보면 많이 보셨죠. 이거 극장가면 광고도 하더라고요. 되게 센세이셔널 했었죠. 현대카드입니다. Watson을 통한 프로젝트로 챗봇을 만들었는데 챗봇이 AI인가요. AI를 우리가 하는 이유가 챗봇인가요. 챗봇 많이 하잖아요. 웬만하면 챗봇 다 하잖아요. 은행권들, 위테일러들 다 챗봇 만들잖아요. 저도 챗봇 프로젝트하고 있고 바깥에도 챗봇이 있는데 챗봇이 우리가 AI를 가는 방향인가요. 저희가 했지만 저희가 되묻는 거예요. 챗봇은 사실은 AI를 하는 목적은 아니에요. 수단입니다. 수단. 그러니까 프로젝트가 목적이 되어서는 안 돼요. 챗봇을 하는 프로젝트 이유는 사실은 고객한테 새로운 채널로 새로운 경험을 주기 위해서 만든 거예요. 우리가 보내주는 웹이나 앱에서 있는 수많은 정보들이 너무 많아서 내가 원하는 정보를 원하는 때에 읽어드릴 수가 없기 때문에 대화형태로 해줄 수 있다면 내가 필요한 정보만 대응을 해줄 수 있겠죠. 그런 새로운 채널을 만든 거고 그 채널 뒤에는 회사가 갖고 있는 혹은 도서관이 갖고 있는 여러 가지 정보들을 훈련시켜서 대응을 할 수 있게끔 하는 거죠. 그러면 사람을 replace하는 거냐. 그건 아닙니다. 실제 여기 계신 분들이 되게 부가가치 있는 일을 하셔야 돼요. 기획력 있는 일을 하셔야 되고 새로운 콘텐츠를 창출하는 일 쪽을 보셔야 되는데 사실 단순한 업무 응대를 하는 것들은 이제 이런 놈들이 하는 거죠. 또 이런 놈들을 하다보면 이 대화 속에서 만들어질 수많은 로그들을 가지고 우리의 고객은 기존에 나한테 전혀 얘기하지 않았던 이런 형태의 의도와 관심이 있구나를 이해하고 그래서 그런 관심을 어떻게 대응할 것인지를 또 서비스를 만드는 거죠. 그게 사실은 저희들이 추구하는 AI의 목적입니다. 그래서 작년에도 말씀드렸지만 잠시 내려 놓으셔야 되는 게 Artificial Intelligence는 아직도 없어요. 누가 있다고 하면 저한테 데려오시면 돼요. Artificial Intelligence 아직까지 Conceptual Technology이고 여전히 사람처럼 알아서 생각하고 창의적으로 뭔가를 create한다든가, 스스로 배워서 그냥 뭔가를 만들어 낼 수 있는 애는 아니에요. 저희는 얘기하는 약자는 같지만 여전히 아직도 올해도 작년에 이어서 올해도 Augmented Intelligence, 지식을 확장하는 겁니다. 저기 어딘가에 누군가 갖고 있는 전문지식을 여기 여러분들이 누구나가 접근성을 가지고 활용할 수 있게끔 도와드리는 게 실제 Augmented Intelligence, AI의 지금 현재 리얼리티라고 보시면 되고 그래서 Augmented Intelligence를 저희가 어떻게 컴퓨팅적으로 얘기하는지를 얘기할 때 Cognitive Computing, 인지 컴퓨팅이라고 얘기를 하고 있습니다. 자세한 얘기는 안할 텐데요. 맨 마지막 것은 중요해서 말씀드리면 결론은 뭐냐면 인간을 복제하지 않아요. 그러니까 사람의 일을 복제하는 건 아니에요. 그 업무를 지원하는 형태로 가는 게 현재 AI 방향이라고 이해하시면 돼요. 잠깐 넘어가겠습니다. 아까 보셨던 내용이고요. 결국은 Watson이 가는 길도 같습니다. Watson이 가는 길도 특정전문영역에 전문가를 지원하는 Advisor를 만드는 거예요. 그래서 보시는 것처럼 유통에 관련된 마케팅 플래너, 관련된 엔니지어, Oncologist 옆에다 두고 이분이 다 읽어드릴 수 없는 것들을 Catch up해서 이분이 의사결정을 빨리 신속하게 최근의 정보를 가지고 그 다음에 가장 Quality있는 의사결정을 할 수 있게끔 양질의 스피드 업하게 최근의 정보를 가지고 할 수 있게끔 도와주는 게 실제 AI 목적이고 Watson의 목표이고 보시는 것처럼 이런 형태로 구현이 되어서 실제 각각의 기업에서 혹은 공공기관에서 운영이 되고 있습니다. 전에도 말씀드렸던 내용인데 계속 바뀌고 있어요. 조금씩 바뀌고 있고 어제도 Legal Tech 있어서 로슨이 나오셨던 것 들으셨던 것 같은데 그게 다시 Watson 기반으로 돼있는 애들이라고 보시면 됩니다. 예시를 하나 보여드릴게요. 데모가 아니고 실제 고객이 쓰시는 화면을 캡쳐한 겁니다. 쭉쭉 흘려보내버릴게요. 느낌만 받으시라고 제가 준비했습니다. 다음은 텍스트만 되냐, 말로도 할 수 있습니다. 대충 감이 오시죠. 지금 보면 제가 첫 번째 말씀드릴게요. 첫 번째, Watson은 무조건 그 고객이 갖고 있는 콘텐츠로 훈련시킵니다. Public Network로 훈련시키지 않아요. 그 고객이 갖고 있는 정보를 가지고 그 고객의 전문가를 키우는 것이기 때문에. 두 번째, Watson은 그 정보를 저희가 가져가지 않습니다. 고객이 가지고 계셔야 되고 고객이 관리하시는 거예요. 별도로 관리하시는 거고 저희들이 요구하지 않습니다. 요구해서 다른 고객한테 쓸 수도 없어요. 왜냐하면 고객마다 갖고 있는 전문성이 다르니까. 저는 잘 모르겠지만 도서관에 공통적인 것도 있겠지만 도서관별로 특화돼있는 게 다르실 거예요. 지역별로 다르실 거고. Watson은 보시는 것처럼 그 전문가의 언어를 가르치기 때문에 그들이 쓰는 용어를 가지고 가르쳐서 거기에 맞는 짧은 문장, 긴 문장 같은 것들 훈련을 시키는 거고 보시는 것처럼 음성이 필요하면 음성, 텍스트면 텍스트, 비주얼이면 비주얼 가지고 영상가지고 합니다. 아까 보셨던 게 호주에 있는 오예기야스 컴퍼니가 실제 Generation Change, 지금 있는 엔지니어들 중에 30년, 25년 되신 분들이 은퇴하면서 그들이 갖고 있는 자산을 어떻게 다음 세대에게 활용시켜줄 건가를 고민해서 만들었던 프로젝트이고 이 프로젝트 이후에 실제 지금 현재 돌아가고 있는 17개 Watson 프로젝트가 돌아가고 있어요. 무슨 얘기냐면 단일 프로젝트로 Watson을 하는 게 아니라 대부분의 고객들은 한번 Watson을 작게 시작해서 사실 다양한 업무영역에 활용을 넓혀 가시는 영역이라고 보시면 될 것 같고요. 아마도 도서관 쪽 관점에서도 보시면 전체를 한 번에 빅뱅을 하시는 것은 불가능하기도 하고 돈도 많이 들고 그렇게 하시면 안 될 거라고 보고 정말 필요하고 효용성 있는 영역이 어딘가를 빨리 찾아서 가는 방식으로 해서 빨리 확장해 나가는, 그것은 결국은 저희들 실제 프로젝트하면 저희가 가르쳐드리는 내용들을 가지고 실제 현업 전공하시는 분들이 운영하시면서 확장을 해 나가시는 과정입니다. 뒤에 설명을 다시 한 번 드리겠습니다. 궁금하신 게 이런 것 같아요. 그런데 글로벌 얘기, 맨날 글로벌 얘기하는데 한국에서 그러면 뭘 했어, 한국에서 뭘 했어라는 말씀 많이 드리는데 실은 혹시 여기 기자 분들 계시면 말 잘못하면 또 기사 나는데 되게 많은 것 했어요. 숫자를 얘기하면 기사가 나서 안 돼요. 많이 했는데 오늘 말씀드릴 수 있는 것은 한 이 정도 수준에서 말씀드릴게요. 아까 보셨던 현대카드 버디라고 해서 카드혜택상담, 카드 관련된 정보, 그 다음에 카드추첨 같은 것들을 하는 것을 하기 위해서 실제 현대카드에서 프로젝트를 하셨고 두 번째는 이름만 들으면 여성분들 다 아실 화장품 회사에서 Conversation Commerce를 하기 위해서 여러 개 브랜드를 대응할 수 있는 뷰티 adviser를 하기 위한 틀을 만들었고요. 지금 운영 중이고 이것은 이미 permit이 됐으니까 롯데그룹에서는 지금 한 3개 정도 프로젝트 따로 따로 가고 있어요. 2개는 이미 끝났고 새로운 것하고 있는데 첫 번째가 전체적인 롯데가 제공하는 제품에 대한 adviser, 쇼핑 adviser 그 다음에 또 하나가 새로운 제품을 만들어내기 전에 고객들이 어떤 소비패턴을 갖는지, 고객들이 어떤 형태의 제품들을 선호하는지를 알아보는 소셜에서 데이터를 긁어서 분석해서 하는 프로젝트를 하고 있습니다. 보시는 것처럼 보험사들도 많이 쓰고 있어요. 보험사들에서 실제 상담사를 지원하는 형태로 쓰이고 고객서비스형태로 쓰이고 때로는 우리 보통 Underwriting이라고 해서 우리가 보험에서 다치거나 보험사에 청구하면 돈 받으시잖아요. 그런데 보험사에서 이게 정말 돈을 줄만한 내용인지 아닌지를 판단하는 과정들을 Watson이 하고 있습니다. 또 잘 아시는 글로벌 전자회사에서 새로운 기술을 트렌드를 분석해 제품개발 기획을 할 때 IB patent를 가지고 searching을 하시거든요. 기존에 썼던 searching엔진, 사실은 너무나 많은 시간을 소요하고 있어서 실제 자연어 기반에 전문지식 training 형태로 활용해 보자 했던 게 IB patent 디스커버리를 하고 계시고요. 또 되게 쉬운 영역 중에 하나인데 헬프 데스크 같은 데도 많이 운영이 되고 있습니다. 그래서 지금 한국은 한국어가 지원이 된지가 이제 2년이 채 안 됐죠. 그 사이에 되게 많은 프로젝트가 일어나고 있고 지금도 거의 진행 중입니다. 대부분 Watson이 쓰이는 영역들은 보시면 크게 3가지 카테고리로 나뉘어요. 첫 번째가 결국은 Engagement, 그러니까 되게 쉽게 서로 대화할 수 있는 Engagement를 만드는데 그게 외부 고객이 될 수도 있고 도서관서비스를 받는 유저가 될 수도 있고 혹은 내부에 계시는 분들이 될 수 있어요. 내부에 계신 분들이 내부업무라든가 혹은 고객을 응대하면서 발생되는 여러 가지 이슈들을 다 외우고 있을 수는 없잖아요. 물론 전문적인 분이신들, 정말 오래 되신 분들 다 머릿속에 딱 있죠. 하지만 Watson이 추구하는 것은 상향평준화된 전문성을 제공해 드리는 거라고 보시면 돼요. 두 번째가 Process Automation 입니다. Process Automation은 자동화해서 사람을 뺏는다는 의미가 아니고요. 사람들이 단순반복적인 업무로 많은 시간을 뺏기는 영역들을 찾아서 부분적인 자동화를 합니다. 예를 들면 문서를 분류한다든가, 어떤 책의 특성들을 분류해 나갈 수도 있는 거죠. Context를 읽고 분류해 나갑니다. 그런데 여기서 문제는 이렇게 말씀드리면 기존에 검색엔진 분류랑 뭐가 다르냐고 말씀하시는데 키워드베이스가 아니에요. 그래서 문맥을 가지고 하는 형태기 때문에 그 키워드가 그 문서에 있지 않더라도 문맥적으로 그 내용이면 그렇게 분류를 해 나가는 형태로 트레이닝을 시키고 활용을 한다고 보시면 돼요. 맨 마지막에 Insight입니다. 수많은 데이터들 중에서 나한테 필요한 여러 특정정보만을 발췌해 내서 그 발췌한 정보를 가지고 어떻게 활용할건지 전문가에게 제공하는 형태. 그래서 크게 보면 Engage하고 자동화하고 Insight를 제공하는 그 세 틀에서 현재는 많이 활용되고 있다고 보시면 되겠어요. 잠깐 넘어갈게요. 작년에 제가 이것하고 말씀드렸는데 80% 이상입니다. 아마 실제로 대부분의 분들이 고민하고 있고 계획하고 있고 추진을 하고 계신다고 보시면 되고요. 이제는 AI 프로젝트 한다 그러면 새로운 것 한 거야. 이런 생각보다는 어떻게 하면 이것을 장기적으로 잘 끌어갈 수 있을지 고민하시는 때가 현재 시점이 아닌가 싶어요. 뉴 테크놀로지 파일럿, 이런 개념으로 보실 이유는 없을 것 같아요. 이제부터는 제가 살아있는 것 말씀드릴게요. 저희가 작년 말에 Early adopter, 실제 First mover로 Watson을 도입하신 고객 분들한테 쓴 소리를 듣는 콘퍼런스를 했어요. 대부분의 IBM Watson행사는 사실 저희들이 뭔가 기술적인 것들을 고객 분들에게 전달해 드리는 마치 오늘처럼 하는 세션이었는데 트렌드를 바꿨어요. 그래서 Watson 고객들한테 고객 분들이 고객 분들한테 전달을 하는 그런 세션을 했었고 거기서 나왔던 얘기들을 요약했습니다. 그 요약 전에 하나 말씀드릴 게 Watson을 그러면 어떻게 잘 활용하는지에 대해서 저희 practice를 말씀드리고 뒤에 설명을 드릴게요. 첫 번째는 Think Big이에요. Build Big이 아니에요. 우리 빅이란 30억, 40억, 100억짜리 프로젝트를 AI 하자, 이런 게 아니라요. 우리가 가야 될 여정이 어딘지를 한번 그려보는 게 Think Big입니다. Think Big 하면 예를 들면 저거 전통적인 컨설팅 프로젝트 몇 개월짜리 하는 거 아니야? 이렇게 생각하시는 게 아니라 그게 아니라 정말 짧은 시간 1~2주 안에 이 프로젝트를 어떻게 한번 끌어가볼지를 전이를 잡는 여정을 잡는 형태의 Think Big입니다. 왜하냐. 얘는 살아있는 놈이에요. 왜냐하면 내가 가르치는 만큼 서비스하잖아요. 그런데 가르치는 정보는 계속 바뀌죠. 바뀌면 계속 가르치게 되잖아요. 그래서 프로젝트가 그냥 One Shot build 하는 건 없어요. 얘는 계속해서 가르쳐요. 누군가가 가르치는 프로젝트, 끝나지 않아요. 끝나지 않기 때문에 여정 베이스로 가야 되고 그러면 우리가 여정에 대한 큰 길을 정리해 놓고 가는 형태로 가게 돼요. 그런데 시작은 되게 작게 해야 돼요 보통 Watson을 하는 고객 분들이 처음에 얘기하시는 건 이것도 되어야 되고 저것도 되어야 되고 혹은 새로운 사업을 계획하고 있는데 이거 Watson를 해보자 하는 경우가 많아요. 그런 경우 거의 대부분 폭망이에요. 실은 이미 하고 있는 업무 중에 우리가 좀 알고 있는 그러니까 잘 가르쳐줄 수 있는 콘텐츠가 풍부한 영역들을 먼저 해 보고 효용성을 검토한 다음에 다른 영역에 해보는 게 맞고요. 그래서 첫 번째 스타트 프로젝트가 성공을 하게 만들고 나서 스케일을 되게 빨리 가져갑니다. 보통 국내에 도입했던 고객 분들이 첫 프로젝트하고 나서 그 다음 다음, 그래서 보통 5차, 6차, 이런 식으로 가는 형태고 지금 사실 글로벌 트렌드가 아니라 국내에 똑같이 가고 계세요. 그래서 다시 한 번 말씀드리면 AI는 Watson 안하셔도 좋습니다. 어떤 AI을 하시든 일단 Think Big을 하시고 스타트는 되게 작게 해보시고 그 다음에 스케일을 어떻게 빨리 갈지를 고민하시는 이 3개 Best Practice가 거의 지금까지 국내 프로젝트에 모두 적용이 됐고 사실 성공리에 약속된 시간에 다 Deploy가 됐어요. 그건 꼭 마음에 두시면 될 것 같고요. 두 번째 Practice는 얘는 사면 알아서 다 해주 겠지는 없어요. 제가 이런 말하면 우리 테크 팀이 저한테 죽일라그러는데 얘는 깡통이에요. 가다다라마바사, ABCD는 아는데 일반적인 시장의 용어는 아는데 중요한 것은 여러분들이 쓰려고 가르치는 말과 지식은 가르치셔야 돼요. 그래서 마치 신입사원 하나 뽑으신 거예요. 신입사원이 뭐 아나요? 아무 것도 모르죠. 화장실 어딘지, 몇 층에 뭐가 있는지 아무 것도 모르죠. 가르치시는 거예요. 그래서 가르치셔서 얘가 한 업무에 통달하게끔 만들어 놓고 그 다음에 그 다음 업무를 주시는 거예요. 그래서 마치 새로운 직원을 하나 고용해서 쓰시는 것과 같은 맥락으로 Watson으로 고민하시는 게 필요합니다. 아까 Long 전이 말씀드렸는데 Long 전이 하면 이렇게 생각하세요. 야, 그러면 너희들이 프로젝트 해놓고 계속, 계속, 계속 하겠다는 거잖아. 저희 그렇게 하면 할 수가 없어요. 보시는 것처럼 저희가 어떻게 구현하는지 첫 단계 프로젝트를 해서 보여드려요. 그런데 그 다음부터는 고객 분들이 하세요. 아까 보셨던 현대카드, Cosmetic 회사, 보셨던 롯데, 저희 팀들은 정말 한 달에 한번 들어가서 문제 있는 것만 지원해 드리고 나옵니다. 고객 현업들이 다 관리하세요. 얘는 IT guy가 하는 툴이 아니에요. 현업들이 내가 이런 지식이니까 이거 배워. 알려주는 툴이에요. 그래서 실제로 현업 분들이 하시는 거고 처음에 초기 어떻게 하는지를 가르쳐드리고 그 다음부터는 사실 고객 분들이 전이를 만들어 가시는 경우가 더 많습니다. 그래서 Practice 기억하시죠. 이것은 꼭 Watson의 Practice라고 보시지 말고요. 어떤 회의를 하시든 간에 이 Practice를 꼭 기억해주시면 많이 도움이 되실 것 같습니다. 왜냐하면 저희가 상용화를 제일 많이 해봤잖아요. 상용화를 많이 해 봤는데 성공만 하지 않았어요. 실패를 되게 많이 했어요. 정말 실패를 많이 했어요. 실패하면서 다행이었던 건 고객 분이 떠나지 않으셨어요. 그래서 다시 저희가 들어가서 프로젝트를 성공리에 마무리한 케이스가 많았고 그 수많은 프로젝트를 통해서 얻었던 저희들 Lesson learning 그래서 이것은 꼭 한번 활용해 보시면 좋을 것 같아요. 이제 고객분들 후기를 같이 들어보겠습니다. AI 도입, 지금이 적기일까요. 여기 동의하시는 분 손들어 봐주세요. 동의하시는 분? 나도 이런 고민 있다. 다 적기라고 생각하시는 거예요? 훌륭하십니다. 그냥 말을 제가 고치지 않았어요. 쓰시는 말 그대로 타이핑한 거예요. 일단 의심을 하지 말자. 고민하는 시간에 그냥 일단 작게 해보자. 돈을 많이 들이지 않아도 좋으니까 작게 해보자. 작게 해보면 실제 해보신 분과 안 해보신 분으로 갈리는데 제일 중요한 건 뭐가 되고 뭐가 안 되는지를 판단하세요. 그때 거창하게 수억 예산을 잡아서 하실 필요 없습니다. 그냥 작은 형태로 작게 이것을 핸드링할 수 있는 작은 업체와 아주 작은 기간 안에 해보실 수 있어요. 어떤 솔루션으로 해야 하는 게 제일 좋겠느냐. 사실 제일 많이 고민하시죠. 세상에 AI라는 솔루션들은 너무 많고 내가 이 업체를 선택한 기준이 되게 명확해야 되니까 특히 도서관은 더 그러실 것 같고요. 고객 분들의 답변, 사실은 솔루션의 문제가 아니에요. 그러니까 어떤 형태로 아까 말씀드렸지만 어떤 AI를 쓰셔도 좋아요. 중요한 건 프로젝트를 위해서 하지 마세요. 이 프로젝트를 내가 해야 돼라는 미션으로는 하지 않으셨으면 좋겠어요. 그러면 망해요. 문제는 뭐냐면 내부의 사용자든, 외부의 고객이든 그들이 요구하는 경험의 변화가 있을 때 하시는 게 좋아요. 그래야 그 결과가 의미가 있습니다. 그래야 그 다음을 할 수 있어요. 일반적으로 무조건 프로젝트를 하잖아요. 그러면 망해요. 아까 현대카드 프로젝트가 망했어요. 이것은 그냥 오프더레코드, 첫 번째 프로젝트가 망했어요. 왜 망했느냐. 챗봇을 한다고 하니까 고객 분들이 이렇게 얘기하세요. 왜 챗봇을 하십니까? 제가 물어봤더니 콜센터 상담을 줄이기 위함이에요. 상담원을 왜 줄이세요? 우리 회사가 전체적으로 힘드니까 사람을 줄여야지. 안 줄을 걸요. 아, 줄여야 돼. 시작했어요. 첫 프로젝트에서 얘를 트레이닝 시키는 콘텐츠가 뭐였냐면 그동안의 녹취록입니다, 녹취록. 녹취록 갖다가 막 훈련을 시켰어요. 됐을까요, 안 됐을까요? 안 되죠. 여러분들 전화로 고객 상담사하고 통화하실 때랑 여기 다 고객이시잖아요. 예를 들면 쿠팡에 전화를 하셨어요. 전화를 하실 때랑 메시지 쓸 때랑 같으세요? 다르시잖아요. 망했어요. 그래서 이제는 뭐로 하냐면 라이브챗을 해가지고 고객들한테 보냅니다. 일과시간에. 챗을 모아요. 보냈어요. 어떻게 됐을까요. 망했어요. 왜냐하면 Affordance라는 어려운 용어인데 우리의 행태 Affordance라는 게 달라요. 여러분들 카카오톡 친구들하고 보내실 때 PC로 할 때랑 핸드폰으로 할 때 메시지 하는 게 다르죠. 그래서 달라요. 그래서 망했어요. 그래서 둘 다 해야 되는 거예요. 모바일로도 모으고 데스크톱 형태로도 모아서 그것을 가지고 훈련시키는 거예요. 왜냐하면 얘는 말을 배우는 애잖아요. 그래서 가르치고 그래서 성공했어요. 그런데 중요한 건 이분들이 그래서 오픈하고 난 다음에 사람을 줄였느냐, 줄이긴 줄였어요. 한 10% 정도 줄일 수 있었어요. 그런데 고객의 선택은 10%은 안 줄였어요. 그분들을 데려다가 다시 얘를 가르치자. 왜냐하면 현대카드에 대한 고객의 만족도가 막 치고 올라갔거든요. 그래서 사람을 줄이는 게 아니라 새로운 형태의 업무들을 만들어서 계속 활용을 하고 계십니다. 그래서 경험에 바탕을 하셔야 돼요. 이것은 깨알자랑은 안하고 넘어가겠습니다. 일단 Watson은 현업이 수행하시는 거고 고객데이터 가져갑니다. 어떻게 프로젝트하면 좋은지에 대한 설명을 제일 많이 하셨어요. 아까 말씀드렸으니까 그냥 다시 한 번 remind만 드릴게요. 작게 시작하세요. 새로운 것 하지 마시고 이미 하고 있는 것 중에 아주 작은 것 하나. 그다음에 얘가 어떻게 돌아가는지 이해하시고 나서 그다음에 더 많은 아이디어를 집어넣으셔도 늦지 않습니다. 제일 중요한 겁니다. 프로젝트 하시면 내부이해관계자들하고 문제가 제일 많습니다. 저는 고객 분들하고 말씀 나눌 때 기대수준을 매우 낮춰요. 왜냐하면 낮춰놓고 시작하면서 우리가 새로운 걸 만들어서 서로가 아, 이것도 했어. 저것도 했어. 할 수 있는 것처럼 맞추거든요. 그런데 여기 계신 분들도 마찬가지예요 너무 기대수준을 높이지 마시고요. 낮춰놓은 상태에서 사실 조금씩 더 해보시는 형태로 AI 하시는 게 맞습니다. 왜냐하면 나의 readiness가 어디 있는지 여기 계신 분들 아직 모르세요. 저희가 하면서 얻게 되는 경우가 더 많습니다. 이렇게 하나 예시만 들게요. 시간 별로 없지만. 아까 롯데 것 보셨지만 롯데가 쇼핑 adviser 가장 첫 번째가 apparel 의류를 했어요. 그냥 한 거예요, 프로젝트하기 위해서. 그런데 하고 났더니 고객들이 complain 더 많아졌어요. 왜 많아졌냐면 이렇게 치는 거죠. 남자들한테 가장 트렌디한 자켓 소개 추천해줘. 그러면 화면에 야상이 나와요. 아웃도어, 쫙 나와요. 고객이 당황하겠죠. 왜 그랬을까요. 롯데닷컴에서 파는 apparel 남성의류 중에 70%가 아웃도어예요. 내가 실제 갖고 있는 비즈니스의 내용, 그다음에 고객들이 의류를 선호하는 Targeting을 몰랐던 거예요. 이해가시죠. 좁혀보셔야 돼요. 내가 뭘 갖고 있는지를 알고 거기서 작게 시작하는 것이 되게 중요한 포인트입니다. 여기까지가 제가 말씀드린 것 시간 다 됐었죠. (초과했습니다.) 끝났나요? 긴 시간 너무 감사드리고 혹시 저한테 질문 있으시면 제가 여기 남아있을 거니까요. 따로 말씀주시면 답변 드리겠습니다. 감사합니다.