메뉴 건너뛰기



도서목록

분야별도서검색

분야별도서검색 경영학 회계학 무역학 경제학 관광학 통계학 전산정보학 비서학 문헌정보 일반교양

도서상세검색

분야별도서

현재 페이지 위치 : Home > 도서목록 > 분야별도서 > 전산정보학
도서수 38 (2/8 page)
4차 산업혁명 시대의 창의적인 IT경영론
  • 저자 : 임춘성 장기진
  • 판형 : 4X6배판
  • 페이지수 : 574p
  • 가격 : 28,000원
머리말 우리는 현대사회를 살아가면서 가장 주목할 만한 기술혁명인 인터넷혁명과 모바일혁명을 목격하였다. 인터넷혁명과 모바일혁명은 우리의 삶과 행동, 취미, 커뮤니티활동 등을 변화시켰을 뿐만 아니라 4차 산업혁명을 더욱 빠르게 진전시키고 있다. 전통적인 굴뚝산업중심이었던 산업사회가 어느덧 지식과 정보가 중심이 되는 4차 산업혁명 시대로 급속하게 변화가 진행되고 있다. 이러한 변화에 맞추어 정부, 공공기관, 기업, 사회의 모든 분야에서 생존과 번영을 위한 미래 발전의 선점에 동분서주하고 있다. 4차 산업혁명은 다양한 센서와 유·무선통신망을 통하여 인간과 인간, 인간과 사물, 사물과 사물이 상호 연결하여 각종 정보를 교환하면서 사물인터넷(IoT), 지능형 로봇, 인공지능, 나노기술, 양자 컴퓨팅, 생명공학, 3D 프린팅, 자율차량 및 모빌리티, 블록체인, 클라우드 등을 비롯한 여러 분야에서 새로운 기술혁신을 추구하면서 초연결성과 초지능사회, 탈중앙화와 분권화, 공유와 개방을 통한 지능화세계를 지향한다. 수십억 명의 사람들을 계속해서 웹에 연결하고 비즈니스와 조직의 효율성을 획기적으로 향상시키며 더 나은 자산관리를 통해 자연환경을 재생산할 수 있는 커다란 잠재력을 가지고 있다. 4차 산업혁명사회에서 정보기술(IT)이 기업 생존에 절대적인 기본 인프라로 자리매김하면서 IT경영론을 바라보는 관점이 더 이상 선택이 아닌 필수과목으로, 더 이상 비용이 아닌 수익을 창출하는 기회요소로 부각되었다. 즉 4차 산업혁명사회에 인식의 대전환이 요구되고 있다. 정보기술(IT)과 경영(business)과의 결합이 기본 인프라가 되고 있는 것이다. 그 대표적인 것 중 비즈니스모델(사업형)이 기업에서 각광받고 있다. 비즈니스모델은 정보기술과 더불어 기업업무, 제품 및 서 비스의 전달방법, 이윤을 창출하는 방법을 나타낸 모형이다. 즉 기업이 지속적으로 이윤을 창출하기 위해 제품 및 서비스를 생산·관리·판매하는 방법을 나타낸 모형이다. 또 비즈니스모델은 제품이나 서비스를 소비자에게 어떻게 제공하고 마케팅하며, 돈을 벌 것인지 계획하는 사업 아이디어를 말한다. 과거 기업형태는 기술만이 사업 성공의 요건으로 보았지만 현재의 상황에서는 정보기술이 기본이 되면서 고객가치와 이익을 창출하는 새로운 방법론이 각광을 받고 있다. 이와 같은 4차 산업혁명 시대의 창의적인 IT경영론은 기술기반하에 새로운 환경의 비즈니스 응용에 대하여 학습하고자 한다. 창의적이라는 의미는 완전히 새로운 것을 만드는 것이 아니라 기존의 아이디어를 결합해 새로운 것으로 탈바꿈시키는 것이다. 이것이 혁신, 즉 이노베이션이 추구하는 것이다. 따라서 본서는 이를 대비하기 위하여 IT경영론을 접하는 독자들에게 미래 정보기술환경과 4차 산업혁명의 의미와 새로운 비즈니스모델전략, IT경영 인프라, IT의 비즈니스 응용과 차세대 미래기술을 쉽게 이해하도록 구성하였다. 본서의 구성은 크게 네 부문으로 구성되어 있다. 제1부에서는 미래 정보기술환경과 4차 산업혁명의 의미를 소개한다. 정보기술환경과 4차 산업혁명의 의미, 데이터, 정보와 지식, 빅데이터에 대한 이해, 경영혁신과 새로운 비즈니스모델전략에 대하여 소개한다. 제2부에서는 IT경영 인프라에 대하여 소개한다. 컴퓨터의 이론과 정보통신과 네트워크, 인터넷과 모바일, 클라우드 컴퓨팅, 인터넷과 비즈니스 관련 기술에 대하여 소개한다. 제3부에서는 IT의 비즈니스 응용을 다룬다. 기업환경과 정보전략, IT경영과 경영정보시스템, 문제해결과 경영의사결정, 전자상거래와 e-비즈니스, 기업환경에서의 정보시스템을 소개한다. 제4부에서는 차세대 IT 응용기술(센서, 칩, 위치정보, 딥러닝과 인공지능, 로봇, 증강현실과 가상현실, 자율주행차, 3D 프린팅, 헬스케어, 블록체인)들을 소개한다. 본서는 저자들이 대학에서 경영정보관리 및 기술을 연구하는 동안 다수의 프로젝트 경험과 여러 학기에 걸쳐 정보기술 관련 과목을 강의하면서 준비한 자료와 결과를 정리한 책이다. 특히 관련 자료들은 공공기관, 산업체에서 강의한 내용도 포함되어 있고 이론보다는 실무적인 내용을 강화하였으며, 정보기술(IT)에 대한 이론적인 기반이 없는 독자들을 위하여 기초부터 쉽게 설명하도록 구성하였다. 가급적 책 구성에 그림과 표를 많이 제시하여 이해에 도움을 주도록 하였다. 아무쪼록 본서가 경영에서의 정보기술 활용에 대한 기본서로서 이용되기를 저자들은 바랄 뿐이다. 그리고 빠른 시일 내에 내용을 수정·보완한 개정증보판을 발간할 것을 약속드리며, 독자들의 비평을 기대한다. 끝으로 부족한 저자들이 이 책을 완성하기까지에는 실로 여러 사람들의 헌신적인 도움이 컸다. 특히 각 대학 교수님들의 배려과 격려는 저자들에게 큰 힘이 되었다. 또한 어려운 출판환경에서도 여러 가지 지원을 해주신 도서출판 청람의 이수영 대표님과 직원 여러분께 감사의 말씀을 드리고자 한다. 2020년 2월 임춘성·장기진
소셜네트워크분석 제2판
  • 저자 : 곽기영
  • 판형 : 국배변형판
  • 페이지수 : 702p
  • 가격 : 35,000원
머리말 오늘날 우리는 네트워크 사회에 살고 있다. 세상의 많은 것들이 네트워크로 연결되어 있고 네트워크로 표현될 수 있다. 페이스북의 친구관계뿐만 아니라 국가 간 교역관계도 일종의 네트워크이며, 특허의 인용관계나 기업의 지분투자관계도 네트워크이다. 또한 질병을 유발하는 유전자 간의 관계나 페렴의 전염 과정도 네트워크로 설명할 수 있다. 네트워크는 이처럼 다양한 시스템을 움직이는 핵심적 환경을 제공하고 있기 때문에 네트워크에 대한 분석은 네트워크 구성요소 간 상호의존성의 이해를 통해 시스템 전체의 효율성 및 효과성을 증진하는 중요한 해결책을 제시할 수 있다. 소셜네트워크분석은 사회학, 경제학, 경영학을 비롯한 사회과학 분야에서뿐만 아니라 물리학, 의학, 생물학 등의 자연과학 분야에서도 최근 많은 주목을 받고 있다. 또한 정보통신기술 및 인터넷서비스의 발달로 인한 데이터의 증가 및 축적은 실무적으로도 네트워크 데이터의 활용 기회를 증대시키고 있다. 이 책은 네트워크로 표현된 다양한 현상 및 문제를 분석하고 이해하기 위한 소셜네트워크분석의 관점 및 기법을 소개한다. 이 책은 다음과 같은 특징을 갖는다. 첫째, 소셜네트워크분석의 이론적 설명과 실무적 응용이 서로 균형을 이룰 수 있도록 내용을 구하였다. 다양한 네트워크분석 지표에 대한 이론적 설명을 바탕으로 네트워크분석 절차를 체계적으로 이해할 수 있도록 하였으며, 이를 실무적으로 활용할 수 있도록 하였다. 모든 설명에는 예제를 함께 제시하여 독자들이 소셜네트워크분석 기법을 이해하고 실제로 활용할 때 어려움이 없도록 하였다. 예제를 보여줄 수 없는 설명은 가능한 언급을 피하였다. 둘째, 각 장의 끝에는 사례연구와 연습문제를 수록하여 본문에서 학습한 내용을 스스로 점검할 수 있도록 하였다. 사례연구를 통해 가상의 상황이 아닌 실제 네트워크 데이터를 사용한 소셜네트워크분석 기법의 응용사례를 접할 수 있도록 하였다. 연습문제에는 설명의 흐름상 본문에서 직접 다루기 어렵거나, 추가적인 설명이 필요한 내용을 포함시킴으로써 연습문제가 또 하나의 본문 역할을 할 수 있도록 하였다. 셋째, 네트워크분석 소프트웨어를 이용하여 소셜네트워크분석을 수행하는 절차를 학습할 수 있도록 하였다. 소셜네트워크분석 기법을 연구 및 업무에 효과적으로 적용하기 위해서는 네트워크분석을 위한 소프트웨어의 사용이 불가피하다. 따라서 네트워크분석 소프트웨어의 활용법을 익히는 것은 소셜네트워크분석을 이해하고 활용하는 데 있어서 매우 중요하다. 현재 소셜네트워크분석 분야에서는 UCINET, Gephi, NodeXL, NetMiner, Pajek 등 다양한 네트워크분석 소프트웨어들이 널리 사용되고 있다. 이 책에서는 상대적으로 많은 사용자를 확보하고 있는 UCINET을 중심으로 소셜네트워크분석 기법을 설명하였고, 나머지 소프트웨어들(Gephi, NodeXL, NetMiner, Pajek)은 네트워크의 시각화 주제를 다루면서 주요 기능을 살펴보는 것으로 소개를 대신하였다. 각 장의 후반부에는 UCINET 활용방법을 자세히 기술하여 독자 스스로 네트워크분석 도구를 활용할 수 있도록 하였다. 또한 UCINET에 대한 사용 설명과 UCINET을 이용한 데이터 입력방법을 별도로 부록에 포함시켜 독자가 이를 간단한 매뉴얼로서 사용할 수 있도록 하였다. 이 책이 집필되고 출간되기까지는 많은 사람들의 도움이 있었다. 이 책에 포함된 사례연구의 일부는 학생들과 함께 논문 작성과 과제 수행을 하면서 수집한 데이터를 기반으로 하였다. 도서출판 청람의 이수영 대표는 이 책이 출판될 수 있도록 아낌없는 지원을 하였으며, 편집부는 편집과 관련된 전문적 의견을 제시하여 필자가 내용을 가다듬는 데 보다 집중할 수 있도록 도움을 주었다. 집필 과정에서 의지할 수 있는 가족이 없었다면 이 책의 출간은 더욱 오랜 시간이 걸렸을지도 모른다. 끝으로 아내와 아들, 딸에게 고마움을 전한다. 2017년 3월 곽기영
엑셀과 액세스를 활용한 경영정보처리 제2판
  • 저자 : 김종기 김진성
  • 판형 : 4X6배판
  • 페이지수 : 566p
  • 가격 : 25,000원
머리말 정보사회가 도래함에 따라 사회 전반에 다양한 변화가 나타나고 있다. 증기기관의 발명이 산업혁명을 초래하는 계기가 되었듯이 PC와 인터넷은 정보혁명을 가능하게 하는 원동력의 역할을 하였다. PC의 보급은 정보의 생산과 소비의 주체가 확연히 구분되던 이전과 달리 누구나가 생산자이면서 소비자가 될 수 있는 가능성을 열어 놓았다. 인터넷의 급격한 확산은 생산된 정보가 시공간의 장애 없이 원활히 유통될 수 있도록 하였다. PC가 극소수의 취미 대상에서 지식근로자에게 없어서는 안될 필요불가결한 도구로 자리매김할 수 있었던 것은 바로 사용하기 편리한 여러 응용 프로그램들이 개발되었기 때문이다. 그 중에서 엑셀과 같은 스프레드시트 프로그램의 등장은 PC의 수요를 폭발적으로 확대하는 계기가 되었다. 지식근로자가 직접 PC를 이용하여 업무처리에 유용하게 사용되는 정보의 밑바탕이 되는 데이터를 처리하고 분석하는 작업을 보다 효율적으로 수행할 수 있게 됨에 따라 PC에 기반한 범용 응용 프로그램은 지식근로자의 생산성 향상을 위한 필수적인 도구가 되었으며, 지식근로자의 작업 방식에 근본적인 변화를 초래하였다. 정보화 소양을 함양하는 것이 정보사회의 구성원이 가져야 할 기본적인 자질이라는 믿음은 대학에서 응용 소프트웨어를 다루는 과목을 개설하게 하였고, 상경계열 뿐만 아니라 다양한 전공의 심화과정을 이수하는 데 필요한 기초적인 정보처리 능력을 배양하도록 요구하게 되었다. PC에서 활용할 수 있는 다양한 응용 소프트웨어 중에서 이 책에서는 스프레드시트와 데이터베이스관리 소프트웨어를 다룬다. 이 두 소프트웨어는 방대한 데이터를 체계적으로 관리하고 분석하기 위한 매우 다양하고 유용한 기능을 제공한다는 공통점을 가지고 있다. 따라서 스프레드시트와 데이터베이스 관리 소프트웨어는 지식근로자에게 필요한 데이터 분석능력을 배양하고자 하는 이 책의 집필목적에 부합한 소프트웨어이다. 이 책에서는 데이터 분석기능을 제공하는 PC용 응용 소프트웨어 중에서 현재 가장 널리 사용되고 있는 마이크로소프트사의 오피스에 포함된 엑셀과 액세스라는 프로그램을 다룬다. 이 두 소프트웨어는 상당히 긴 개발역사를 가지고 있을 뿐만 아니라 오랜 기간 축적된 매우 다양하고 방대한 기능을 가지고 있어 이 두 소프트웨어를 배우고자 하는 학습자에게는 보다 체계적이고 효율적인 학습 방식이 요구된다. 특히 데이터베이스관리 소프트웨어는 데이터베이스의 분석과 설계에 대한 기본적인 지식 없이는 적절히 활용하기 어렵기 때문에 이 책에서는 각 소프트웨어가 제공하는 분석기능에 대한 학습자의 이해를 돕고자 개념 설명과 함께 예제를 통한 직접적인 소프트웨어 활용 절차를 다루고 있다. 마지막으로 어려운 여건 속에서도 이 책의 출간을 위해 노력해 주신 도서출판 청람의 이수영 대표를 비롯한 임직원들께 심심한 감사의 말씀을 전한다. 2012년 12월 김종기
창의적 문제해결과 의사결정
  • 저자 : 김상수 김영천
  • 판형 : 4X6배판
  • 페이지수 : 286p
  • 가격 : 22,000원
서문 창의적 문제해결 능력은 기업 경쟁력의 핵심 기업 경영 활동은 연속적인 문제해결과 의사결정으로 구성되어 있다. 이들 문제들을 어떻게 해결하느냐에 따라서 기업 경쟁력이 결정되기 때문에 창의적 문제해결과 의사결정 능력은 기업 경쟁력의 핵심이다. 기업에서 필요로 하는 창의적 문제해결 능력이란 환경 변화 속에서 발생하는 숨어 있는 문제와 새로운 기회를 찾고, 과학적으로 분석하고, 창의적인 아이디어를 만들어내고, 예상되는 결과와 위험을 정확하게 추정하고, 효율적으로 추진해서 가치를 창출하는 능력을 의미한다. 이처럼 문제를 해결해서 가치를 창출하는 창의적 문제해결과 의사결정 능력을 갖추기 위해서는 전문성, 합리성, 창의성, 능동성이 필요하다. 앞으로 우리가 살고 있는 사회가 어떤 방향으로 어떤 모습으로 변화할 지를 정확하게 예측하기는 힘들다. 그러나 분명한 사실 중 하나는 미래 사회는 더욱 빠르게 변화하고, 더욱 복잡해지고, 더욱 융합화 되고, 더욱 지능화 되고, 더욱 다양화될 것이다. 이 같은 사회 변화에 따라서 기업의 경영 환경도 혁명적 수준으로 급격하게 변화하고 있다. 급격한 경영 환경 변화 속에서 기업들이 생존하고 성장하기 위해서 창조적 혁신을 해야 하는데, 창조적 혁신의 핵심 동력은 기업 임직원들의 창의적 문제해결과 의사결정 능력이다. 흔히 창의적 문제해결과 의사결정 능력은 경영자나 일부 관리자들만 갖추어야 할 능력이라고 생각하기 쉬운데, 이는 잘 못된 생각이다. 최근에 기업 경영 환경이 급변하면서 과거에 경험하지 못한 새로운 문제와 기회가 수없이 등장하고 있기 때문에 기업 모든 임직원(경영진, 관리자, 현장 실무자)들이 각 영역에서 이들 문제들을 스스로 찾아내어서 해결해야 한다. 그러므로 모든 기업 임직원들은 복잡한 문제들과 기회들을 합리적으로, 창의적으로 해결할 수 있는 창의적 문제해결과 의사결정 능력을 갖추어야 한다. 다만 경영자와 관리자가 복잡한 문제와 기회들을 더 많이 부딪히고 해결해야 한다는 차이가 있을 뿐이다. 창의적 문제해결 방법론: Biz-Solver 방법론 기업과 사회에서 창의성 혹은 창의적 문제해결 능력을 갖춘 인재를 원하고 있으나 이에 대한 연구 및 교육 프로그램은 상대적으로 부족하다. 따라서 필자는 지난 수년간 기업에서 필요로 하는 창의적 문제해결과 의사결정 방법론을 연구해 왔다. 기존의 많은 학자들과 컨설팅 회사에서 개발한 창의적 문제해결 방법론을 비교 분석해 본 결과, 각자 나름대로 장점과 단점들을 가지고 있었다. 또한 창의적 문제해결 기법 250여개 및 500여개의 사례들을 분석해서 이들 기법 및 사례들의 공통점과 차이점을 분석해 보았다. 그 결과, 기업의 경영자와 관리자들이 경영 활동 과정에서 부딪히는 다양한 문제들과 기회들을 체계적으로 해결할 수 있는 방법론이 필요하다고 보고, 창의적 문제해결 방법론인 Biz-Solver를 개발하였다. Biz-Solver 방법론은 기업의 복잡한 문제를 해결하기 위해서는 문제해결과 의사결정 모든 단계에서 전문성, 합리성, 창의성이 융합되어야 한다고 보고, 문제해결과 의사결정 수행하는 과정을 문제와 기회의 탐색, 문제와 기회의 특성 분석, 문제와 기회의 결정, 창의적 아이디어 개발, 아이디어의 결과 추정, 아이디어의 평가와 선택, 아이디어 실행의 7 단계로 분류하였다. 또한 Biz-Solver 방법론에서는 의사결정 이론과 경영학 이론을 융합시켜서 문제해결과 의사결정의 7 단계에서 수행해야 하는 주요 활동들을 체크리스트 형태로 제시하였다. 뿐만 아니라 문제해결과 의사결정의 7 단계에서 활용할 수 있는 문제해결 기법들을 체계적으로 제공하였다. - 책의 구성 - 창의적 문제해결 방법론 Biz-Solver에 논리적 기초를 두고, 집필된 본서는 2부 10장으로 구성되어 있다. 제1부 “문제해결과 의사결정의 이해”는 3장으로 구성되어 있다. 1장 “문제해결과의사결정의 특성”에서는 문제해결과 의사결정의 중요성, 문제해결과 의사결정의 유형, 문제해결과 의사결정의 조건, 문제해결과 의사결정의 네 단계로 구성되어 있다. 2장 “기업 문제해결과 의사결정의 특성”에서는 기업의 의사결정 분류 및 전략적 의사결정의 특성에 대해서 논의하고 있다. 3장 “창의적 문제해결과 의사결정 능력의 특성”에서는 창의적 문제해결과 의사결정 능력의 중요성, 창의적 문제해결 능력의 향상 방법, 창의적 문제해결 방법론:Biz-Solver에 대해서 논의하고 있다. 제2부 “문제해결과 의사결정 7단계 Biz-Solver"에서는 문제해결과 의사결정의 7 단계에 맞추어서 7장으로 구성되어 있다. 각 장에서는 문제해결과 의사결정의 각 단계별로 수행해야 하는 주요 활동을 자세하게 설명하고 있다. 또한 각 장에서는 문제해결과 의사결정의 각 단계에서 활용할 수 있는 62개의 문제해결 기법들을 제시하고 있다. 감사의 마음 마지막으로 “창의적 문제해결과 의사결정”이 2006년 2판을 거쳐서, 2011년 새로운 개정판을 만드는데 많은 도움을 주신 분들에게 이 지면을 빌어서 감사의 마음을 전하고 싶다. 제일 먼저, 이 책을 구입해서 읽고 계시는 독자 여러분에게 감사의 말씀을 드리고 싶다. 창의적 문제해결과 의사결정 분야에 대한 독자 여러분들의 관심이 없었다면 이 책은 새로운 개정판을 출간하지 못했을 것이다. 창의적 문제해결과 의사결정 능력은 인간의 삶 속에 절대적으로 필요한 지혜라고 생각한다. 이 책을 통해서 여러분의 창의적 문제해결과 의사결정 능력이 향상되는 데 조그마한 도움이라도 되었으면 하는 것이 저자의 소박한 바람이다. 둘째, 본서에 공동 저자로 참여한 김영천군에게 고마움을 표하고 싶다. 저자의 제자인 김영천군은 본서가 새로 발간되는 데 많은 도움을 주었기 때문에 공동 저자로 참여하게 되었다. 김영천군은 학부시절부터 저자와 인연을 맺고, 지난 3년간 수도승처럼 창의적 문제해결 콘텐츠를 개발하고, 한국 창의적 문제해결 센터(www.k-cps.co.kr)에서 책임 연구원으로, 지식 전문가로서 많은 일을 하고 있다. 김영천군이 본서를 집필하는 과정에서 많은 것을 배우고 성장하였기를 바라며, 세월이 흘러 이 분야의 전문가로 성장하는 데 본서가 성공의 밑거름이 되기를 진심으로 희망한다. 셋째, 지난 12년 동안을 경영 시뮬레이션 게임 영역과 창의적 문제해결 영역에 매 달려서 연구하고, 콘텐츠를 개발하고 사는 남편에게 한 마디 불평 없이 끊임없는 힘과 사랑을 준 아내 최명옥에게 감사의 마음을 전하고 싶다. 또한 사회인으로 열심히 노력하고 성장하고 있는 큰 딸 지연, 대학생으로 새로운 세상에서 날고자 날개 짓을 하는 둘째 딸 지은에게도 이 책을 통해서 아빠의 사랑이 전해졌으면 한다. 넷째, 이 책을 통해서 얼마 전에 우리 가족 곁을 떠나신 아버님에게 감사 하는 마음과 죄송한 마음을 전해 드리고 싶다. 또한 혼자 남으셔서 슬픔을 이기시고 계시는 어머님에게도 이 책을 통해서 건강하심을 빌고, 감사의 마음을 드리고 싶다. 마지막으로, 16년 전에 “경영학원론”으로 처음 인연을 맺어서 성실함이 무엇인지, 사람의 인연이 무엇인지를 가르쳐 주시고 계시는 김우겸 전무님이 더욱 건강하시길 빌고 싶다. 또한 새로 인연을 맺어서 벌써 두 권의 책을 만들어 주신 청람 출판사의 이수영대표님에게 감사의 말씀을 드리고 싶다. 2011년 4월 봄의 길목에서 한양대학교 김상수
웹 스크레이핑과 데이터분석
  • 저자 : 곽기영
  • 판형 : 국배변형판
  • 페이지수 : 678p
  • 가격 : 35,000원
머리말 월드와이드웹(World Wide Web)은 이미 데이터분석에 이용할 수 있는 유용한 데이터로 차고 넘친다. 과거에는 데이터 부족이 문제였다면 지금은 오히려 데이터 과잉이 문제일 수 있다. 다양한 형식, 다양한 구조, 다양한 기술로 복잡하게 얽혀 있는 데이터를 어떻게 효과적이고 효율적으로 확보할 수 있느냐가 더 중요한 이슈가 되고 있다. 어떤 데이터는 단순한 형식의 정형화된 텍스트로 저장되어 있어 비교적 쉽게 분석에 활용할 수 있는 반면, 어떤 데이터는 비정형적 구조로 인해 좀 더 복잡한 기술과 절차가 요구되기도 한다. 웹사이트상에 게시된 비구조화된 데이터로부터 분석을 위해 필요한 구조화된 데이터를 추출하는 과정을 웹 스크레이핑(web scraping)이라고 한다. 이 책은 웹상에 다양한 방식으로 저장된 데이터를 R을 이용하여 자동으로 수집하는 체계적인 방법을 소개한다. 이 책은 다음과 같은 특징을 갖는다. 첫째, 웹 스크레이핑 과정에 필요한 기반기술을 가능하면 특정 프로그래밍 언어와 독립적으로 설명하려고 노력하였다. 이 책은 비록 R을 바탕으로 웹 스크레이핑 과정을 소개하고 있기는 하지만 웹 스크레이핑의 중요한 개념적?기술적 요소는 어느 언어나 도구를 사용하더라도 공통적인 이해가 필요한 부분이라고 믿고 있기 때문이다. 둘째, 가능한 여러 분야의 사례를 포함하였다. 웹 스크레이핑의 어려움 중의 하나는 데이터 추출 과정에 매우 많은 경우의 수가 존재한다는 것이다. 따라서 모든 문제를 해결할 수 있는 만병통치약과 같은 단일 접근법은 존재하지 않는다. 갖가지 형태의 웹사이트로부터 여러 방식의 데이터 추출 과정을 접해봄으로써 이러한 어려움을 어느 정도 극복할 수 있을 것이다. 셋째, 단순히 데이터 수집에 그치지 않고 가능하면 데이터분석과 시각화 과정을 함께 경험해볼 수 있도록 하였다. 이 책은 웹 스크레이핑 방법을 소개하는 것이 주목적이긴 하지만 데이터 수집은 궁극적으로 분석을 목적으로 한다는 것을 간과할 수는 없다. 따라서 수집한 데이터를 이용하여 가능한 범위 내에서 머신러닝, 텍스트 마이닝 및 토픽모델링, 네트워크분석, 시계열분석 등의 데이터분석을 수행하였다. 또한 다양한 관점에서 데이터를 시각화하여 분석 과정에 풍부함을 더할 수 있도록 하였다. 그러나 이 책의 주목적이 웹 스크레이핑이라는 점을 고려하여 데이터분석과 시각화는 수집한 데이터의 특성을 이해하는 수준에서 최소화하였으며 그에 대한 설명도 제한적인 수준에서 그쳤다. 그래서 이 책에서 보다 깊이 소개하지 못한 데이터분석 기법들은 필자의 다른 책에서 다루는 것으로 미룰 수밖에 없었다. 이 책을 집필하고 출간하기까지는 많은 사람들의 도움이 있었다. 도서출판 청람의 이수영 대표는 이 책이 출판될 수 있도록 아낌 없는 지원을 하였으며, 편집부는 편집과 관련된 전문적 의견을 제시하여 필자가 내용을 가다듬는 데 보다 집중할 수 있도록 도움을 주었다. 집필 과정에서 의지할 수 있는 가족이 없었다면 이 책의 출간은 더욱 오랜 시간이 걸렸을지도 모른다. 끝으로 아내와 아들, 딸에게 고마움을 전한다. 2018년 8월 곽기영

게시물 검색 전체목록