메뉴 건너뛰기



도서목록

분야별도서검색

분야별도서검색 경영학 회계학 무역학 경제학 관광학 통계학 전산정보학 비서학 문헌정보 일반교양

도서상세검색

신간도서

현재 페이지 위치 : Home > 도서목록 > 신간도서
확대보기
텍스트 마이닝
  • 저자 : 송민
  • 발행일 : 2017-8-25
  • ISBN : 978-89-86248-593-9 93320
  • 정가 : 17,000원
  • 기타 : 210페이지 / 4X6배판 / 반양장
저자서문

텍스트 마이닝은 비정형 빅데이터 분석에 핵심적인 분야로 여겨지고 있습니다. 요즘 같은 데이터 홍수 시대에는 더욱 그 중요성이 커졌고 텍스트 마이닝에 관심을 갖는 사람들이 많아졌습니다. 이에 비해 텍스트 마이닝을 소개하는 책은 많지 않고 한글을 중심으로 텍스트 마이닝을 설명하는 책은 전무하다고 여겨집니다.
필자는 6년 전 미국에서 교수생활을 끝내고 한국으로 돌아왔습니다. 한국에 오기 전에는 주로 영어로 텍스트 마이닝 과제를 수행했습니다. 특히 영어 소셜 미디어 데이터와 바이오 문헌 데이터를 대상으로 텍스트 분석기술을 개발했습니다. 한국에 온 후에 한글 텍스트 마이닝 연구에 좀 더 관심을 갖게 되었고 학부와 대학원 수업에 텍스트 마이닝 과목을 개설하고 학생들에게 텍스트 마이닝을 소개해 왔습니다. 텍스트 마이닝 수업에서 교재가 마땅치 않아 늘 언젠가는 텍스트 마이닝 책을 써야지 하고 마음을 먹었는데 6년이 지나서야 책이 나오게 되었습니다. 어떤 내용을 다룰지 무척 고민도 많이 하였고 이론적인 부분만 치중하지 말고 이론과 함께 실제 사용할 수 있는 코드 예제도 포함시켜야겠다고 생각해 그 부분에서도 시간이 많이 걸린 것 같습니다. 코드 예제는 자바로 구현이 되었고 예제 코드를 포함한 ‘yTextMiner’라는 텍스트 마이닝 툴을 이 책과 함께 공개하기로 하였습니다(http://informatics.yonsei. ac.kr:8080/yTextMiner/home.html).
이 책이 텍스트 마이닝에 관심 있는 사람들에게 도움을 주고 실제 사용할 수 있도록 동기부여를 해주는 책이 되길 소망합니다. 앞으로 기회가 된다면 감성 분석, 딥러닝 등 텍스트 분석과 관련된 주요 주제들을 심도 있게 다루는 책을 집필하도록 하겠습니다.
끝으로 이 책을 끝낼 수 있도록 도와준 TSMM 랩 학생들(특히 서하림 석사, 김용환 박사, 정유경 박사)과 졸업 후에도 많은 도움을 준 제자들(특히 김수연 박사와 홍수린 석사)에게 고마움을 표합니다. 또한 책을 완성할 수 있도록 지원을 아끼지 않은 사랑하는 가족과 하나님께 감사를 드립니다.

집필을 마치며
저자 송민
Chapter 1 서론
Chapter 2 텍스트 요소 단위별 분석 : 어휘 분석
Chapter 3 한글 형태소 분석
Chapter 4 구문 분석
Chapter 5 벡터 공간 모델과 단어 가중치
Chapter 6 동시출현 단어 분석
Chapter 7 토픽 모델링
Chapter 8 토픽 모델링
Chapter 9 단어 의미 중의성 해소
Chapter 10 맺음말
저자 송민 교수는 연세대 문헌정보학과 정교수이고 2014년부터 언더우드 특훈교수이다.
송민 교수는 연세대학교 문헌정보학 학사, Indiana University 문헌정보학 석사, Drexel University의 School of Information Science and Technology에서 박사학위를 마쳤다.
연세대학교로 부임하기 전에는 필라델피아에 있는 Thomson Reuters사에 Senior Software Engineer로 1999년부터 2005년까지 근무했으며, 그 후 2006년부터 2012년 2월까지 뉴저지 공대(New Jersey Institute of Technology)에서 정보시스템학과에 부교수로 근무했다.
전공 분야는 Text Mining이며 지금까지 SCI급 논문 60여 편과 국제학술지 70여 편을 게재했으며 Text Mining 분야에서 활발한 학술활동을 펼치고 있다. 연구재단이 주관하는 Social Science in Korea(SSK) 중형 책임연구자이며 BK21+ 빅데이터 기반 미래 지식정보서비스팀의 책임연구자이다. 또한 유전자동의보감 사업단에서 바이오 텍스트 마이닝 세부과제 책임자로 연구를 수행하고 있다.