📜 강의 개요

한국헬스커뮤니케이션학회한국언론진흥재단의 후원으로 R로 하는 텍스트마이닝 강의를 준비했습니다. R의 기초부터 다양한 텍스트전처리 도구 학습 및 텍스트분석(고빈도어추출, 감정분석, 주제모형(topic models) 등)을 차근 차근 해보는 강의(33시간)입니다.

<aside> 🏆 이 강의는 8월 중순의 워크숍(Colab으로 하는 딥러닝: 텍스트분류와 자연어 생성) 과 8월 하순의 워크숍(ggplot2로 하는 텍스트마이닝 시각화) 및 11월 예정인 해커톤(감염병보도 품질측정) 참여를 돕기 위해 준비했습니다. R을 모르더라도 이 강의와 워크숍을 통해 실력을 다져 많은 회원들이 10월 해커톤에 참여할 수 있으면 좋겠습니다.

</aside>

🧨강의구성

이 강의는 크게 R기초, 분석전단계, 분석 등 3개 요소로 구성돼 있어 학습자의 수준에 맞춰 공부할 수 있습니다.

R기초

R의 설치, 데이터유형과 구조, 시각화의 기초적인 내용과 R과 RStudio를 이용하는 과정에서 겪을 수 있는 문제해결 방법에 대해 학습합니다.

분석 전단계

텍스트마이닝의 전반적인 구조와 자료 수집과 불러오기, 정제(전처리)에 필요한 다양한 도구(stringr, dplyr, tidyr, purrr, 정규표현식 등)의 학습 및 정제(전처리) 방법에 대해 학습합니다.

분석

단어의 빈도를 계산해 텍스트에서 의미를 추론하는 방식을 학습한다. 사전(감정사전)을 이용하는 방법, 상대적인 빈도(tf-idf, 가중로그승산비 등)를 계산하는 방법, 기계학습의 비지도학습(주제모형: topic models)으로 계산하는 방법 등을 학습합니다.

👨‍🎤강사

안도현, PhD (제주대 교수)

🎈강의 내용

<aside> 📌 아래 "차수별 강의 내용"을 클릭하면 새 페이지가 열립니다.

</aside>

차수별 강의 내용

<aside> 📖 강의교재는 온라인으로 제공합니다.

</aside>

🗝 등록

<aside> 📌 이 링크를 클릭하면 등록페이지가 열립니다. 💿 강의는 제주대학교의 원격교육시스템을 이용해 제공합니다. 등록을 마치면 강의영상과 교재에 접속할 수 있는 링크를 등록한 이메일로 보내드립니다. (구글문서로 공유하므로, G메일 주소로 등록해야 합니다.)

</aside>

🧠 수료증