오늘은 교수님이 첫 과제를 내주시고 발표를 가져보는 시간이었습니다..ㅎㅎ
제가 가장 좋아했던 영상은 뉴진스 하니의 푸른산호초 영상이었는데요, 이 영상의 한국 반응은 과연 어떠할지 궁금해서 발표를 준비하게 되었습니다!
!pip install konlpy
!pip install koreanize-matplotlib
import pandas as pd
import numpy as np
import konlpy
import matplotlib.pyplot as plt
import plotly.express as px
import koreanize_matplotlib
from PIL import Image
from wordcloud import WordCloud, ImageColorGenerator
먼저 똑같이 pip와 import해주시고...
CSV파일을 만들기 전까지의 과정 짧게 보여드릴게요!
youtube_df = pd.read_csv('/content/팜호초 크롤링 20240722.csv')
팜호초 크롤링 20240722라고 저장했으니 저렇게 불러왔슴다!
okt = konlpy.tag.Okt()
word_df = pd.DataFrame({'word' : okt.nouns(' '.join(w for w in youtube_df['댓글내용'].astype(str)))}) # 명사 추출
word_df
어제와 같이 댓글 내용을 불러와주고.
word_df['count'] = word_df['word'].str.len()
word_df
count를 진행해줬습니다.
word_dic = group_df.set_index('word').to_dict()['n'] # 딕셔너리 형태로 워드 : 빈도수
font_path = '/content/BMDOHYEON_ttf.ttf'
wc = WordCloud(width=1000, height=700, font_path=font_path).generate_from_frequencies(word_dic) #generat_from_frequecies : 딕셔너리에 키와 밸류 횟수만큼 그려줌
plt.axis('off') # 눈금 지우기
plt.imshow(wc, interpolation = 'bilinear')
plt.show()
처음에는 시각화를 진행해줬구요
icon = Image.open('/content/토끼야.jpg')
new_mask = np.array(icon) # 이미지에 흰바탕말고 색깔있는 부분만 구멍 뚫어줌 (색상표 값으로 계산됨) ~ np.array가 만들어줌 ㅎㅎ
plt.subplots(figsize = (10,10), dpi = 200) #이미지 크게, 해상도 높여줌
wc = WordCloud(width=1000, height=700, background_color = 'white', font_path=font_path, mask = new_mask).generate_from_frequencies(word_dic) # 속성에 mask 추가
plt.axis('off')
img_colors = ImageColorGenerator(new_mask, default_color=(255,255,255))
wc = wc.recolor(color_func = img_colors) # 본래 이미지가 갖고 있는 색깔 스포이드 추출해서 새로 칠해주기
plt.imshow(wc, interpolation = 'bilinear')
plt.show()
대망의 마스킹시간..!
발표는 성공적이었어요. 함께 등산하시는 분들이 오~~ 라는 반응을 해줄 정도여서 더 기뻤답니다.
본격적으로 오후에 배운 음악 정보 수집에 대해 넘어가보겠습니다.
가사를 추출할때는 '펼치기'라는 버튼이 있는데 이걸 꼭 눌러줘야하는데 그에 따라서 class= button을 사용해 눌러줬습니다!
이걸 응용해서 조별 과제를 주어주셨습니다.
멜론에서 주제를 정해서 크롤링 후 분석하기였는데,
저희조는 2010년대와 2000년대의 노래 감성 분석을 하였습니다.
저희는 6명의 한 조를 이루었는데 3명씩 갈라져서 2000년대 가수를 좋아했던 사람과 2010년대 가수를 좋아했던 사람으로 갈라졌는데
분석 결과는.. 상대방과의 이별에서 아쉬움이라는건데... 저는 이 조에서 개발의 입장이라 문학적으로 해석을 잘 못하겠네요.. (T아님)
그래도 조원들과 처음으로 조별과제를 해보며 서로에게 알아갈 수 있는 기회가 된 거 같아 좋았고, 실습하는 시간을 갖게 된 거 같아 좋았습니다!