
wordCloud에서 배경 모양을 바꾸는 방법

WordCloud Visualizing
스팸 이메일에는 어떤 단어들이
많이 들어있는지 Visualizing!!
1
|
from wordcloud import WordCloud, STOPWORDS
|
cs |
워드 클라우드를 사용할수 있도록
import로 호출 합니다.

스팸 이메일에는 어떤 단어가
많이 들어 있을까요?
워드 클라우드(wordCloud)를 사용하려면
1. 판다스(Pandas)의 스팸컬럼에
저장된 문자열을 리스트로 먼저 받아오고,
2. 리스트에 있는 문자열을 다 합쳐서 하나의
문자열로 만들어줘야 합니다.
1
2
3
|
spam_email_list = spam['text'].tolist()
spam_email = ''.join(spam_email_list)
spam_email
|
cs |

join() 함수를 사용하여
문자열을 모두 합쳐 줍니다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
my_stopwords = STOPWORDS
my_stopwords.add('subject')
from PIL import Image
img = Image.open('spam.jpg')
img_mask = np.array(img)
wc = WordCloud(background_color='white', mask= img_mask, stopwords=my_stopwords)
wc.generate(spam_email)
>> wc.generate(spam_email)
plt.imshow(wc)
plt.imshow(wc)
plt.axis('off')
plt.show()
|
cs |
img_mask를 적용하여 배경그림의 모양대로
단어들이 시각화되도록 합니다.

'A.I > Machine Learning' 카테고리의 다른 글
데이터프레임의 날짜문자열 칼럼을 datetime64로 변경하는법 (0) | 2022.05.11 |
---|---|
판다스(Pandas) read_csv 함수의 error_bad_lines=False 파라미터 사용법 (0) | 2022.05.11 |
Prophet(프로펫) 라이브러리 사용법 (0) | 2022.05.11 |
문자열 데이터를 처리하기 위한 구두점 제거 + Stopwors(불용어) 사용하는 코드 (0) | 2022.05.10 |
카테고리컬 데이터(Categorical Data) 확인하는 방법 (0) | 2022.05.04 |
댓글