본문 바로가기

프로그래밍82

Prophet(프로펫) 라이브러리 사용법 Prophet(프로펫) 라이브러리 사용법 페이스북에서 제공하고 있는 프로펫(Prophet) 라이브러리 먼저 사용하기 전에 모듈을 설치해줘야 하는데요. 아나콘다3 프롬프트에서 install : pip install fbprophet를 실행해 줍니다. 에러가 난다면 conda install -c conda-forge fbprophet 레퍼런스(주소) https://research.fb.com/prophet-forecasting-at-scale/ https://facebook.github.io/prophet/docs/quick_start.html#python-api Quick Start Prophet is a forecasting procedure implemented in R and Python. It is.. 2022. 5. 11.
wordCloud에서 배경 모양을 바꾸는 방법 wordCloud에서 배경 모양을 바꾸는 방법 WordCloud Visualizing 스팸 이메일에는 어떤 단어들이 많이 들어있는지 Visualizing!! 1 from wordcloud import WordCloud, STOPWORDS cs 워드 클라우드를 사용할수 있도록 import로 호출 합니다. 스팸 이메일에는 어떤 단어가 많이 들어 있을까요? 워드 클라우드(wordCloud)를 사용하려면 1. 판다스(Pandas)의 스팸컬럼에 저장된 문자열을 리스트로 먼저 받아오고, 2. 리스트에 있는 문자열을 다 합쳐서 하나의 문자열로 만들어줘야 합니다. 1 2 3 spam_email_list = spam['text'].tolist() spam_email = ''.join(spam_email_list) spa.. 2022. 5. 10.
문자열 데이터를 처리하기 위한 구두점 제거 + Stopwors(불용어) 사용하는 코드 문자열 데이터를 처리하기 위한 구두점 제거 + Stopwors(불용어) 사용하는 코드 구두점 제거와 불용어!! 이 두가지를 하나의 함수로 묶어서 사용하겠습니다. (용어는~ 파이프라이닝 한다) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 import string import nltk nltk.download('stopwords') from nltk.corpus import stopwords my_stopwords = stopwords.words('english') def message_cleaning(sentence) : # 1. 구두점 제거 Test_punc_removed = [char for char in sentence if char not in string... 2022. 5. 10.
Pandas의 pivot_table(피벗 테이블) 사용하기 Pandas의 pivot_table(피벗 테이블) 사용하기 1. pivot_table(피벗 테이블)이란? 우리는 pivot 기능을 액셀에서 많이 접했을 것입니다. 데이터 열 중에서 필요한 자료만을 뽑아 새롭게 표로 작성해 주는 기능인데요. pivot_table(피벗 테이블)은 쉽게 말해서 세로 데이터를 가로 데이터로 변경해 주는 역할을 합니다. "피봇팅 한다~" 컬럼의 값을 열로 만드는것!! pivot_table(피벗 테이블)을 사용하면 임의대로 데이터를 정렬하고 필터링할수 있습니다. 2. pivot_table(피벗 테이블) 사용법 pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, .. 2022. 5. 4.
구글 맵 API - Geocoding API 설정하는 방법 구글 맵 API - Geocoding API 설정하는 방법 웹사이트 개발 또는 앱 개발을 할때 위치 기반 서비스를 받기 위해 구글 맵 API를 설정해야 할 때가 있습니다. 그 방법을 알아보도록 하겠습니다. 1. 아나콘다에 구글맵스 라이브러리 설치 먼저 구글 클라우드의 API를 사용하기 위해 내 컴퓨터에 설치된 아타콘다3에 googlemaps 라이브러리를 설치해 줍니다. 내컴퓨터 검색창(돋보기)을 클릭하고 Anaconda를 입력하면 메뉴가 쭉 뜨는데요. 그중에서 Anaconda Prompt를 클릭합니다. 아나콘다 프롬프트 창이 뜨면! pip install googlemaps 를 입력후 [Enter] 키를 눌러줍니다. 끝에 [Yes] 라고 하면 된다는데~ 저는 그런부분은 나오질 않더라구요. 설치가 완료되었습.. 2022. 5. 4.
판다스(pandas) Dataframe(데이터프레임) 생성하기 판다스(pandas) Dataframe(데이터프레임) 생성하기 판다스(pandas)는 파이썬(Python)을 활용해 데이터 분석을 하기 위한 필수 패키지입니다. 판다스 데이터프레임(Dataframe)은 여러개의 시리즈들이 모여 구성됩니다. 표(table) 형태라 보기 편하고, 데이터를 표 형태로 처리할수 있어 작업을 좀더 수월하게 할수 있습니다. 1. Dataframe(데이터프레임) 생성하기 데이터프레임은 일반적으로 배열, 리스트, 딕셔너리로 만들수 있습니다. items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index.. 2022. 5. 2.
판다스(pandas) Series(시리즈) 연산 판다스(pandas) Series(시리즈) 연산 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 # ------------------------------------------------------------------------------ # # 판다스 호출 import pandas as pd index = ['apples', 'oranges', 'bananas'] data = [10, 6, 3,] # 시리즈 데이터 생성하고 변수에 저장 fruits = pd.Series(data= data, index= index) fruits >> [결과] apples 10 oranges 6 bananas 3 dtype: int64 # ---------------------.. 2022. 5. 2.
차트 그리기할때 한글 안깨지게 하는법 차트 그리기할때 한글 안깨지게 하는법 파이썬(Python) 판다스(pandas)에서 차트를 그릴때 한글을 입력하면 깨져서 나오는데~ 그걸 제대로 나올수 있도록 도와주는 코딩입니다. 한글깨짐 방지 코딩!! 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 # ------------------------------------------------------------------------------ # import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from .. 2022. 5. 2.
판다스(Pandas) Series의 데이터 생성 및 억세스 방법 판다스(Pandas) Series의 데이터 생성 및 억세스 방법 1. 판다스의 장점 판다스(pandas)는 Numpy를 보완해서 만들어진 문법인데요. 이름을 입력할수 있도록 만들어졌습니다. a. 기본적인 통계데이터를 제공하고, b. NaN values 를 알아서 처리합니다. c. 숫자 문자열을 알아서 로드합니다. import pandas as pd 판다스를 사용하려면 먼저 호출을 해야 합니다. 판다스를 다룰때는 인덱스라는 용어는 왼쪽에 붙어있는 것을 가르킵니다. (쉽게 사람용 인덱스라고 할께요 !!) 2. Series(시리즈) 기본 구조 Series(시리즈)는 1차원 배열과 같은 자료구조를 가지고 있습니다. 시리즈는 1차원 배열과는 다르게 데이터와 관련된 인덱스의 값도 함께 저장이 됩니다. 기본 형식 c.. 2022. 4. 28.
판다스(pandas) Series(시리즈) 액세스 판다스(pandas) Series(시리즈) 액세스 판다스(pandas) 시리즈(Series)는 1차원 데이터 구조를 가지고 있습니다. 시리즈의 모든 값에는 색인이 들어 있는데, 별도의 인덱스를 가질수 있습니다. Series(시리즈) 요소에 접근하기!! 1 2 3 4 5 6 7 8 9 10 11 12 13 # ------------------------------------------------------------------------------ # groceries = pd.Series(data= data, index= index) # 변수에 저장 groceries >>> [결과] eggs 30 apples 6 milk Yes bread No dtype: object # -----------------.. 2022. 4. 28.