본문 바로가기

파이썬71

AWS RDS에 접속하기 위한 방화벽 설정 방법 AWS RDS에 접속하기 위한 방화벽 설정 방법 AWS RDS에 외부에서 접속할때 VPC 보안그룹이 활성화 되지 않으면 서버 보안을 위해 기본 세팅은 막아놓은 상태라 접속이 되지 않습니다. 오늘은 그 설정 방법에 대해 알아보도록 하겠습니다. AWS 사이트에 접속해 로그인 합니다. [데이터베이스]를 선택하고, 내가 만든 DB를 클릭합니다. 하단 부분의 [연결 & 보안] 에서 VPC 보안그룹을 클릭합니다. [인바운드 규칙]을 선택하고, 오른쪽 아래에 위치한 [인바운드규칙 편집]을 클릭! 왼쪽 하단 [규칙추가] 클릭! 유형은 → MYSQL/Aurora로 선택 포트번호 → 3306 (자동설정됨) 소스 → Anywhere (원래는 사용자 지정) 소스는 보안을 위해 사용자 지정, 전용 IP만 접속할수 있도록 하는것.. 2022. 5. 13.
Windows에 MySQL Workbench 설치하기 Windows에 MySQL Workbench 설치하기 AWS 클라우드 서버를 외부에서 접속하려면 전용 프로그램이 필요합니다. MySQL Workbench 설치에 대해서 알아보도록 하겠습니다. 1. 프로그램 다운로드 MySQL Workbench 홈페이지 https://dev.mysql.com/downloads/workbench/ MySQL :: Download MySQL Workbench Select Operating System: Select Operating System… Microsoft Windows Ubuntu Linux Red Hat Enterprise Linux / Oracle Linux Fedora macOS Source Code Select OS Version: All Windows (x8.. 2022. 5. 12.
Pandas(판다스) 데이터프레임(Dataframe)의 pivot_table 함수 사용법 판다스 데이터프레임의 pivot_table 함수 사용법 pivot_table(피벗 테이블)이란? 피벗 테이블은 많은 양의 데이터에서 필요한 자료만을 뽑아 새롭게 표를 작성해 주는 기능입니다. 지정된 두 열을 각각 행 인덱스와 열 인덱스로 바꾼 후 행 인덱스의 라벨 값이 첫번째 키의 값과 같고, 열 인덱스의 라벨 값이 두번째 키의 값과 같은 데이터를 찾아서 해당 칸에 넣습니다. 주어진 데이터가 존재하지 않으면 해당칸에 NaN 값을 넣습니다. pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All', obser.. 2022. 5. 12.
데이터프레임의 날짜문자열 칼럼을 datetime64로 변경하는법 데이터프레임의 날짜문자열 칼럼을 datetime64로 변경하는법 아래처럼 코드를 작성합니다. chicago_df['Date'] = pd.to_datetime(chicago_df['Date'], format='%m/%d/%Y %I:%M:%S %p') chicago_df['Date'].value_counts() datetime64로 변경된것을 바로 볼수 있습니다. 힐링아무의 코딩일기 힐코딩! 2022. 5. 11.
판다스(Pandas) read_csv 함수의 error_bad_lines=False 파라미터 사용법 read_csv 함수의 error_bad_lines=False 파라미터 사용법 *.CSV 파일을 불러올때 데이터 안에 이상한 행들이 있을때 에러가 날수 있습니다. 이럴때는 파일을 불러올때, 파라미터 error_bad_lines=False 를 사용해 줍니다. (이상한 행들은 그냥 넘어가고~ 괜찮은 행들만 가져온다!) 1 chicago_df_1 = pd.read_csv('Chicago_Crimes_2005_to_2007.csv', error_bad_lines=False) cs 힐링아무의 코딩일기 힐코딩!! 2022. 5. 11.
Prophet(프로펫) 라이브러리 사용법 Prophet(프로펫) 라이브러리 사용법 페이스북에서 제공하고 있는 프로펫(Prophet) 라이브러리 먼저 사용하기 전에 모듈을 설치해줘야 하는데요. 아나콘다3 프롬프트에서 install : pip install fbprophet를 실행해 줍니다. 에러가 난다면 conda install -c conda-forge fbprophet 레퍼런스(주소) https://research.fb.com/prophet-forecasting-at-scale/ https://facebook.github.io/prophet/docs/quick_start.html#python-api Quick Start Prophet is a forecasting procedure implemented in R and Python. It is.. 2022. 5. 11.
wordCloud에서 배경 모양을 바꾸는 방법 wordCloud에서 배경 모양을 바꾸는 방법 WordCloud Visualizing 스팸 이메일에는 어떤 단어들이 많이 들어있는지 Visualizing!! 1 from wordcloud import WordCloud, STOPWORDS cs 워드 클라우드를 사용할수 있도록 import로 호출 합니다. 스팸 이메일에는 어떤 단어가 많이 들어 있을까요? 워드 클라우드(wordCloud)를 사용하려면 1. 판다스(Pandas)의 스팸컬럼에 저장된 문자열을 리스트로 먼저 받아오고, 2. 리스트에 있는 문자열을 다 합쳐서 하나의 문자열로 만들어줘야 합니다. 1 2 3 spam_email_list = spam['text'].tolist() spam_email = ''.join(spam_email_list) spa.. 2022. 5. 10.
문자열 데이터를 처리하기 위한 구두점 제거 + Stopwors(불용어) 사용하는 코드 문자열 데이터를 처리하기 위한 구두점 제거 + Stopwors(불용어) 사용하는 코드 구두점 제거와 불용어!! 이 두가지를 하나의 함수로 묶어서 사용하겠습니다. (용어는~ 파이프라이닝 한다) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 import string import nltk nltk.download('stopwords') from nltk.corpus import stopwords my_stopwords = stopwords.words('english') def message_cleaning(sentence) : # 1. 구두점 제거 Test_punc_removed = [char for char in sentence if char not in string... 2022. 5. 10.
NaN을 처리하는 전략 - NaN 없애는 방법, Nan을 다른 값(각 컬럼의 평균등)으로 셋팅하는 방법 Nan을 처리하는 전략 - NaN 없애는 방법, NaN을 다른 값(각 컬럼의 평균등)으로 셋팅하는 방법 NaN이란? 결측지, 결측값, 존재하지 않는(null) 값의 일종이며, 변수(variable) 등이며 값은 존재하는 것이지만, 그 시점에서 아직 정해져 있지 않은 값을 표시한다. (출처 : 네이버 사전) 데이터를 수집 분석하다 보면 초기 준비 과정에서 결측지(결측값)을 먼저 처리해야 어려움이 없는데요. Nan을 없애는 방법에 대해서 알아보도록 하겠습니다. ex. 데이터프레임이 df 라고 할때~ 1. 데이터프레임 카테고리컬 데이터에서 NaN이 있는지 확인하는 방법 df.isna().sum() 2. NaN 삭제하기 df = df.dropna() a. 행(row)을 기준으로 삭제 df = df.dropna(.. 2022. 5. 6.
판다스 데이터프레임의 replace 함수 - 이상한 값을 np.nan으로 바꾸는것 판다스 데이터프레임의 replace 함수 - 이상한 값을 np.nan으로 바꾸는것 replace() 함수를 사용하여 내가 원하는 값을 다른 값으로 대응하여 바꿀수 있습니다. df.replace() a. NaN(결측지) 값을 50으로 바꾸기 df.replace(np.nan, 50) b. NaN(결측지) 값을 2로 바꾸기 df.replace(np.nan, 2) 2022. 5. 6.