본문 바로가기

Python43

Streamlit(스트림릿) 설치 방법 Streamlit(스트림릿) 설치 방법 1. 스트림릿(Streamlit)이란? 스트림릿은 빅데이터와 머신러닝을 간단하게 배포할수 있는 파이썬(Python) 기반의 웹어플리케이션으로 대시보드를 쉽게 만들수 있습니다. 2. 설치하기 사이트 https://streamlit.io/ Streamlit • The fastest way to build and share data apps Streamlit is an open-source app framework for Machine Learning and Data Science teams. Create beautiful web apps in minutes. streamlit.io 스트림릿 사이트에 설치방법이 있는데 클릭하면 클릭하면 자동 복사가 됩니다. pip ins.. 2022. 5. 19.
소스코드 버전 관리를 위한, Git과 Github.com 사용법 소스코드 버전 관리를 위한, Git과 Github.com 사용법 1. 소스코드 버전 관리 소스코드 버전 관리는 동일한 소스 코드에 대한 여러 버전을 관리하는 것을 말합니다. 여러명이 하나의 프로젝트를 공동으로 작업할때 코드를 관리해주는 시스템입니다. 소스코드의 변경이 있을때마다~ 수정 전후의 내용을 파악할수 있고, 프로젝트 진행중에 문제점이 생겼을때 다시 이전으로 돌아갈수도 있습니다. 각자 코드를 공유, 동기화하고, 수정할때 더욱 효율적이고 안정적으로 할수 있습니다. 소스코드 버전 관리 툴로는 Git, GitHub, GitLab, Team Foundation Server, Subversion, Bitbucket, TortoiseSVN 등등 다양하게 많은데요. 그중에서도 가장 많이 사용되는 Git(깃), .. 2022. 5. 19.
NaN을 처리하는 전략 - NaN 없애는 방법, Nan을 다른 값(각 컬럼의 평균등)으로 셋팅하는 방법 Nan을 처리하는 전략 - NaN 없애는 방법, NaN을 다른 값(각 컬럼의 평균등)으로 셋팅하는 방법 NaN이란? 결측지, 결측값, 존재하지 않는(null) 값의 일종이며, 변수(variable) 등이며 값은 존재하는 것이지만, 그 시점에서 아직 정해져 있지 않은 값을 표시한다. (출처 : 네이버 사전) 데이터를 수집 분석하다 보면 초기 준비 과정에서 결측지(결측값)을 먼저 처리해야 어려움이 없는데요. Nan을 없애는 방법에 대해서 알아보도록 하겠습니다. ex. 데이터프레임이 df 라고 할때~ 1. 데이터프레임 카테고리컬 데이터에서 NaN이 있는지 확인하는 방법 df.isna().sum() 2. NaN 삭제하기 df = df.dropna() a. 행(row)을 기준으로 삭제 df = df.dropna(.. 2022. 5. 6.
판다스 데이터프레임의 replace 함수 - 이상한 값을 np.nan으로 바꾸는것 판다스 데이터프레임의 replace 함수 - 이상한 값을 np.nan으로 바꾸는것 replace() 함수를 사용하여 내가 원하는 값을 다른 값으로 대응하여 바꿀수 있습니다. df.replace() a. NaN(결측지) 값을 50으로 바꾸기 df.replace(np.nan, 50) b. NaN(결측지) 값을 2로 바꾸기 df.replace(np.nan, 2) 2022. 5. 6.
Pandas의 pivot_table(피벗 테이블) 사용하기 Pandas의 pivot_table(피벗 테이블) 사용하기 1. pivot_table(피벗 테이블)이란? 우리는 pivot 기능을 액셀에서 많이 접했을 것입니다. 데이터 열 중에서 필요한 자료만을 뽑아 새롭게 표로 작성해 주는 기능인데요. pivot_table(피벗 테이블)은 쉽게 말해서 세로 데이터를 가로 데이터로 변경해 주는 역할을 합니다. "피봇팅 한다~" 컬럼의 값을 열로 만드는것!! pivot_table(피벗 테이블)을 사용하면 임의대로 데이터를 정렬하고 필터링할수 있습니다. 2. pivot_table(피벗 테이블) 사용법 pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, .. 2022. 5. 4.
구글 맵 API - Geocoding API 설정하는 방법 구글 맵 API - Geocoding API 설정하는 방법 웹사이트 개발 또는 앱 개발을 할때 위치 기반 서비스를 받기 위해 구글 맵 API를 설정해야 할 때가 있습니다. 그 방법을 알아보도록 하겠습니다. 1. 아나콘다에 구글맵스 라이브러리 설치 먼저 구글 클라우드의 API를 사용하기 위해 내 컴퓨터에 설치된 아타콘다3에 googlemaps 라이브러리를 설치해 줍니다. 내컴퓨터 검색창(돋보기)을 클릭하고 Anaconda를 입력하면 메뉴가 쭉 뜨는데요. 그중에서 Anaconda Prompt를 클릭합니다. 아나콘다 프롬프트 창이 뜨면! pip install googlemaps 를 입력후 [Enter] 키를 눌러줍니다. 끝에 [Yes] 라고 하면 된다는데~ 저는 그런부분은 나오질 않더라구요. 설치가 완료되었습.. 2022. 5. 4.
판다스(pandas) Series(시리즈) 연산 판다스(pandas) Series(시리즈) 연산 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 # ------------------------------------------------------------------------------ # # 판다스 호출 import pandas as pd index = ['apples', 'oranges', 'bananas'] data = [10, 6, 3,] # 시리즈 데이터 생성하고 변수에 저장 fruits = pd.Series(data= data, index= index) fruits >> [결과] apples 10 oranges 6 bananas 3 dtype: int64 # ---------------------.. 2022. 5. 2.
차트 그리기할때 한글 안깨지게 하는법 차트 그리기할때 한글 안깨지게 하는법 파이썬(Python) 판다스(pandas)에서 차트를 그릴때 한글을 입력하면 깨져서 나오는데~ 그걸 제대로 나올수 있도록 도와주는 코딩입니다. 한글깨짐 방지 코딩!! 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 # ------------------------------------------------------------------------------ # import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline import platform from .. 2022. 5. 2.
판다스(Pandas) Series의 데이터 생성 및 억세스 방법 판다스(Pandas) Series의 데이터 생성 및 억세스 방법 1. 판다스의 장점 판다스(pandas)는 Numpy를 보완해서 만들어진 문법인데요. 이름을 입력할수 있도록 만들어졌습니다. a. 기본적인 통계데이터를 제공하고, b. NaN values 를 알아서 처리합니다. c. 숫자 문자열을 알아서 로드합니다. import pandas as pd 판다스를 사용하려면 먼저 호출을 해야 합니다. 판다스를 다룰때는 인덱스라는 용어는 왼쪽에 붙어있는 것을 가르킵니다. (쉽게 사람용 인덱스라고 할께요 !!) 2. Series(시리즈) 기본 구조 Series(시리즈)는 1차원 배열과 같은 자료구조를 가지고 있습니다. 시리즈는 1차원 배열과는 다르게 데이터와 관련된 인덱스의 값도 함께 저장이 됩니다. 기본 형식 c.. 2022. 4. 28.
판다스(pandas) csv 파일 저장하고 불러오기 to_csv(), read_csv() 함수 판다스(pandas) csv 파일 저장하고 불러오기 to_csv(), read_csv() 함수 판다스(pandas)는 파이썬(Python)의 데이터처리를 위한 라이브러리 입니다. csv 파일은 판다스(pandas)에서 데이터프레임을 불러오고 저장할때 많이 쓰이기 때문에 알아두면 좋아요. 1. csv 파일 저장하기 pd.to_csv('파일경로/파일명') 2. csv 파일 불러오기 pd.read_csv('파일경로/파일명') 3. 인코딩 pd.read_csv('파일경로/파일명', encoding='utf-8' 또는 'cp9449') 불러올 csv 파일의 인코딩과 파이썬의 인코딩의 설정이 맞지 않으면 에러가 발생합니다. 국제표준 인코딩 utf-8 2022. 4. 28.