Knowledge🦢/Python

✅ EDA 기본  ✔️기본 import import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt  ✔️파일 불러오기df_customer = pd.read_csv('olist_customers_dataset.csv')  ✔️파일 저장하기olist_df.to_csv('olist_df.csv', index=False)  ✔️ 결측값 확인하기olist_df.isna().sum()  ✔️특정 컬럼 버리기 new_df = df.drop('컬럼이름', axis=1)  ✔️결측값 버리기 df = df.dropna(subset=['컬럼1', '컬럼2'])ㅇdf = df.dropna()  ✔️ 결측값 채우기 df.fil..
# 데이터 출처kaggle의 Olist기업 데이터 분석 ✅ 1. Recency  R은 '고객이 최근에 구매했는가?'를 의미합니다. 고객의 마지막 활동이 언제인지를 나타내는 변수로, 최근에 구매한 고객일수록 높은 점수가 부여됩니다. 같은 길이로 구간을 나누는 pd.cut() 또는 같은 개수로 구간을 나누는 pd.qcut()이 있습니다 recency = olist_df.groupby('customer_id')['order_purchase_timestamp'].max().reset_index()  max_date = recency['order_purchase_timestamp'].max()recency['diff_date'] = (max_date - recency['order_purchase_timestamp..
1. 데이터 로드하기 여러 패키지 가져오기import pandas as pdimport sklearnimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport osimport re  데이터 csv파일로 읽어오기df = pd.read_csv('df_category_2.csv')df.head(3)   ⚡️아이템별 마진합계, 평균수량 구하기word_stats = df.groupby('word').agg({ 'Sales Margin Amount' : 'sum', 'Sales Quantity' : 'mean'}).rename(columns = {'Sales Quantity' : 'Avg Quantity'}) word_stat..
# 프로젝트 주제 : 아마존 고객 구매 식품 데이터 분석   # 컬럼 설명 ✔️Discount Amount : 할인금액✔️List Amount : 정가 / 할인전금액✔️Sales Amount : 실제판매금액-> Sales Price * Sales Quantity ✔️Sales Amount Based on List Price : 할인적용 안된 판매금액 전체 ✔️Sales Cost Amount : 상품을 판매하는데 들어간 비용 ✔️Sales Margin Amount : 판매 마진 금액-> Sales Amount - Sales Cost Amount ✔️Sales Price : 실제 판매 가격✔️Sales Quantity : 상품 수량   1. 데이터 로드하기 여러 패키지 가져오기import pandas as ..
# iterable파이썬에서 "iterable" 하다 라는 의미는 뜻 그대로 "반복 가능한" 것을 의미하며, 반복 가능한 데이터, 즉 객체에 적용되는 의미입니다 # mutable변경되는 객체객체의 상태를 변경할 수 있음 list , set, dict  # immutable변경되지 않는 객체객체의 상태를 변경할 수 없음 string, range(), tuple  # 반복 가능한 데이터형  # 예제 [ string 과 list ]  [ tuple 및 range() ]  [ set 및 dictionary ]
# 헷갈리기 쉬운 부분들 대입연산자 = 비교연산자 == # 비교 연산자 # 산술 연산자 # 파이썬 논리 연산자 # not 예제 age = 10 if not age >= 9: print("not 연산자 결과 : True") else: print("not 연산자 결과 : False") # 결과 not 연산자 결과 : False # 항등 연산자 a = [1, 3, 4, 5] b = [1, 3, 4, 5] print(a == b) print(a is b) print(a is not b) # 결과 True False True a와 b는 같은 값의 리스트를 할당 받았다 == 연산자는 값이 같기에 True를 반환 하였다 반면 is 는 false를 리턴 하였다 메모리 주소가 아니기 때문이다. is not 은 반대이기때..
내일배움캠프에서 Python 알고리즘 문제를 풀기 위한 학습 과정인 기초 개념강의를 오늘 완강했다 # 문자열 변환 함수 : str() # 문자열 -> 문자열 리스트 : split() myemail = 'abc@sparta.co' domain = myemail.split('@')[1].split('.')[0] print(domain) # 결과 sparta # 요소 추가할때 1) 1개 추가할때 리스트.append(요소) 리스트.insert(위치, 요소) 2) 여러개 추가할때 리스트.extend(리스트) # 요소 제거할때 1) 인덱스로 제거할때 del 리스트[인덱스] 리스트.pop(인덱스) 2) 값으로 제거할때 리스트.remove(값) # 값 내부에 있는지 확인 값 in 리스트 값 not in ..
파카파오
'Knowledge🦢/Python' 카테고리의 글 목록