✅ 1. 고객 평점 조사 주문 상태가 '배송완료' 인 것들 중에서 리뷰 점수가 5인 주문의 갯수와 비중을 나타내기 WITH cte AS ( SELECT date_format(review_creation_date, '%Y-%m') AS yearmonth, count(DISTINCT CASE WHEN review_score = 5 THEN review_id ELSE null END) AS score_5, count(DISTINCT order_id) AS count_all, round( count(DISTINCT CASE WHEN review_score = 5 THEN review_id ELSE null END)*100.0 / count(DISTINCT order_..
3. VIP 분석하기- VIP 고객 정보 파악- VIP 고객 대출 정보 파악- VIP 고객들의 예치 현황 파악 VIP 고객 정보 파악 > # Annual_Income 박스플롯으로 그리기# x 축 표시 형식을 변경하는 함수 정의from matplotlib.ticker import FuncFormatter# x 축 표시 형식을 변경하는 함수 정의def format_func(x, pos): return '{:,.0f}'.format(x/1000) # #,### 형식으로 포맷팅plt.figure(figsize=(16,9))sns.boxplot(data=customer,x='Annual_Income')# x 축에 적용할 Formatter 설정formatter = FuncFormatter(format_..
1. 기초통계량 분석 2. 그래프 그리기- 나이대별 정보 수집하기- 직업별 정보 수집하기- 상관관계 분석하기 3. VIP 분석하기- VIP 고객- VIP ☑️ Pivot Table() 데이터를 재구성하여 요약, 집계된 정보를 보여주는 테이블 형태 pivot_table() 함수는 데이터프레임에서 피벗 테이블을 생성하는 데 사용됩니다.주어진 데이터를 사용자가 원하는 형태로 재배치하여 요약된 정보를 보기 쉽게 제공합니다. [ 피벗 테이블 생성하기 1 ] index : 인덱스values : 값columns : 컬럼aggfunc : 연산할 함수, 기본값은 mean 이다import pandas as pd# 샘플 데이터프레임 생성data = { 'Date': ['2023-01-01', '2023-0..
1. 분석 목적- 목적과 목표 설정 2. 데이터 수집- 데이터 수집 방법 정하기- 데이터 형식 설명 3. 데이터 전처리- 결측치 처리- 이상치 탐지 및 처리- 데이터 정규화, 표준화 4. 데이터 분석 및 해석- 기초통계량 분석- 시각화를 통한 데이터 탐색 및 해석- 변수 간 상관관계 분석 5. 결론- 프로젝트 요약- 한계점과 개선사항- 추후 분석 및 발전방향 # 데이터 출처https://www.kaggle.com/datasets/khanmdsaifullahanjar/bank-user-dataset/data Bank User DatasetThis dataset contains user behaviors contributing to their credit scorewww.kaggle.com # 컬럼..
# 데이터 출처https://www.kaggle.com/datasets/khanmdsaifullahanjar/bank-user-dataset/data Bank User DatasetThis dataset contains user behaviors contributing to their credit scorewww.kaggle.com 고객의 금융데이터를 탐색하여, 타 부서에게 서비스 현황을 볼 수 있게 해주세요. 우리의 서비스가 앞으로 어떠한 방향으로 나아갈 지 확인할 수 있었으면 좋겠어요. 은행 고객데이터에 대한 EDA 진행, 서비스 현황 확인 및 개선점 제시 로 생각해주세요.주어진 데이터를 활용하여 EDA 를 진행하여 아래 항목에 대한 확인이 가능하면 더더욱 좋겠죠? 1. 서비스의 현 상태 확인 2..
# 따릉이 대여소란? 여러 개의 거치대가 모여있는 곳 # 따릉이 거치대란? 자전거 1개 수용 가능 # 데이터 관계 따릉이 거치대 > 따릉이 대여소 > 강남구 / 송파구 / 서초구 따릉이 대여 + 따릉이 반납 > 각 대여소별 이용 횟수 와의 관계를 분석하였다 # 문제 1) rent_data 내에서 구, 정류장이름, 정류장 id를 빌려간 정류장이름, 빌려간 정류장 id, 받은 정류장이름, 받은 정류장를 중복된 행도 그대로 통합하기 SELECT gu, rent_nm, rent_id AS id FROM rent_data UNION all SELECT gu, rtn_nm AS rent_nm, rtn_id AS id FROM rent_data - 갯수 세보기 select count(*) from ( SELECT g..
create database database_name 후 use 데이터베이스 1. 첫번째 create table rent_bic( bike_id varchar(20), rent_dt varchar(100), rent_id varchar(20), rent_nm varchar(100), rent_hold varchar(20), rtn_dt varchar(100), rtn_id varchar(20), rtn_nm varchar(100), rtn_hold varchar(20), use_min varchar(20), use_dst varchar(20), birth_year varchar(20), sex_cd varchar(20), usr_cls_cd varchar(20), rent_station_id varcha..
csv를 UTF-8로 저장 기본적으로 CSV 파일은 저장할 때 다른 이름으로 저장하기를 누른 뒤 이미지와 같이 CSV UTF-8(쉼표로 분리) 라는 항목으로 저장해야 추후에 기술할 에러가 발생하지 않는다. workbench settings workbench에서 접속할 connection의 edit connection에 들어간다. Advanced탭의 Others에 OPT_LOCAL_INFILE=1 을 추가한다. LOAD DATA LOCAL INFILE "절대경로\\data.csv" INTO TABLE dbName.tableName FIELDS TERMINATED BY "|" # csv 구분자 입력 LINES TERMINATED BY "\n" IGNORE 1 ROWS; # 첫 행이 컬럼명인 경우, 해당 행 ..
CSV 파일 삽입하기 1. Table Data Import Wizard 선택 해당 데이터베이스 우클릭 Table Data Import Widzard를 선택 2. 넣을 CSV 파일 선택 넣을 CSV 파일을 선택 3. 테이블 생성 또는 선택 생성된 테이블을 선택하거나 생성할 테이블명 적기 4. 포맷 설정/확인하기 인코딩 타입이 utf-8인지 확인 필드 타입이 일치하는지 확인 5. 삽입 완료 다음 버튼을 누르면 데이터 삽입이 완료된다. 파일 업로드 시 오류가 발생하는 경우 1. CSV 형식으로 인코딩 다시하기 CSV 파일을 메모장으로 열어준 후, 다른 이름으로 저장 인코딩을 UTF-8로 바꾸고 저장 2. 첫 행을 모두 영어로 바꾸기 엑셀 파일의 첫 행을 모두 영어로 바꾸기 이 방법으로 오류 해결 3. 기타 방..
# 문제 seoul_rent_bike rent_station # 문제 각 rent_station_num별로 사용 횟수를 구한 후 rent_station의 각 구별로 사용 횟수의 합을 구하시오 # 핵심 개념 조인에서 from안에 테이블 뿐만 아니라 서브쿼리를 이용해서 테이블 중 on으로 조인할 컬럼과 count(*) as 별칭과 같이 밖에서 이용할 컬럼으로 써 줄 수 있다 # 정답 select borough, sum(total_count) as total_usage from (select rent_station_num, count(*) as total_count from seoul_rent_bike group by rent_station_num) s inner join rent_station r on s...