전체 글 112

날씨와 배송일 관련 인사이트

위의 그룹화 및 평균 계산 결과는 seller_season(판매자가 속한 계절)과 customer_season(고객이 속한 계절)의 조합이 평균 배송 시간(delivery_time_day)에 미치는 영향을 보여줍니다. 이를 기반으로 몇 가지 주요 인사이트를 도출할 수 있습니다: 인사이트 1. 같은 계절일 때 배송 시간이 짧다: • seller_season과 customer_season이 동일한 경우(dry-dry, rainy-rainy), 평균 배송 시간이 상대적으로 짧음. • 이는 판매자와 고객이 동일한 기후 조건에 놓여 있을 때 물류 과정이 더 원활하게 진행될 가능성을 시사. 2. 다른 계절일 때 배송 시간이 길다: • seller_season과 customer_season이 다른 경우(dry-rai..

카테고리 없음 2025.01.31

배송관련 가설설정

1. 질문: 셀러에게 주문량이 많으면 고객에게 배송하는 데 시간이 더 걸릴 수 있을까? 가설: 셀러의 주문량이 많아지면, 각 주문을 처리하고 배송하는 데 시간이 더 걸릴 가능성이 있음.근거: • 처리 용량 초과, 재고 관리 문제, 물류 지연, 우선순위 조정 등의 요인. • 이 가설을 검증하려면 주문량(total_orders)과 배송 시간(delivery_time) 간의 상관관계를 분석하고 비교. 결론: 데이터 분석을 통해 이 가설의 타당성을 확인할 필요가 있으며, 소규모 셀러나 특정 상황에서 영향이 클 가능성이 있음. 기준: 일단위 2. 질문: 배송 제한 시간 준수 여부를 나타내는 컬럼을 만들면 배송 시간 예측에 도움이 될까? 가설: 배송 제한 시간 준수 여부(0/1)를 나타내는 컬럼은 배송 시간 예측에..

카테고리 없음 2025.01.24

[TIL] 76일차

예측 모델링에서 범주형, 명목형, 수치형 데이터를 처리하는 방법과 특징 선택 요령, 모델링 종류, 그리고 최적의 모델 선정법을 다음과 같이 설명하겠습니다. 1. 데이터 유형별 처리 방법 (1) 범주형 데이터 • 정의: 데이터가 고정된 여러 값 중 하나를 가지는 경우. (예: “남성”, “여성”) • 처리 방법: 1. 인코딩 (Encoding): • Label Encoding: 각 범주를 숫자로 매핑 (e.g., “남성” → 0, “여성” → 1). • One-Hot Encoding: 각 범주를 이진 벡터로 변환 (e.g., “남성” → [1, 0], “여성” → [0, 1]). 2. 빈도 기반 인코딩 (Frequency Encoding): • 범주의 등장 빈도를 사용하여 숫자로 변환. 3. 임베딩 (Em..

카테고리 없음 2025.01.24

[TIL] 72일차

qcc 7회차 1번문제SELECT p.page_idFROM pages pLEFT JOIN page_likes plON pl.page_id = p.page_idWHERE pl.page_id IS NULLORDER BY page_id;    1. pages 테이블과 page_likes 테이블의 LEFT JOIN • pages 테이블(p)의 모든 레코드와 page_likes 테이블(pl)을 조인합니다. • LEFT JOIN은 pages 테이블의 모든 행을 유지하면서, page_likes 테이블에서 일치하는 값이 없는 경우 NULL을 반환합니다. 2. 조건: WHERE pl.page_id IS NULL • 조인 후 page_likes 테이블에 일치하는 page_id가 없는 pages 테이블의 행만 선택합니다. ..

카테고리 없음 2025.01.24

[WIL]11주차

1. 나의 일주일 돌아보기새로운 팀원들과의 만남, 모두 너무 친절하시다.팀원들과 의견을 조율하면서 프로젝트에 다룰 데이터셋을 찾고 이해하는 시간이었다.개인적으로 데이터셋을 들여다 보며 전에 배운내용을 복습하는 시간을 가졌다.2. 더 나은 다음주를 만들기 위해 어떤고민?분석한 데이터를 실제로 태블로로 구현할 수 있을까 고민이 되는게 사실이다.다음주는 eda와 태블로 학습에 매진해야 겠다.미움받을 용기!

카테고리 없음 2025.01.10