08.28 데이터 분석

_empty_ 2019. 8. 29. 14:19

08.28 점심이후 브리핑

<보겸> - 웬일로 청바지 입고 옴(청) + 결과물이 없어서(연) 색깔지정 (본인이 희망하여 사유 적음)

같은 소분류 내 상품들의 판매 순위.

를 하는 중.

<유경>

reordered가 1인것만 따로 빼서 구매율이 높은 것과 재구매율이 높은 것에 차이가 있는지, 상관관계가 있는지를 보고 싶은데

저 뽑아내는게 안되는 중

=> reorder가 0,1이니까 ascending해서 슬라이싱 하면 되지 않을까?

구매율이 높은것과 재구매율이 높은것들 간의 패턴을 보고싶음. 특히 유의미한 변화로 보이는

하루 중 구매가 많은 시간대별로 어느 시간대에 구매율 높은게 잘 팔린지, 어느 시점에 재구매율 높은게 잘 팔린지

<새연>

연관분석 하려고 데이터 조작(?) 중

user_id,order_num / product name 으로 데이터프레임 만드는 것 까지는 했음.

연관분석 공부중인데 하려면 R로 해야 한다해서 박사님께

<수경>

바나나 1순위를 내용은 봤는데 직접 구현하고 싶은데 아직 힘든 중.

판매 품목의 패턴을 파악하고 싶었는데 구매율 순위를 못 뽑아서 아직 못하는중.

<숙희>

orders 빼고 prior, train 합친 다음에

오늘은 orders의 내용들을 prior, train 합친 것의 order_id랑 합치면 모든 정보를 한번에 볼 수 있을 것 같았는데

이걸 합치면 데이터가 너무 크니까 우선 이걸 진행하기 전에 어제 보겸이랑 했던 조금 작은 데이터로 작업.

그룹핑해서 몇 개 구매했는지까지는 나왔는데

ex. 커피 용품을 많이 사는 사람들의 그룹이 나온다면 그 상품들의 aisle 안에서 판매순위 높은 제품을 해당 그룹에 추천하면 좋지 않을까.

1순위만 뽑을지 아니면 전체 순위를 매겨서 저장할지 고민중.