09.04 1,2주 내용발표
각 조의 지난 1, 2주차 진행 상황을 보고하는 아침 발표 진행함.
회의록 기록해둔 것으로 발표하기로 함 → 선정한 프로젝트 설명하는 부분, 주제 구체화 부분 앞쪽에 추가하면 좋을 듯하다.
(숙희언니 회의록 완전 체계적이다 ㅇ0ㅇ)
※ ppt화살표는 Alt+I+S의 화살표로 쓰기 그래야 안 깨진다. 깨알같은 전문성.
※ 글씨체, 폰트 사이즈, 디자인의 통일성은 기본. 문장형이 아닌데 마침표를 쓰는건 지양하고 어미를 통일시켜야 함.
아침시작미팅
지금까지 기초적인 분석을 개별적으로 나누어서, 자유롭게 해왔는데 시간적으로 매우 비효율적인 듯하다.
추석 전까지 모델을 완성하기로 한 만큼 또 언젠가 작업을 합쳐야 하니까 역할 중심으로 나눠서 두 팀으로 나눠 진행하기.
아이디어(비즈니스적 목표) / 역할 - 분석(고급), 모델링
:: 문제상황 해결을 위한 ML - 지금까지 나온 비즈니스 아이디어 분류
idea1. 추천 장바구니 (자동)
- 문제 상황 :
- 결과물 방향 : input → 고객별 재구매율 높은 상품? 그동안의 주문 내역..Kaggle 현 대회랑 동일 / output → 재구매 할 것으로 예측된 상품
idea2. 구매한 것과 관련있는 상품 정기 배송 (정기구독)
- 문제 상황 :
- 결과물 방향 : input → / output →
idea3. 장바구니 재료를 보고 레시피 예상해서 추가 구매 추천 (마켓컬리)
- 문제 상황 :
- 결과물 방향 : input → 고객이 장바구니에 담은 물건 목록 / output → 물건 리스트로 관련 레시피를 추려 거기에 있는 연관 상품
(이건 레시피 정보가 필요할듯한데..)
idea2의 확장
ex. 반려동물 장난감 월 단위 정기배송..넷플릭스 추천시스템처럼??
ex. 유기농 시리얼 자주 먹는 사람이면 신상품 중에 좋아할 만한 시리얼을 정기배송 해준다던가, 그 리뷰를 또 반영해서 새로운 상품.
ex. 칼로리, 영양성분 비율 정하면 그 안에서 품목 알아서 구성해서 보내주는 배송 서비스.
식료품계의 넷플릭스를 꿈꾼다!!!
Q.
대부분 organic이 상위라서 aisle이든 Department 별로 top sample을 뽑아서 연관분석 하는게 어떨까?
연관분석이 장바구니 기법이라고 불리던데 거기서 큰 성과를 기대하긴 어려운 듯 하다.
코드가 r로 하면 코드가 짧아서 처리가 빠를텐데 데이터가 커서 전처리가 오래 걸린다.
시급히 해야할것
1. 주차별 계획표 만들기
2. 커널 하나로 합치기
3. 분석과 모델링 등 역할을 기준으로 한 다섯명의 역할분담
+
Instacart에 대한 기본적인 정보 메모해두어야함. 향후 정보 판단에 필요함
After Meeting
어떤 사람들을 대상으로 ex) 아침에 커피를 주로 사는 사람. 일주일마다 바나나를 사먹는 사람
들이 무엇을 함께 사는지를 분석해서 추천해준다던지
애초에 word2vec 자체가 추천시스템을 위해 하는 상관관계 분석이니까..
:: word2vec → 켜 보고 의견 내보기. product name 최빈값 기준으로 (전체 주문목록에서 갯수 카운트) 대략 천 개 데이터로 하자.
대상이 될 사람들 (ex. 점심에 바나나를 주로 많이 사는 사람들의 그룹 기준) 이나 그런 기준을 각자 정해서 word2vec 돌리기.
일단 그 product list랑 또 그걸 산 각 사람들을 기준에 맞게 그룹화해서 연결짓는게 코딩이 문제가 될수도 있으니까
코드 집어넣는 과정 공유합시다.
날짜 \ 요일 | 월 | 화 | 수 | 목 | 금 | 비고 |
1주차 (8/19 - 22) | 주제 선정 | 주제 선정 | 주제 선정 | 주제 선정 | ||
2주차 (8/26 - 30) |
멘토 미팅 - 주제확정 |
데이터 분석(EDA) | 데이터 분석(EDA) |
데이터 분석(상관분석, 연관분석) |
||
3주차 (9/2 - 6) | 데이터 분석(상관분석, 연관분석) | 비상사태 |
멘토 미팅2 분석,ML 역할 분담 |
슈퍼컴 컨퍼런스 참석 | 슈퍼컴 컨퍼런스 참석 | 모델 공부해오기 |
4주차 (9/9 - 13) |
ML 멘토미팅 이날만 가능 |
ML (모델링 완료) | 추석 (이동) | 추석 전날 | 추석 당일 | |
5주차 (9/16 - 20) | ML(보완) |
ML(보완) 멘토 미팅 (예정) |
ML(보완) |
ML(보완) 새로운 데이터 조사 |
ML(보완) 새로운 데이터 조사 및 탐색, EDA |
|
6주차 (9/23 - 27) |
보고서 작성 시작 새로운 데이터 분석 및 전처리 |
보고서 작성 새로운 데이터 전처리 및 ML |
보고서 작성 완료 새로운 데이터 ML |
최종 발표
|
|
|
마지막 주차(9/30) |
수료식 |
|
|
|
|
|