Descrição:
O desafio neste trabalho foi o de encontrar os preços dos produtos novos e recém lançados de uma empresa de e-commerce de roupas, calçados e acessórios, otimizando os preços com base nas informações dos produtos já existentes, ou seja, considerando as características de marca, estilo, categoria, tamanho e outras.
O resultado final do projeto foi um modelo de machine learning capaz de prever os preços das mercadorias a partir do histórico de vendas da empresa varejista, com erro de 8,2%. O resultado consistiu também na elaboração de insights relacionados ao negócio, a partir da análise do histórico de dados.
O trabalho é resultado de uma competição de ciência de dados, tendo a nossa equipe – “May The Data Be with You” – alcançado o primeiro lugar no evento (conforme site Kaggle).
Ferramentas utilizadas no projeto:
- Linguagens: Python e Scikit-Learn
- Algoritmos de Regressão: Linear Regression, Xgboost, Catboost, LightGBM, Random Forest, Voting Regressor.
- Algoritmo de Agrupamento: K-Means.
- Análise Exploratória de Dados: análise univariada, bivariada e multivariada.
Repositório do projeto:
Veja o código e demais detalhes no repositório do projeto no GitHub