BEM-VINDO
Olá, seja muito bem-vinda(o) ao meu portfolio de projetos em Ciência de Dados.
Meu nome é Manoel Luiz Menezes Mendonça.
Nesta página, eu demonstro minhas habilidades em resolver problemas de negócio utilizando conceitos e ferramentas da Ciência de Dados, por meio de projetos fazendo uso de dados públicos.
Também são apresentadas aqui as minhas experiências profissionais e habilidades envolvendo ferramentas e conceitos da Ciência de Dados.
Por fim, ficaremos felizes em receber seu contato, o que poderá ser feito por meio dos links apresentados ao final desta página.
SOBRE MIM
Segue um breve relato. Sou engenheiro eletrônico com muitos anos de experiência em programação, tendo trabalhado em projetos nas linguagens C, Visual Basic, VBA, PHP, plugin WordPress, SQL, bancos de dados MySQL, SQLite, MS-Access.
Estou em migração de carreira para a área de ciência de dados desde meados de 2023. Tenho um portfolio de projetos (abaixo) no qual faço uso da linguagem Python e suas bibliotecas Scikit-Learn, Matplotlib, Streamlit, Numpy, Pandas, entre outras, para resolver problemas de negócios usando conceitos e ferramentas da ciência de dados, tais como algoritmos de classificação, regressão e clusterização.
Minha experiência de trabalho indica flexibilidade para realizar trabalhos técnicos e científicos, gerenciar equipes técnicas, administrar por indicadores de resultados, ministrar treinamentos, lidar com atendimento ao público, indicar solução para problemas jurídicos. Sempre voltado para estabelecer e manter ótimo relacionamento de trabalho com colaboradores e clientes.
Minha formação acadêmica privilegia a aprendizagem ativa (Life Long Learning). Pós-graduação em Finanças Quantitativas. Graduação em Engenharia Eletrônica. Graduação em Direito.
Meu hobby é passear com a família. Gosto também de estudar música.
HABILIDADES
Linguagens de Programação
- Python com foco em análise de dados
- Pensamento Estratégico
- Conceitos de ETL
- SQL Language
- Outras linguagens: VBA, VB, C.
Visualização de Dados
- Matplotlib, Plotly, Seaborn.
- Streamlit
Estatística e Machine Learning
- Estatística descritiva: localização, dispersão, assimetria, kurtosis, densidade
- Algoritmos de regressão, classificação e clusterização
- Regressão Linear, Xgboost, Catboost, Lightgbm, Decision Trees, Random Forest, Voting Regressor.
- Métricas de desempenho: MSE, RMSE, MAE, MAPE, SMAPE, Confusion Matrix, Precision, Recall, ROC Curve, Silhouette Score e R2.
- Pacotes de Machine Learning: Scikit-Learn
Engenharia de Software
- Git, Github
- Streamlit Cloud
- Bancos de dados: SQLite/MySQL/MS-Access
EXPERIÊNCIAS
Na condição de participante do programa de formação em ciência de dados na Comunidade DS, tenho tido a oportunidade de estudar a aplicação de técnicas de aprendizado de máquina na resolução de uma série de problemas de negócio. Os exemplos vão sendo acrescidos ao presente portfolio de projetos, conforme se verifica mais abaixo.
Os projetos incluem:
- (I) a otimização de preços de varejo por meio de regressão e machine learning,
- (II) a criação de um painel gerencial em nuvem (dashboard em streamlit) com as principais métricas de uma empresa marketplace de restaurantes, e
- (III) o ensaio de machine learning para o teste comparativo de diversos algoritmos de classificação, regressão e clusterização.
Além disso, durante os mais de 24 anos de trabalho como AFRFB na Receita Federal do Brasil, bem assim os 2 anos e meio na Secretaria Federal de Controle, tive experiências de trabalho que podem ser assim resumidas: trabalho em grupo no apoio e coordenação de equipes de modelagem de sistemas informatizados; participação em grupos de normatização de procedimentos; atendimento ao público (plantão fiscal) para esclarecimentos de dúvidas de caráter tributário; criação e utilização de bancos de dados para fiscalização de pessoas jurídicas; instrutor em treinamentos de bancos de dados e de sistemas informatizados; gestão de pessoas; gestão de processos; gestão do atendimento ao público; chefia de setores; acompanhamento, cálculo e gestão para melhoria dos indicadores de desempenho do órgão regional do Rio de Janeiro.
Nos quase 12 anos de trabalho no Centro de Pesquisas de Energia Elétrica da Eletrobrás (Cepel), iniciando como estagiário de engenharia e seguindo como pesquisador efetivo, tive experiências de trabalho que podem ser assim resumidas: estudo de projeto de hardware de sistema de digitalização de sinais analógicos e montagens de sistema de aquisição de dados de séries temporais digitais; desenvolvimento e expansão do hardware do sistema de aquisição de dados; desenvolvimento de software para processamento de sinais; Montagem, testes e colocação em produção do projeto de hardware (wire-up); programação em linguagens Assembly 8086 e C; participação em estudos de laboratório e eventuais medições de campo; desenvolvimento de projetos de circuitos analógicos e digitais para estudos de simulação de redes elétricas.
PROJETOS EM CIÊNCIA DE DADOS
Apresentamos a seguir alguns projetos envolvendo a aplicação de técnicas e ferramentas de Ciência de Dados para a solução de problemas de negócios típicos encontrados pelas empresas.
PROJETO: Otimização de Preços com Regressão e Machine Learning
DESCRIÇÃO:
O desafio neste trabalho foi o de encontrar os preços dos produtos novos e recém lançados de uma empresa de e-commerce de roupas, calçados e acessórios, otimizando os preços com base nas informações dos produtos já existentes, ou seja, considerando as características de marca, estilo, categoria, tamanho e outras.
O resultado final do projeto foi um modelo de machine learning capaz de prever os preços das mercadorias a partir do histórico de vendas da empresa varejista, com erro de 8,2%. O resultado consistiu também na elaboração de insights relacionados ao negócio, a partir da análise do histórico de dados.
O trabalho é resultado de uma competição de ciência de dados, tendo a nossa equipe – “May The Data Be with You” – alcançado o primeiro lugar no evento (conforme site Kaggle).
FERRAMENTAS UTILIZADAS:
- Linguagens: Python e Scikit-Learn
- Algoritmos de Regressão: Linear Regression, Xgboost, Catboost, LightGBM, Random Forest, Voting Regressor.
- Algoritmo de Agrupamento: K-Means.
- Análise Exploratória de Dados: análise univariada, bivariada e multivariada.
PROJETO: Ensaio de Machine Learning
DESCRIÇÃO:
O objetivo deste projeto foi realizar ensaio comparativo de diversos algoritmos de machine learning (ML) aplicados às tarefas de classificação, regressão e agrupamento. Para tanto, exploramos os principais conceitos de treinamento, ajuste de parâmetros e limiares entre overfitting e underfitting para os algoritmos trabalhados.
O resultado final do projeto foi um painel mostrando o desempenho comparativo dos algoritmos de ML, a partir da variação dos valores dos principais parâmetros de cada algoritmo, de modo a controlar os estados de overfitting e underfitting.
FERRAMENTAS UTILIZADAS:
- Linguagens: Python e Scikit-Learn
- Algoritmos de classificação: KNN, Decision Tree, Random Forest e Logistic Regression.
- Algoritmos de regressão: Linear Regression, Decision Tree Regressor, Random Forest Regressor, Polinomial Regressor, Linear Regression Lasso, Linear Regression Ridge, Linear Regression Elastic Net, Polinomial Regressionn Lasso, Polinomial Regression Ridge e Polinomial Regression Elastic Net.
- Algoritmos de agrupamento: K-Means e Affinity Propagation
- Métricas de desempenho: Accuracy, Precision, Recall e F1-Score, R2, MSE, RMSE, MAE, MAPE e Silhouette Score
PROJETO: Desenvolvimento de um Painel Gerencial para Negócio com o Streamlit
DESCRIÇÃO:
Nesse projeto, utilizamos os conceitos de Programação em Python, manipulação de dados, pensamento estratégico e lógica de negócio, junto com ferramentas de desenvolvimento web, tais como Streamlit e Github, tudo isso para desenvolver um painel gerencial (dashboard) com as principais métricas de uma empresa marketplace de restaurantes.
O resultado final do projeto foi um painel hospedado em um ambiente Cloud e disponível por meio de um link web. O painel pode ser acessado por qualquer dispositivo conectado na internet.
FERRAMENTAS UTILIZADAS:
- Python
- Streamlit, Streamlit Cloud, Github.
- Visual Studio Code, Jupyter Notebook, Terminal.
CONTATO
Sinta-se à vontade para entrar em contato:
- Linkedin: https://www.linkedin.com/in/manoelmendonca-eng-adv/
- E-mail: manoelmendonca@hotmail.com
- E-mail alternativo: manoelmendonca@id.uff.br
Qualquer sugestão ou dúvida, por favor entre em contato.