Data Science

Aprenda as técnicas e metodologias que estão revolucionando os negócios

Principais áreas dos alunos que buscam esse curso

Figura de anúncio de computador

Marketing e CRM

Figura de calculadora e dinheiro

Mercado Financeiro

Figura de foguete e saco de dinheiro

Riscos e compliance

Figura de um chip

Tecnologia

Motivos para fazer este curso

Figura de servidores e métricas

Flexibilidade para atuar em qualquer empresa!

Após o término do curso, você terá a oportunidade de aplicar para qualquer vaga de Cientista de Dados do mercado, em qualquer tipo de indústria. O salário médio de um Cientista de Dados Pleno é de cerca de R$ 8.500 podendo chegar a R$ 15.000 após alguns anos de experiência.

Figura de pessoas e decisões

Dominar não só as ferramentas, mas as técnicas!

Aqui na Preditiva você vai aprender a trabalhar com o SQL, Python, AWS e várias outras ferramentas importantes de Dados. Mas as ferramentas de mercado mudam a todo tempo. O mais importante é dominar as técnicas de Ciência de Dados, que são muito valorizadas no mercado.

Figura de conquista de pessoa

Empregabilidade duradoura

Ciência de Dados é uma das carreiras mais requisitas pelas empresas no Brasil e no Exterior. E devido à baixa oferta de profissionais, essa demanda não tem hora para acabar. Grande oportunidade para todos os profissionais que apostarem na área.

ballon text

A experiência dos nossos alunos

Figura do número seis

coisas você será capaz de fazer depois deste curso

Figura de analytics

Entender as técnicas Estatísticas fundamentais

Um Cientista de Dados deve conhecer o ferramental matemático e estatístico de todos os modelos.

Figura de analytics

Utilizar Python com desenvoltura

Utilizar os principais pacotes de Ciência de Dados da linguagem de programação Python.
Ex: Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn, Tensorflow.

Figura de analytics

Desenvolver modelos clássicos e de Machine Learning

Resolver problemas de clusterização, regressão e classificação utilizando as principais técnicas disponíveis no mercado.

Figura de analytics

Avaliar a qualidade dos modelos

Realizar o devido diagnóstico dos modelos, avaliando assim a sua qualidade e capacidade preditiva.

Figura de analytics

Aplicar Metodologia Ágil em Data Science

Entender a importância de cada etapa no desenvolvimento de modelos e garantir que seu resultado agregue valor para o negócio

Figura de analytics

Trabalhar com NLP e Visão Computacional

Criação de modelos usando dados não estruturados de NLP (Textos) e Visão Computacional (Imagens e Vídeos).

Conteúdo programático

Figura analytics

Nivelamento Matemático para Data Science

  1. Álgebra Linear: Vetores, Matrizes e suas principais operações.
  2. Cálculo: Funções, Limites e Derivadas.
  3. Técnicas de Otimização: Busca de mínimos e máximos de uma função Linear e Não Linear.
Figura analytics

Nivelamento Estatístico para Data Science

  1. Estatística descritiva: Medidas resumo de posição e dispersão.
  2. Probabilidades e suas Distribuições: Modelos discretos e contínuos.
  3. Inferência estatística: Amostra, População, estimadores, Viés, Estimação, Testes de Hipóteses, Valor P.
Figura analytics

Nivelamento de Programação para Data Science

  1. Python para Ciência de Dados:
    • Estrutura de dados: Strings, Listas, Tuplas, Set's, Arrays e Dicinários.
    • Estruturas de controle: IF's e Loops.
    • Definições de funções e classes.
  2. Overview das principais bibliotecas para Data Science: Numpy, Pandas, Scikit-learn e Matplotlib, H2O.ai entre outras.
  3. Outras ferramentas e linguagens utilizadas. Ex: R, SQL, Knime, etc.
  4. Versionamento de códigos: Overview sobre o Git e Github.
Figura analytics

Introdução à Data Science

  1. O que é Data Science e quais suas principais aplicações?
  2. Os tipos de profissionais de Dados: Analistas, Engenheiros e Cientistas de Dados.
  3. O que são modelos e para que servem?
  4. Diferenças entre modelos descritivos e preditivos
  5. O Processo de Aprendizado de Máquina:
    • Minimização da Função de Custos usando o método Gradient Descent
  6. Os tipos de modelagem: Métodos Supervisionados, Semi Supervisionados e Não Supervisionados.
  7. Abordagem Clássica de Modelos (Inferencial) vs Abordagem Moderna de Modelos Machine Learning
Figura analytics

Aprendizado Supervisionado e Semi Supervisionado

  1. Regressão Linear Simples e Múltipla
  2. Séries Temporais e Forecasting
  3. Árvores de Decisão
  4. Regressão Logística
  5. SVM (Support Vector Machines)
  6. Naive Bayes
  7. Redes Neurais Artificiais
  8. Ensemble de modelos: Blending, Bagging (Random Forests), Boosting e Stacking
Figura analytics

Diagnóstico de Modelos Supervisionados

  1. Métricas de performance:
    • R Quadrado, R Quadrado Ajustado, MSE e Análise de Resíduos.
    • Matriz de Confusão, Acurácia, Sensibilidade e Especificidade, Precision e Recall, F1 Score, KS, Curva ROC e Gini.
  2. Validação Cruzada (Conjuntos de Treinamento, Validação e Teste): Métodos Holdout e K-Fold.
  3. Problemas comuns em modelos: Overfitting e Underfitting (The Bias and Variance Problem).
  4. Técnicas de Regularização: L1, L2 e Dropout.
  5. Trade Off em Ciência de Dados: Acurácia, Interpretabilidade e Performance.
  6. Desafios em amostras altamente desbalanceadas (eventos raros)
  7. Tuning de Hiperparâmetros: Grid Search e Algoritmos Genéticos.
  8. O que fazer quando seu modelo perder performance?
Figura analytics

Aprendizado Não Supervisionado

  1. Clusterização:
    • k-Means, DBSCAN, Hierarchical Clustering, Gaussian Mixtured Models (GMM), Self-Organizing Maps (SOM).
  2. Redução de dimensionalidade:
    • Análise de Componentes Principais (PCA)
    • Autoencoder
    • t-SNE.
  3. Detecção de Anomalias:
    • Métodos Gaussianos, Autoencoders e Isolation Forest.
  4. Sistemas de Recomendação: Market Basket Analysis (Clientes que compram X também compram Y).
Figura analytics

Introdução a análise de dados não estruturados

  1. Feature Engineering Extraindo características dos dados
  2. Overview sobre dados não estruturados em NLP (Processamento de Linguagem Natural):
    • Análise descritiva em NLP: Tokenização, Contagem de Palavras e Word Clouds.
    • Técnicas de pré-processamento: Lematização/Stemming, Stop Words e Normalização.
    • Representação de textos: One Hot, TF-IDF, Word Embeddings (Word2Vec e GloVe).
    • Modelos de Classificação usando Textos (Ex: Análise de Sentimentos).
  3. Overview sobre dados não estruturados em Computer Vision (Visão Computacional):
    • Redes Neurais Convolucionais (CNN)
    • Detecção de objetos
    • Reconhecimento Facial
Figura analytics

Framework de Desenvolvimento de Modelos

  1. Entendimento das necessidades de negócio
  2. Planejamento Amostral e Noções de Planejamento de Experimentos
  3. Governança de Dados
  4. Metodologia Ágil para Data Science: MV (MPD) – Minimum Viable Model, Plataform e Data Product.
  5. Deploy de modelos:
    • Busca das plataformas de deploy
    • Deploy em Batch, Near Real Time, Real Time.
    • Machine Learning at Scale: AWS, Google Cloud Plataform e Azure.
    • Preparando os modelos para produção
    • Construindo Pipelines de Modelos e suas API’s
  6. Técnicas de Acompanhamento de Modelos
  7. Mensurando o valor que Data Science entrega para o negócio:
    • Como vender seu modelo para a área cliente?
    • Calculando os resultados financeiros das decisões usando Data Science
  8. Outras metodologias utilizadas. Ex: CRISP-DM.
Figura analytics

Projeto final (Capstone)

  1. Mercado Financeiro: Modelos de Crédito, Seguros e Trading Algorítmico.
  2. Marketing e CRM: Segmentação de clientes, Recomendação de Produtos, Cliente propenso à Compra.
  3. People Analytics e RH: Previsão de turnover de colaboradores e melhor candidato para a vaga.
  4. Jurídico: Probabilidade de ganho de ações jurídicas.
  5. Atendimento: Desenvolvimento de um Chatbot.
  6. Tecnologia: Reconhecimento Facial.
Figura sala de aula

Próximas turmas

Investimento na sua carreira

Aulas Ao Vivo via Streaming. Após cada aula, o conteúdo fica gravado e disponível no Portal do Aluno para você ver e rever quantas vezes quiser.

Conteúdo que valoriza o seu tempo

  • Figura computador com um play

    140h Aulas Ao Vivo

    100h Aulas e Conteúdo Online

  • Figura de relógio

    Totalizando 240 horas

Investimento

ou

Quero me matricular *Sujeito à análise de crédito pelo parceiro Provi.

Financie seu desenvolvimento profissional

Encontre a melhor forma de financiar sua carreira:

No boleto ou PIX com 10% de desconto à vista.

No boleto parcelado, em até 18 vezes, através de nosso parceiro Provi.

Cartão de crédito em até 6 vezes.

Convênios e parcerias. Trabalhamos com descontos para empresas parceiras. Verifique se a sua empresa já faz parte.

Reembolso corporativo. Nós listamos alguns dos vários motivos para que você convença o seu gestor/empresa a investir em você. Busque o patrocínio da empresa!

Convença o seu gestor a financiar o seu desenvolvimento em Analytics

Separamos alguns motivos pelos quais você terá grande proveito do nosso curso e como você conseguirá aplicá-lo na sua rotina corporativa.

Olá @,

Pesquisando por conteúdos e cursos que pudessem melhorar meu lado analítico, encontrei a Preditiva Analytics. Este curso irá melhorar o meu trabalho e a minha produtividade.

Espero seu apoio e da empresa para investirem neste meu aprendizado porque...

Baixar carta completa para o seu Gestor

A gente entra em contato com você!

4 motivos para fazer nossos cursos

Ampliar hard skills. As habilidades analíticas são cada vez mais avaliadas pelos recrutadores. Aprenda a analisar dados!
Ampliar soft skills. Resolução de problemas é uma das competências mais valiosas para as empresas. Somos especialistas em problem-solving!
Ascensão profissional. Com os conhecimentos adquiridos nos curso, você dará um salto na carreira.
Aumento de salário. As organizações reconhecem profissionalmente e financeiramente os colaboradores com skill em Analytics. Seja valorizado no mercado!

Preencha o formulário abaixo para seguirmos com os próximos passos!

Ficou com alguma dúvida?

Veja a nossa FAQ sobre o Curso Data Science

Qualquer um pode se inscrever no curso?

Com certeza! Ciência de Dados e Analytics são utilizadas em todas as áreas. Desta forma, todo profissional deve desenvolver essas habilidades para se destacar no mercado e garantir a empregabilidade nos próximos anos.

O conteúdo do curso é prático?

Sim, além de aprender os conceitos fundamentais para um profissional da área de Analytics, você realizará exercícios com dados reais, trocará experiências com os demais alunos e participará de discussões que ampliarão ainda mais seus conhecimentos.

Preciso saber linguagens de programação ou Microsoft Excel?

Para o curso Foundations, utilizamos o Excel como ferramenta principal. Não é exigido conhecimento prévio, embora seja recomendável. Caso não conheça a ferramenta, não se preocupe. Fornecemos esse overview da ferramenta para você. Sobre linguagens de programação, a partir do curso Master I são introduzidas as linguagens R e Python para Ciência de Dados, sendo necessário um conhecimento de programação para melhor aproveitamento do curso. Por esse motivo, fazemos a curadoria de conteúdos que te permitem revisar ou mesmo aprender esses conceitos antes de iniciar seu curso conosco.

Onde serão as aulas?

Nosso escritório é na Berrini, e as aulas presenciais são ministradas na Av. Paulista, ao lado do Metrô Consolação. Porém, devido a pandemia do COVID-19, neste momento as aulas estão sendo exclusivamente no formato online ao vivo.

Sou de fora de São Paulo, consigo participar assim mesmo?

Sim, neste momento de pandemia em que as aulas estão sendo exclusivamente no formato online ao vivo, você pode participar de qualquer lugar do Brasil ou do mundo.

Preciso levar/usar meu notebook? Qual configuração mínima?

Sim, seu notebook será sua principal ferramenta de trabalho. Sugerimos como configuração mínima um processador i5 ou similar com pelo menos 4 núcleos e 8GB de memória RAM.

Qual é a diferença entre Analytics e Ciência de Dados?

Analytics é o conjunto de conhecimentos envolvidos na identificação de padrões e obtenção de conclusões a partir de um conjunto de dados para a tomada de decisão fundamentada no método científico.

Ciência de Dados é um termo que tem sido usado de forma ampla para designar atividades que envolvem a obtenção de conhecimento e a aplicação desses na tomada de decisão de forma automática.

Dessa forma, Analytics é utilizada em Ciência de Dados, porém também existe fora dela. Enquanto que Ciência de Dados envolve uma gama mais ampla de conhecimentos, muito deles necessários ao trabalho com grande volume, variedade de dados e a velocidade necessária para uso das informações na tomada de decisões de forma automática.

Recebo algum certificado após a conclusão do curso?

Ao concluir cada curso você recebe um certificado digital para compartilhar nas redes sociais como LinkedIn, Facebook e outros.