Tem alguma pergunta?
Mensagem enviada. Fechar
4.75
1018 avaliações

Estatística para Ciência de Dados e Machine Learning

Aprenda na teoria e na prática tudo o que você precisa saber sobre estatística em Data Science utilizando o Python!
6.989 Alunos Inscrito
  • Descrição
  • Currículo
  • FAQ
  • Revisões
  Tempo de leitura 4 minutes

A Estatística proporciona os meios e as ferramentas para encontrar estrutura em dados com o objetivo de fornecer insights sobre as informações mais profundas ali escondidas. Medidas estatísticas como média, mediana, moda, desvio padrão e distribuição servem para descrever o comportamento das variáveis de uma base de dados, assim como identificar anomalias. Em outras palavras, é preciso conhecer a “matéria-prima” com que se está trabalhando por meio de características que nos servem de resumo sobre sua natureza. Esse é o objetivo da Estatística! Se os algoritmos de machine learning são as ferramentas que os cientistas de dados operam, a Estatística é o conhecimento sobre como e porquê essas ferramentas funcionam, permitindo escolher as ferramentas mais adequadas para tirar o melhor proveito delas.

Existe um ditado atribuído a Josh Wills, ex-funcionário do Google e do Cloudera e atualmente presidente de Engenharia de Dados do Slack: um cientista de dados é um programador melhor do que qualquer estatístico e um estatístico melhor do que qualquer programador. Sem um bom conhecimento estatístico, o cientista de dados é como um soldado cego com um arsenal poderoso. O domínio estatístico torna seu trabalho mais direcionado, eficiente e robusto, e permite uma utilização mais ativa dos modelos de machine learning já estabelecidos, uma vez que ele tem o conhecimento necessário para investigar as bases teóricas que fundamentam esses modelos.

Baseado nisso, neste curso você terá uma visão teórica e principalmente prática passo a passo sobre os principais conceitos de Estatística, bem como sua ligação com a Ciência de Dados e a Aprendizagem de Máquina (Machine Learning). Você aprenderá a teoria, os cálculos passo a passo, implementará os cálculos utilizando a linguagem de programação Python e também utilizará bibliotecas prontas! O diferencial deste curso é que além de aprender estatística, você aprenderá como utilizá-la em aprendizagem de máquina. O conteúdo está dividido em nove partes: (i) população e amostra, (ii) dados relativos e absolutos, (iii) distribuição de frequência, (iv) medidas de posição e dispersão, (v) distribuições estatísticas, (vi) probabilidade, (vii) intervalos de confiança e testes de hipóteses, (viii) correlação e regressão e (ix) visualização. Confira abaixo alguns dos tópicos que você aprenderá, integrando os conceitos estatísticos com aprendizagem de máquina e ciência de dados:

  • Uso de amostragem para trabalhar com dados desbalanceados em classificação ou regressão (undersampling e oversampling)

  • Cálculos de distribuição de frequência para aplicação de regras de associação

  • Avaliação de algoritmos de classificação utilizando medidas de posição e dispersão

  • Seleção de atributos utilizando cálculos de variância

  • Preenchimento de valores faltantes em bases de dados utilizando medidas de posição

  • Cálculo de padronização (z-score) aplicado em machine learning

  • Tratamento de dados enviesados em machine learning

  • Uso de distribuições estatísticas para inicialização de pesos em redes neurais artificiais

  • Algoritmo Naïve Bayes utilizando as distribuições de Bernoulli e Multinomial

  • Previsões com probabilidade em machine learning

  • Uso das técnicas ANOVA e Qui Quadrado para seleção de atributos em bases de dados

  • Testes de hipóteses paramétricos e não paramétricos, aplicados na avaliação de algoritmos

  • Previsão do preço de casas utilizando regressão linear

  • Criação de gráficos e mapas para ajudar na interpretação de dados

Este é o curso ideal caso você queira aumentar significativamente seus conhecimentos em Estatística, Ciência de Dados e Machine Learning, mais de 160 aulas com exercícios resolvidos! O curso é para todos os níveis de conhecimento, ou seja, se você é iniciante ou de nível avançado conseguirá aproveitar o conteúdo.

Distribuições estatísticas
How long do I have access to the course materials?
You can view and review the lecture materials indefinitely, like an on-demand channel.
Can I take my courses with me wherever I go?
Definitely! If you have an internet connection, courses on Udemy are available on any device at any time. If you don't have an internet connection, some instructors also let their students download course lectures. That's up to the instructor though, so make sure you get on their good side!
4.75
1018 avaliações
Estrelas 5
725
Estrelas 4
248
Estrelas 3
37
Estrelas 2
6
Estrelas 1
2