quarta-feira, 20 de abril de 2016

Introdução a Estatística - Resumão

O que é estatística:
A Estatística, com base na Teoria das Probabilidades, fornece técnicas e métodos de análise de dados que auxiliam o processo de tomada de decisão nos mais variados problemas onde existe incerteza.
Qual a diferença entre estatística descritiva e inferencial
  • Descritiva: Etapa inicial da análise utilizada para descrever, organizar e resumir os dados coletados. A estatística descritiva tem como objetivo a descrição dos dados, sejam eles de uma amostra ou de uma população.
  • Inferencial: preocupa-se com o raciocínio necessário para, a partir dos dados, se obter conclusões gerais. O seu objetivo é obter uma afirmação acerca de uma população com base numa amostra. Estas inferências ou generalizações podem também ser de dois tipos: estimações ou decisões (testes de hipóteses).
Importância da estatística:
A estatística é responsável pelo planejamento de experimentos, interpretação dos dados obtidos através de pesquisas de campo e apresentação dos resultados de maneira a facilitar a tomada de decisões por parte do pesquisador/gestor.
A estatística é a ciência que permite extrair dos dados a informação necessária para que seja possível tomar decisões acertadas com base em um determinado nível de confiança e margem de erro, de forma a minimizar o risco envolvidos.
Etapas do método estatístico:
  • Definição do problema: deve estar claro o problema a ser analisado e qual tipo de decisões que se pretende tomar.
  • Coleta de dados: pode ser:
- de forma direta e com dados primários, onde as informações são coletadas pelo pesquisador; ou
- de forma indireta e com dados secundários, onde o pesquisador utiliza informações já existentes para sua pesquisa.

Periocidade da coleta de dados:
- Contínua: realizada permanentemente;
- Periódica: quando feita em intervalos de tempo;
- Ocasional: quando feita de modo esporádico (de vez enquando)
  • Crítica dos dados: proceder uma revisão dos dados coletados
  • Apresentação dos dados: organizar os dados de maneira prática e racional, para um melhor entendimento do fenômeno que se pretende estudar (principal objetivo da estatística descritiva).
  • Análise e Interpretação dos dados: interpretar os resultados encontrados.

Definição e Conceitos básicos
  • População: refere-se a todos os indivíduos ou a todos os objetos do grupo que está em estudo. Ex: leitores do Brasil.
  • Amostra: um conjunto de dados ou observações extraídas da população que se estuda. Tem por objetivo tirar conclusões sobre esta população. Ex. Vou estudar todos os alunos de adm do mack (isso é população). Mas quando digo que será só os do campus Alphaville se torna uma amostra.

Variável Quantitativa:
Está relacionada a medição, enumeração, contagem ou cálculo, pode ser:
  • Discreta (exata): Números naturais inteiros.
    Ex: nº de carros estacionados; tamanho de roupas;
  • Contínua: Conjunto de números reais, podendo ser quebrado.
    Ex: Comprimento; idade, volume, velocidade, peso, altura.
Variável Qualitativa:
Consiste em atributos, classificação ou registro não numérico. Ela não pode ser medida matematicamente, pode ser:
  • Nominal: Não tem ordem.
    Ex: Nacionalidade, gênero, religião.
  • Ordinal: Segue uma ordem.
  • Ex: Classe social; lista de concurso; tópicos de um livro

Tipos de Frequências:
  • Simples: Quantas vezes o dado/variável aparece na minha pesquisa;
  • Acumulada: números de dados acumulados da frequência simples;
  • Relativa: é a porcentagem da frequência simples pelo total de pessoas entrevistadas; e
  • Relativa acumulada: números de dados acumulados da frequência relativa


Construção de tabelas de frequência para dados contínuos:
  • Determinar a amplitude total da distribuição: Maior – Menor
  • Determinar o número k de classes: K = 
  • Calcular amplitude de cada classe: Intervalo / K
  • Para evitar que os valores extremos sejam excluídos, verificar se K vezes a amplitude é maior que a amplitude total;
  • Rever a amplitude se uma determinada classe tenha frequência Zero.

Ponto Média da classe: Limite Inferior + Limite Superior / 2

Medidas Estatísticas:
Média: a somatória de todos os elementos, dividido pela quantidade de elementos;

Resolução:
  1. Calcula o ponto médio dos intervalos (PM = Limite inferior + Limite Superior / 2);
  2. Multiplica o PM do intervalor pelo valor da frequência correspondente (faça isso em todos os intervalos) na sequência soma-se todos os resultados;
  3. Calcule a soma das frequências;
  4. Por fim, divide o valor obtido na etapa 2 pelo resultado da etapa 3.

Moda: é o dado que aparece com a maior frequência. Pode acontecer de um conjunto de dados não possuir moda, assim como é possível ter dois dados com a mesma quantidade de frequência, onde chamamos de bi modal.


Mediana: é o valor do meio do conjunto, ou o valor médio dos dois valores centrais, que divide o conjunto de valores ao meio.
Número ímpar de dados, como resolver: {3,4,8,9,10}
  • Pega o nº total de elementos e divide por 2
    5/2 = 2,5 (quando o resultado é quebrado você considera o próximo nº inteiro. = 3)
Esse resultado (3) dita qual a posição que a mediana está, então a mediana do conjunto apresentado é o nº 8.
Número par de dados, como resolver: {2,4,6,8}
  • Pega o nº total de elementos e divide por dois:   4/2 = 2 
  • O resultado no diz que eu vou pegar o valor do 2º elemento + o valor do próximo elemento e dividir por 2, ficando assim: Md= 2º elemento + 3º elemento / 2
    4+6/2 = 5. O resultado é minha mediana então vou ter que adicioná-lo na sequência {2,4,(5),6,8}

 Mediana em intervalos:




Medidas de dispersão

Amplitude Total: é a diferença entre o maior (último) e o menor (primeiro) valor de uma série.
Desvio Médio: é uma média aritmética dos desvios de cada elemento da série para a média da série


Resolução:
  1. Acha o ponto médio de cada intervalor e multiplica pela frequência;
  2. Soma-se os resultados e divide pelo total de elementos, tendo assim a média;
  3. DM = (Média da série – PM do intervalo) x a frequência / nº total de elementos.

Variância: é a média aritmética calculada a partir dos quadrados do desvio padrão. É uma medida direta da dispersão do conjunto, no sentido de que os conjuntos com os dados mais dispersos terão maior variância.
Quando se trata de população não subtrai o nº 1 do “n” (denominador)

Desvio Padrão: é uma medida da variação dos valores em torno da média. É uma espécie de desvio médio dos valores em relação à média que é calculado: (amostra)

Probabilidades


P(x) = n quero / n tenho 

P(A) + P(B) = 1

P (A ∩ B) = probabilidade de ocorrência de ambos = P(A) x P (B/A)

P (A u B) = probabilidade de A ou B = P (A) + P(B)


Distribuição de Probabilidades

Variável Aleatória Discreta

Fórmulas:

Média: E(x) = x . p(x) + x . p(x)

Desvio Médio: E(xˆ2) = xˆ2 . p(x) + xˆ2 . p(x)

Variância: Desvio Médio - Médiaˆ2 = E(xˆ2) - {E(x)}ˆ2


Binomial

Variável Qualitativa

P (x=k) = n!                           sendo n = total (amostra) e k = o que quero
______ 
k! (n-k)!

p^x . qˆn-x

Ex. de utilização: P (x<2) = P (x=0) + P (x=1)


Outras fórmulas:

Média = n.p                           sendo n=total, p=sucesso e q=fracasso

Variância = n . p . q

Desvio = Raiz variância


Poisson 


Normal

Variável Contínua

Z = x - M / S                 Sendo Z = normal, x = o que eu quero, M = média e S = Sigma 



Propriedades: 



M - S (sigma) = descobrir o pedaço verde


M = n . p


G = Raiz de n . p . q

Nenhum comentário:

Postar um comentário