domingo, 5 de outubro de 2014

Aula 6 - Desvio Médio, Desvio Padrão e Variância

MEDIDAS DE DISPERSÃO


Ao efetuar os cálculos da média aritmética, mediana e moda, podemos observar que são medidas de tendência central, ou ainda, são valôres em torno dos quais os dados se distribuem.
Vamos agora analizar o número de gols por partida da última rodada de um campeonato de futebol.

Jogos       1        2         3          4            5             6

nº gols     5        0        11         3            4              1


Nessa rodada, a média aritmética de gols por partida foi:

Média aritmética =       (5+0+11+3+4+1)  : 6  = 24 :6 = 4 gols

Observando a tabela de gols, vemos  que os jogos (2) com  0  gols, e (3), com 11 gols, estão bem mais distantes da média  que como vimos é  4,   que os jogos (1) com 5 gols e (4) com 3 gols.
Em Estatistica, podemos ter uma idéia de como esses dados se distribuem em torno da média, ou seja, se estão muito  ou  pouco dispersos
Para tanto, basta calcular as medidas de dispersão  que são: desvio médio, a variância e o desvio padrão.

DESVIO   MÉDIO

Vamos verificar o desvio do valor que representa o número de gols de cada partida em relação
 a média = 4
( A operação é a seguinte : nº de gols da 1ª partida  menos a média aritmética ( 5-4=1)
                                                         da 2ª partida  menos a média                 ( 0-4=-4)e assim todas as partidas até a 6ª partida.

OBS - O desvio médio é calculado pela média aritmética dos valores absolutos dos desvios, portanto
              Jogos     1           2           3             4           5          6
            Desvios  5-4=1     0-4=-4    11-4=7    3-4=-1   4-4=0   1-4=-3
      Como devemos trabalhar com os valores absolutos dos desvios temos:  16:6 = 2,6
          
 Dm =     (1+4+7+1+0+3 ) : 6 = 2,6  


VARIÂNCIA  (Var)

A dispersão dos dados  também pode ser calculada considerando-se os quadrados dos desvios médios . A média aritmética desses quadrados chamamos de variância ( Var ).

Var = 1² + (-4)²+7² +(-1)² + 0 ² +( -3 )²  = 76 : 6 = 12,6


DESVIO   PADRÃO ( S )

S = raiz quadrada da variância   = 3,5



























sábado, 27 de setembro de 2014

Aula 5 - Moda, Média e Mediana

Moda


Em estatística descritiva, a moda é o valor que detém o maior número de observações, ou seja, o valor ou valores mais frequentes, ou ainda “o valor que ocorre com maior freqüência num conjunto de dados, isto é, o valor mais comum”.
O termo moda foi utilizado primeiramente em 1895 por Karl Pearson, sob influência do termo moda referindo-se ao uso popular com o significado de objeto que se está usando muito no tempo presente. A moda não é necessariamente única, ao contrário da média ou da mediana. É especialmente útil quando os valores ou observações não são numéricos, uma vez que a média e a mediana podem não ser bem definidas.
  • Bimodal: possui dois valores modais.
  • Amodal: não possui moda.
  • Multimodal: possui mais do que dois valores modais.
EXEMPLOS:
A moda de {maçã, banana, laranja, laranja, laranja, pêssego} é laranja.
A série {1, 3, 5, 5, 6, 6} apresenta duas modas (BIMODAL): 5 e 6.
A série {1, 3, 2, 5, 8, 7, 9} não apresenta moda (AMODAL).
A série {1, 3, 5, 5, 6, 6, 7, 7} apresenta mais do que duas modas (MULTIMODAL): 5, 6 e 7
Deve-se observar que aquilo que se expressa como “maioria” num determinado conjunto de dados não necessariamente representa o valor que seja a moda estatística.4



A referência mais antiga conhecida do conceito da moda apresenta-se no cerco no inverno de 428 a.C. dos peloponésios e beócios aos plateus e atenienses. Os sitiados, necessitando construir escadas adequadas às muralhas inimigas, fizeram com que muitas pessoas contassem as fileiras de tijolos. Com tal estratagema, ainda que houvesse um número grande de erros, um número grande de contagem seriaconfiável.


Média


Em estatística a média é o valor que aponta para onde mais se concentram os dados de uma distribuição. Pode ser considerada o ponto de equilíbrio das frequências, num histograma.
Média é um valor significativo de uma lista de valores. Se todos os números da lista são os mesmos, então este número será a média dos valores. Caso contrário, um modo simples de representar os números da lista é escolher de forma aleatória algum número da lista. Contudo, a palavra ‘média’ é usualmente reservada para métodos mais sofisticados. Em último caso, a média é calculada através da combinação de valores de um conjunto de um modo específico e gerando um valor, a média do conjunto.
Média aritmética é a forma mais simples de calcular uma média, mas existem outros métodos, como a mediana (usada quando a distribuição de valores é mal organizada, com grandes e pequenos valores, como valores de rendimento).

Mediana


Em teoria da probabilidade e em estatística, a mediana é uma medida de tendência central, um número que caracteriza as observações de uma determinada variável de tal forma que este número (a mediana) de um grupo de dados ordenados separa a metade inferior da amostra, população ou distribuição de probabilidade, da metade superior. Mais concretamente, 1/2 da população terá valores inferiores ou iguais à mediana e 1/2 da população terá valores superiores ou iguais à mediana.
Outra Definição para o que é Mediana: A Mediana de um conjunto de dados é o dado que fica no meio quando as entradas são colocadas em ordem crescente. Se o conjunto de dados tiver um número par de entradas a mediana será a média entre os dois pontos que estiverem no meio do conjunto. Depois de Ordenados os valores por ordem crescente e decrescente, a mediana é: O Valor que ocupa a posição central, se a quantidade desses valores for ímpar. A Média dos dois valores centrais se a quantidade desses valores for par
A mediana pode ser calculada para um conjunto de observações ou para funções de distribuição de probabilidade.

Aula 4 - Frequências

À partida os dados observados da variável em estudo foram recolhidos e apresentam-se desagrupados, tornando difícil chegar a uma conclusão para resolver o problema proposto.
Para construir uma tabela de frequências começa-se por analisar os dados observados e identificar os valores que estes tomam. Em seguida, conforme a situação, ordenam-se os dados por ordem crescente ou decrescente.
Depois procede-se à contagem e registo do número de elementos existentes, para cada valor dos dados em estudo, em tabelas.
Estas tabelas apresentarão:
. a contagem;
. o número de vezes que cada valor é observado - Frequência Absoluta (fi)
. a razão entre o número de vezes que cada valor do dado é observado (xi) e o número total de observações (N) - obtem-se dividindo a frequência absoluta (fi) pelo número total de dados observados (N) - Frequência Relativa (fri)



. a Frequência Relativa expressa em percentagem para facilitar a comparação entre populações diferentes - obtem-se multiplicando a frequencia relativa por 100. (fri (%))
. a soma das frequências de cada valor com as frequências de todos os valores anteriores acumando assim em cada valor da variável o número de todos os valores anteriores -Frequências Acumuladas que podem ser tanto das frequência Absolutas (Fi) como das Frequências Relativas (Fri)
Exemplo
Perguntou-se aos alunos do 9º ano de uma turma quantos televisores tinham em casa. Obtiveram-se as seguintes respostas:


As respostas são os dados observados da variável estatística, número de televisores por casa, e não estão agrupados. Será difícil olhando para eles tirar conclusões.
Os valores que a variável estatística pode tomar são: 0, 1, 2, 3, 4, 6, 7
Pode-se ordenar por ordem crescente.
Registam-se numa tabela os resultados da contagem e passa-se a ter os dados agrupados a partir dos valores que a variável estatística pode tomar.


Em contraste com os dados recolhidos com esta tabela já se podem tirar algumas conclusões, como por exemplo, que a maioria dosinquiridos tem dois televisores em casa.
No entanto se se acrescentar à tabela anterior duas novas colunas, uma com a frequência relativa (fri) e outra a frequência relativa em percentagem (fri (%)) pode-se tirar mais conclusões e comparar os resultados com estudos semelhantes noutras populações, ou seja, a frequência relativa do valor «4 televisores» é 0,1 que é o mesmo que dizer 10%.



Isto quer dizer que em 100 alunos, 10 têm 4 televisores em casa.
Se a tabela incidisse sobre um grande número de dados seria útil acrescentar mais duas colunas à tabela para apresentar as frequências acumuladas, ou melhor.


Com esta tabela tornava-se muito mais fácil responder à pergunta "Quantos alunos têm menos de 4 televisores em casa?

As tabelas permitem uma leitura de muita informação mas muitas vezes o excesso de informação numérica dificulta a análise do problema. Embora organize bem os dados as tabelas não são a melhor maneira de representar os dados. Uma forma de ultrapassar este problema é representarem-se os dados das tabelas em gráficos

Aula 3 - Estatística Descritiva

Arredondamento de dados

Muitas vezes, é necessário ou conveniente suprimir unidades inferiores às de determinada ordem. Esta técnica é denominada arredondamento de dados.
De acordo com a Resolução 886/66 do IBGE, o arredondamento é feito da seguinte maneira:

- Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a permanecer.

Exemplos:53,24 arredondado para a 1ª casa decimal passa a 53,2; 44,03 arredondado para a 1ª casa decimal passa a 44,0.

- Quando o primeiro algarismo a ser abandonado for 6, 7, 8, ou 9, aumenta-se em uma unidade o algarismo a permanecer.

Exemplos: 53,87 arredondado para a 1ª casa decimal passa a 53,9; 44,08 arredondado para a 1ª casa decimal passa a 44,1; 44,99 arredondado para a 1ª casa decimal passa a 45,0.

- Quando o primeiro algarismo a ser abandonado for 5, há duas soluções:
1. Se após o número 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer.

Exemplos: 2,352 arredondado para a 1ª casa decimal passa a 2,4; 25,6501 arredondado para a 1ª casa decimal passa a 25,7; 76,250002 arredondado para a 1ª casa decimal passa a 76,3.

2. Se o número 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a ser conservado só será aumentando em uma unidade se for ímpar.
Exemplos: 24,75 arredondado para a 1ª casa decimal passa a 24,8; 24,65 arredondado para a 1ª casa decimal passa a 24,6; 24,75000 arredondado para a 1ª casa decimal passa a 24,8; 24,6500 arredondado para a 1ª casa decimal passa a 24,6.
Obs.: não devemos nunca fazer arredondamentos sucessivos. Exemplo: 17,3452 passa a 17,3 e não para 17,35 e depois para 17,4.

Somatório
somatório

ESTATÍSTICA

É a ciência que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados para a utilização dos mesmos na tomada de decisões.
A estatística está dividida em:

Estatística descritiva ou dedutiva: é parte da estatística que se preocupa com a coleta, organização dos dados através da construção de tabelas e gráficos, analisando e interpretando-os, porém sem tirar conclusões. Compreende o manejo dos dados para resumí-los ou descrevê-los, sem ir além, isto é, sem procurar inferir qualquer coisa que ultrapasse os próprios dados. Por exemplo, se os testes feitos em seis carros pequenos, importados em 1996, mostraram que eles podem acelerar de 0 a 60 milhas por hora (mph) em: {18,7     19,2    16,2    12,3    17,5    13,9} segundos, e afirmamos que metade deles acelera de 0 a 60 mph em menos de 17,0 segundos, nosso trabalho pertence ao domínio da estatística descritiva. Este seria também o caso se afirmássemos que esses carros aceleram em média 16,3 segundos a partir do cálculo da aceleração de cada um dos seis carros:
Assim, concluímos que todos os carros importados naquele ano poderiam acelerar de 0 a 60 mph em menos de 17,0 segundos.
Embora a estatística descritiva seja um ramo importante da estatística e continue sendo amplamente utilizada, as informações estatísticas quase sempre são obtidas de amostras, e isto significa que sua análise exige generalizações que ultrapassam os dados. Como resultado, a característica mais importante do recente crescimento da estatística tem sido um desvio da ênfase a métodos meramente descritivos, para uma de métodos generalizadores, ou seja, um desvio da ênfase à estatística descritiva para uma ênfase à inferência estatística.

Estatística indutiva, amostral ou inferencial: é a parte da estatística que, baseando-se em resultados obtidos na análise de uma amostra, procura inferir, induzir ou tirar conclusões para o comportamento da população, fundamentando-se na teoria das probabilidades. Taís métodos torna-se necessários, por exemplo, para prever a duração média da vida útil de uma lâmpada (com base no desempenho de muitas dessas lâmpadas); comparar a eficiência de duas dietas para reduzir o peso (com base nas perdas de pesos de pessoas que se submeteram às dietas); determinar a dosagem ideal de um novo medicamento (com base em testes feitos em pacientes voluntários de hospitais selecionados aleatoriamente); ou prever o fluxo de tráfego em uma rodovia ainda em construção (com base no tráfego observado em rodovias alternativas).
Em cada situação do parágrafo precedente, existem incertezas, porque dispomos apenas de informações parciais, incompletas ou indiretas; tornam-se, assim, necessários os métodos da inferência estatística para avaliar o mérito dos nossos resultados, para escolher uma predição “mais promissora” ou para selecionar o curso de ação “mais razoável” (ou talvez mais lucrativo).
Em face das incertezas, tratamos problemas como estes com métodos estatísticos que têm origem nos jogos de azar. Embora o estudo matemático de tais jogos remonte ao século dezessete, não foi senão no inicio do século dezenove que a teoria elaborada para “cara ou coroa”, por exemplo, ou “par ou impar”, ou “vermelho ou preto” passou a ser aplicado em situações da vida real, em que os resultados são “menino ou menina”, “vida ou morte”, “passar ou ser reprovado”, e assim por diante.A teoria das probabilidades passou, então, a ser aplicada a não poucos problemas das ciências naturais e do comportamento social, e constitui presentemente, um importante instrumento para a análise de qualquer situação (na administração ou na vida diária) que, de alguma forma envolva um elemento de incerteza, ou chance. Em particular, fornece as bases para os métodos que usamos quando fazemos generalizações com base em dados observados, ou seja, quando aplicamos os métodos da inferência estatística.

Aula 2 - Análise Combinatória

Confira um resumo simples e objetivo sobre análise combinatória, apresentamos alguns exemplos para um melhor entendimento. O conteúdo é muito cobrado em concursos públicos e a matéria possui um nível de dificuldade alto.


1. Introdução:


Sandra vai a uma festa e está em dúvida entre 2 calças (azul ou vermelha) e 3 blusas (amarela, preta ou branca). De quantos modos distintos Sandra pode se vestir?



 Temos as seguintes opções:
– calça azul e blusa amarela;
– calça azul e blusa preta;
– calça azul e blusa branca;
– calça vermelha e blusa amarela;
– calça vermelha e blusa preta;
– calça vermelha e blusa branca;
Assim, para calcularmos as possibilidades, basta multiplicarmos 2 x 3 = 6 possibilidades.
  
2. Princípio Fundamental da Contagem (PFC)
 Este princípio generaliza o exemplo acima. Sempre que tivermos uma ação constituída de duas etapas, onde a primeira possui m possibilidades e a segunda possui n possibilidades, o número total de possibilidades será m x n.
 Exemplo 1:
Existem 4 estradas ligando as cidades de Linhares e Colatina e 3 estradas ligando Colatina e Vitoria. De quantas maneiras diferentes é possível ir de Linhares a Vitória, passando por Colatina?
Pelo PFC temos 4 x 3 = 12 maneiras diferentes
 Exemplo 2:
 Jennifer possui 6 blusas, 4 saias e 3 sandálias. Quantas combinações diferentes ela pode fazer?
Pelo PFC temos 6 x 4 x 3 = 72 possibilidades
  
3. Fatorial de números naturais
 Seja um número natural n, definimos o fatorial de n (n!) da seguinte forma:
 a) 0! = 1
b) 1! = 1
c) n! = n . (n-1) … 3 . 2 . 1 (n diferente de 0 e 1)

Exemplos:
4! = 4.3.2.1 = 24
6! = 6.5.4.3.2.1 = 720

4. Arranjos


Seja o conjunto {1, 2, 3, 4, 5}, vamos descobrir todos os arranjos desse conjunto tomados 2 a 2. Veja:

(1, 2); (1, 3); (1, 4); (1, 5); (2, 1); (2, 3); (2, 4); (2, 5); (3, 1); (3, 2); (3, 4); (3, 5); (4, 1); (4, 2); (4, 3); (4, 5); (5, 1); (5, 2); (5, 3); (5, 4);

Note que estamos considerando (1, 2) diferente de (2, 1). Neste caso, o número de arranjos será calculado da seguinte forma:
analise combinatória
 
 
 
Generalizando, para um arranjo de n elementos, tomados k a k, onde a ordem é importante:
An,k = n! / (n-k)!

5. Permutações com elementos distintos 

Vamos definir permutação de n elementos todo arranjo desses n elementos tomados n a n. 
Veja o exemplo:
Vamos escrever todos os anagramas que podem ser escritos pelas letras ABC: 
ABC, ACB, BAC, BCA, CAB, CBA
 Veja que a diferença entre permutações e arranjos é que em permutações, n = k, ou seja, são n elementos tomados n a n. No exemplo, são 3 elementos, tomados 3 a 3.
 Generalizando, para uma permutação de n elementos distintos:
Pn = n!


6. Permutações com elementos repetidos

Para calcularmos o número de anagramas que podem ser formados a partir de RATO é fácil.
Vimos que P4 = 4! = 24
 Vamos agora estudar os casos onde existem elementos iguais. Veja o exemplo:
 Vamos escrever todos os anagramas que podem ser escritos pelas letras da palavra CAPA:
 CAPA, CAAP, CPAA, ACPA, APCA, APAC, ACAP, AACP, AAPC, PCAA, PACA, PAAC
 São apenas 12. A diminuição deve-se ao fato da letra A aparecer duas vezes.
 Generalizando, para uma permutação de n elementos, onde aparecem elementos n1, n2, …, nt repetidos:
Pn = n! / n1!.n2!…nt!

 Exemplo 1:
Anagramas que podem ser formados a partir da palavra CORRER:
Devemos observar que a letra R aparece 3 vezes:
P6 = 6! / 3! = 6.5.4 = 120

Exemplo 2:
Anagramas que podem ser formados a partir da palavra SOSSEGADO:
Devemos observar que a letra S aparece 3 vezes e a letra O aparece 2x.
P9 = 9! / 3!.2! = 30240

7. Combinações
 Seja o conjunto A = {1, 2, 3, 4, 5}, vamos determinar todos os subconjuntos formados por 2 elementos de A:
 (1, 2); (1, 3); (1, 4); (1, 5); (2, 3); (2, 4); (2, 5); (3, 4); (3, 5); (4, 5);
 Note que estamos considerando (1, 2) igual a (2, 1). Neste caso, o número de combinações será calculado da seguinte forma:
  
analise combinatoria

 
Generalizando, para uma combinação de n elementos, tomados k a k, onde a ordem não é importante:
Cn,k = n! / k!(n-k)!

Aula 1 - Pirâmide do Conhecimento e Curva de Gauss

Nesta aula vimos dois conteúdos interessantes: a Pirâmide do Conhecimento e a Curva de Gauss.

Pirâmide do Conhecimento:
Também conhecida como DIKW, do inglês Data-Information-Knowledge-Wisdow, é estruturada em quatro partes: dados, informações, conhecimentos e sabedoria.




Dados: são imagens, números e palavras;
Informação: é a interpretação dos dados, dá um significado aos dados; 
Conhecimento: é a informação sendo processada, armazenada, organizada e aplicada em alguma situação;
Sabedoria: Incorpora a compreensão dos princípios fundamentais dentro do conhecimento. O saber requer moral, ética e o valor, um julgamento único e pessoal do agente. 








Após o intervalo, o Profº Valente nos mostrou a curva de Gauss usando como exemplo dois dados e a lógica que os cerca, como por exemplo, se somarmos as faces opostas de um dado sempre dará 7. (o número 1 é oposto ao número 6, somando os dois números obteremos 7).
Também nos mostrou como isso funciona na curva de Gauss e na bolsa de valores.
Concluímos que, o número 7 é o que mais irá aparecer quando jogarmos dados dentre os outros números, Gauss explica isso (veja foto acima) com a famosa estatística ou probabilidade, o 5,6,7,8 e 9 tem 70% de chances de aparecer numa combinação de dados, os outros números tem 30% de chance.
O Profº fez uma pergunta que gerou opiniões opostas: "Par e Ímpar, quem tem a maior chance de aparecer numa combinação de dados?" Utilizando a lousa, o professor nos mostrou que cada um tem 50% de chance de aparecer. 
Gauss nos mostra que com a probabilidade podemos arriscar na bolsa de valores, mas temos que ter em mente que 90% dos aplicadores não obtém sucesso, ou seja, temos que tomar cuidado!