Artigos

10.1: ANOVA unilateral


O objetivo de um teste (ANOVA ) unilateral é determinar a existência de uma diferença estatisticamente significativa entre as médias de vários grupos. O teste realmente usa variâncias para ajudar a determinar se as médias são iguais ou não. Para realizar um teste (ANOVA ) unilateral, existem várias suposições básicas a serem cumpridas:

Cinco suposições básicas de ANOVA unilateral a serem cumpridas

  1. Cada população da qual uma amostra é retirada é considerada normal.
  2. Todas as amostras são selecionadas aleatoriamente e independentes.
  3. As populações são assumidas como tendo desvios padrão iguais (ou variâncias).
  4. O fator é uma variável categórica.
  5. A resposta é uma variável numérica.

As hipóteses nulas e alternativas

A hipótese nula é simplesmente que todas as médias da população do grupo são iguais. A hipótese alternativa é que pelo menos um par de médias é diferente. Por exemplo, se houver (k ) grupos:

  • (H_ {0}: mu_ {1} = mu_ {2} = mu_ {3} = dotsc = mu_ {k} )
  • (H_ {a}: text {pelo menos dois do grupo significa} mu_ {2} = mu_ {3} = dotsc = mu_ {k} text {não são iguais} )

Os gráficos, conjunto de boxplots que representam a distribuição dos valores com as médias do grupo indicadas por uma linha horizontal passando pela caixa, auxiliam no entendimento do teste de hipótese. No primeiro gráfico (gráficos de caixa vermelha), (H_ {0}: mu_ {1} = mu_ {2} = mu_ {3} ) e as três populações têm a mesma distribuição se a hipótese nula for verdadeira . A variância dos dados combinados é aproximadamente igual à variância de cada uma das populações.

Se a hipótese nula for falsa, então a variância dos dados combinados é maior, o que é causado pelas diferentes médias, conforme mostrado no segundo gráfico (plotagens de caixa verde).

Figura ( PageIndex {1} ): (a) (H_ {0} ) é verdadeiro. Todos os meios são iguais; as diferenças são devidas à variação aleatória. (b) (H_ {0} ) não é verdade. Todos os meios não são os mesmos; as diferenças são muito grandes para serem devidas à variação aleatória.

Revisão do Capítulo

A análise de variância estende a comparação de dois grupos a vários, cada um um nível de uma variável categórica (fator). As amostras de cada grupo são independentes e devem ser selecionadas aleatoriamente de populações normais com variâncias iguais. Testamos a hipótese nula de médias iguais da resposta em cada grupo versus a hipótese alternativa de um ou mais grupos significa ser diferente dos outros. Um teste de hipótese (ANOVA ) unilateral determina se várias médias populacionais são iguais. A distribuição do teste é a distribuição (F ) com dois graus de liberdade diferentes.

Premissas:

  1. Cada população da qual uma amostra é retirada é considerada normal.
  2. Todas as amostras são selecionadas aleatoriamente e independentes.
  3. As populações são assumidas como tendo desvios padrão iguais (ou variâncias).

Glossário

Análise de variação
também conhecido como (ANOVA ), é um método para testar se as médias de três ou mais populações são iguais ou não. O método é aplicável se:
  • todas as populações de interesse são normalmente distribuídas.
  • as populações têm desvios-padrão iguais.
  • amostras (não necessariamente do mesmo tamanho) são aleatoriamente e independentemente selecionadas de cada população.

A estatística de teste para análise de variância é a razão (F ).

Unidirecional (ANOVA )
um método para testar se as médias de três ou mais populações são iguais ou não; o método é aplicável se:
  • todas as populações de interesse são normalmente distribuídas.
  • as populações têm desvios-padrão iguais.
  • amostras (não necessariamente do mesmo tamanho) são aleatoriamente e independentemente selecionadas de cada população.

A estatística de teste para análise de variância é a razão (F ).

Variância
média dos desvios quadrados da média; o quadrado do desvio padrão. Para um conjunto de dados, um desvio pode ser representado como (x - bar {x} ) onde (x ) é um valor dos dados e ( bar {x} ) é a média da amostra. A variância da amostra é igual à soma dos quadrados dos desvios dividida pela diferença do tamanho da amostra e um.

Capítulo 10 ANOVA unilateral

A seguir, vamos examinar a ANOVA unilateral, que é usada quando temos dois ou mais grupos independentes. Especificamente, a ANOVA unilateral determina se há uma diferença em qualquer uma das médias de nível de grupo. Dado que a análise também pode ser usada para dois grupos independentes, esta análise pode ser usada em vez das amostras independentes t-teste.

Por exemplo, digamos que estivéssemos interessados ​​em determinar se o salário era significativamente diferente para professores de diferentes categorias (ou seja, professor assistente, professor associado e professor).

Para este exemplo, usaremos o conjunto de dados: datasetSalaries.

Conforme mencionado nas amostras independentes t-teste, ao lidar com preditores categóricos, é sempre uma boa ideia verificar o esquema de codificação da variável categórica.


10.1: Prelúdio para a distribuição F e ANOVA unilateral

  • Contribuição de Barbara Illowsky e Susan Dean
  • Estatística no De Anza College
  • Fonte do OpenStax

Ao final deste capítulo, o aluno deve ser capaz de:

  • Interprete a distribuição de probabilidade F como o número de grupos e a mudança no tamanho da amostra.
  • Discuta dois usos para a distribuição F: ANOVA de um fator e o teste de duas variâncias.
  • Conduzir e interpretar ANOVA unilateral.
  • Conduzir e interpretar testes de hipótese de duas variâncias

Muitas aplicações estatísticas em psicologia, ciências sociais, administração de empresas e ciências naturais envolvem vários grupos. Por exemplo, um ambientalista está interessado em saber se a quantidade média de poluição varia em vários corpos d'água. Um sociólogo está interessado em saber se o valor da renda que uma pessoa ganha varia de acordo com sua educação. Um consumidor que procura um carro novo pode comparar a média de consumo de combustível de vários modelos.

Figura ( PageIndex <1> ): ANOVA unilateral é usada para medir informações de vários grupos.

Para testes de hipótese comparando médias entre mais de dois grupos, os estatísticos desenvolveram um método denominado & quotAnalysis of Variance & quot (abreviado ANOVA). Neste capítulo, você estudará a forma mais simples de ANOVA chamada fator único ou ANOVA de um fator. Você também estudará a distribuição (F ), usada para ANOVA de um fator e o teste de duas variâncias. Esta é apenas uma breve visão geral da ANOVA unilateral. Você estudará este tópico com muito mais detalhes em futuros cursos de estatística. A ANOVA unilateral, conforme apresentada aqui, depende muito de uma calculadora ou computador.


Queremos ver se os teores de alcatrão (em miligramas) para três marcas diferentes de cigarros são diferentes. Dois laboratórios diferentes coletaram amostras, Lab Precise e Lab Sloppy.

Laboratório preciso

O Lab Precise coletou seis amostras de cada uma das três marcas e obteve as seguintes medições:

Amostra Marca A Marca B Marca C
1 10.21 11.32 11.60
2 10.25 11.20 11.90
3 10.24 11.40 11.80
4 9.80 10.50 12.30
5 9.77 10.68 12.20
6 9.73 10.90 12.20
Média (ar_1= 10.00) (ar_2= 11.00) (ar_3= 12.00)

Lab Precise Dotplot

Lab Sloppy

O Lab Sloppy também coletou seis amostras de cada uma das três marcas e obteve as seguintes medições:

Amostra Marca A Marca B Marca C
1 9.03 9.56 10.45
2 10.26 13.40 9.64
3 11.60 10.68 9.59
4 11.40 11.32 13.40
5 8.01 10.68 14.50
6 9.70 10.36 14.42
Média (ar_1= 10.00) (ar_2= 11.00) (ar_3= 12.00)

Lab Sloppy Dotplot

As médias das amostras dos dois laboratórios acabaram sendo as mesmas e, portanto, as diferenças nas médias das amostras dos dois laboratórios são zero.

De qual conjunto de dados você pode extrair evidências mais conclusivas de que as médias das três populações são diferentes?

Precisamos comparar a variação entre amostras com a variação dentro da amostra. Como a variação entre amostras do Lab Sloppy é grande em comparação com a variação dentro da amostra para os dados do Lab Precise, estaremos mais inclinados a concluir que as três médias populacionais são diferentes usando os dados do Lab Precise. Uma vez que tal análise é baseada na análise de variâncias para o conjunto de dados, chamamos este método estatístico de Análise de Variância (ou ANOVA).


10.2.1 - Suposições ANOVA

Existem três premissas principais na ANOVA:

  1. As respostas para cada nível de fator têm um distribuição normal da população.
  2. Essas distribuições têm o mesma variância.
  3. Os dados são independente.

Uma regra geral para variâncias iguais é comparar o menor e o maior desvio padrão da amostra. Isso é muito parecido com a regra de ouro para variâncias iguais para o teste de médias independentes. Se a razão desses dois desvios padrão da amostra cair entre 0,5 e 2, então pode ser que a suposição não seja violada.


Visualização do conteúdo

ANOVAs unilaterais, junto com vários outros testes estatísticos, usam a distribuição F. No início deste curso, você aprendeu sobre as distribuições (z ) e (t ). Você calculou as estatísticas de teste (z ) e (t ) e usou esses valores para pesquisar os valores p usando um software estatístico. Da mesma forma, nesta lição, você calculará as estatísticas do teste F. A estatística de teste F pode ser usada para determinar o valor p para uma ANOVA de uma via.

O vídeo a seguir oferece uma breve introdução à distribuição F e orienta você por dois exemplos de uso do Minitab Express para encontrar os valores-p para as estatísticas de teste F fornecidas. As etapas para criar um gráfico de distribuição para encontrar a área sob a distribuição F são iguais às etapas para localizar a área sob a distribuição (z ) ou (t ). Para a distribuição F, estaremos sempre procurando por uma probabilidade de cauda direita. Posteriormente nesta lição, veremos que esta área é o valor p.

A distribuição F tem dois graus de liberdade diferentes: entre grupos e dentro dos grupos. O Minitab Express os chamará de graus de liberdade do numerador e do denominador, respectivamente. Dentro dos grupos também é conhecido como erro.


Conteúdo

Os resultados de uma ANOVA unilateral podem ser considerados confiáveis, desde que as seguintes suposições sejam atendidas:

  • Os resíduos da variável de resposta são normalmente distribuídos (ou aproximadamente normalmente distribuídos).
  • As variações das populações são iguais.
  • As respostas para um determinado grupo são variáveis ​​aleatórias normais independentes e distribuídas de forma idêntica (e não uma amostra aleatória simples (SRS)).

Se os dados forem ordinais, uma alternativa não paramétrica a esse teste deve ser usada, como a análise de variância unilateral de Kruskal-Wallis. Se as variâncias não forem iguais, uma generalização do teste t de Welch de 2 amostras pode ser usada. [2]

Saídas da normalidade da população Editar

ANOVA é um procedimento relativamente robusto no que diz respeito a violações do pressuposto de normalidade. [3]

A ANOVA unilateral pode ser generalizada para os layouts fatoriais e multivariados, bem como para a análise de covariância. [ esclarecimento necessário ]

É freqüentemente afirmado na literatura popular que nenhum desses F-testes são robustos quando há violações graves da suposição de que cada população segue a distribuição normal, particularmente para níveis alfa pequenos e layouts desequilibrados. [4] Além disso, também é afirmado que se a suposição subjacente de homocedasticidade for violada, as propriedades de erro Tipo I degeneram muito mais severamente. [5]

No entanto, isso é um equívoco, baseado no trabalho feito na década de 1950 e antes. A primeira investigação abrangente do problema pela simulação de Monte Carlo foi Donaldson (1966). [6] Ele mostrou que sob as partidas usuais (inclinação positiva, variâncias desiguais) "o F-teste é conservador "e, portanto, é menos provável do que deveria ser descobrir que uma variável é significativa. No entanto, à medida que o tamanho da amostra ou o número de células aumenta," as curvas de poder parecem convergir para aquelas baseadas no distribuição normal ". Tiku (1971) descobriu que" o poder da teoria não normal de F é encontrada para diferir do poder da teoria normal por um termo de correção que diminui drasticamente com o aumento do tamanho da amostra. "[7] O problema da não normalidade, especialmente em grandes amostras, é muito menos sério do que os artigos populares poderiam sugerir.

A visão atual é que "os estudos de Monte-Carlo foram usados ​​extensivamente com testes baseados na distribuição normal para determinar o quão sensíveis eles são às violações da suposição de distribuição normal das variáveis ​​analisadas na população. A conclusão geral desses estudos é que o as consequências de tais violações são menos graves do que se pensava anteriormente. Embora essas conclusões não devam desestimular totalmente ninguém de se preocupar com a suposição de normalidade, elas aumentaram a popularidade geral dos testes estatísticos dependentes da distribuição em todas as áreas de pesquisa. " [8]

Para alternativas não paramétricas no layout fatorial, consulte Sawilowsky. [9] Para mais discussão, veja ANOVA on ranks.

O modelo Editar

O modelo linear normal descreve grupos de tratamento com distribuições de probabilidade que são curvas em formato de sino (normais) idênticas com médias diferentes. Assim, o ajuste dos modelos requer apenas as médias de cada grupo de tratamento e um cálculo de variância (uma variância média dentro dos grupos de tratamento é usada). Os cálculos das médias e da variância são realizados como parte do teste de hipótese.

Os modelos lineares normais comumente usados ​​para um experimento completamente aleatório são: [10]

Os dados e resumos estatísticos dos dados Editar

Uma forma de organizar observações experimentais y i j < displaystyle y_> está com grupos em colunas:

Organização de dados ANOVA, desequilibrado, fator único
Listas de Observações de Grupo
I 1 < displaystyle I_ <1>> I 2 < displaystyle I_ <2>> I 3 < displaystyle I_ <3>> I j < displaystyle I_>
1 y 11 < displaystyle y_ <11>> y 12 < displaystyle y_ <12>> y 13 < displaystyle y_ <13>> y 1 j < displaystyle y_ <1j>>
2 y 21 < displaystyle y_ <21>> y 22 < displaystyle y_ <22>> y 23 < displaystyle y_ <23>> y 2 j < displaystyle y_ <2j>>
3 y 31 < displaystyle y_ <31>> y 32 < displaystyle y_ <32>> y 33 < displaystyle y_ <33>> y 3 j < displaystyle y_ <3j>>
eu y i 1 < displaystyle y_> y i 2 < displaystyle y_> y i 3 < displaystyle y_> y i j < displaystyle y_>
Estatísticas de resumo do grupo Estatísticas de resumo geral
# Observado I 1 < displaystyle I_ <1>> I 2 < displaystyle I_ <2>> I j < displaystyle I_> I J < displaystyle I_> # Observado I = ∑ I j < displaystyle I = sum I_>
Soma ∑ i y i j < displaystyle sum _y_> Soma ∑ j ∑ i y i j < displaystyle sum _soma _y_>
Soma Sq ∑ i (y i j) 2 < displaystyle sum _(y_)^<2>> Soma Sq ∑ j ∑ i (y i j) 2 < displaystyle sum _soma _(y_)^<2>>
Mau m 1 < displaystyle m_ <1>> m j < displaystyle m_> m J < displaystyle m_> Mau m
Variância s 1 2 < displaystyle s_ <1> ^ <2>> s j 2 < displaystyle s_^<2>> s J 2 < displaystyle s_^<2>> Variância s 2 < displaystyle s ^ <2>>

O teste de hipótese Editar

Dadas as estatísticas de resumo, os cálculos do teste de hipótese são mostrados em forma de tabela. Enquanto duas colunas de SS são mostradas para seu valor explicativo, apenas uma coluna é necessária para exibir os resultados.

Tabela ANOVA para modelo fixo, fator único, experimento totalmente aleatório
Fonte de variação Soma dos quadrados Soma dos quadrados Graus de liberdade Quadrado médio F
SS explicativo [11] SS computacional [12] DF em
Tratamentos ∑ T r e a t m e n t s I j (m j - m) 2 < displaystyle sum _EU_(m_-m) ^ <2>> ∑ j (∑ i y i j) 2 I j - (∑ j ∑ i y i j) 2 I < displaystyle sum _< frac <( sum _y_)^<2>><>>> - < frac <( sum _soma _y_)^<2>>>> J - 1 S S T r e a t m e n t D F T r e a t m e n t < displaystyle < frac <>><>>>> M S T r e a t m e n t M S E r r o r < displaystyle < frac <>><>>>>
Erro ∑ T r e a t m e n t s (I j - 1) s j 2 < displaystyle sum _(EU_-1) s_^<2>> ∑ j ∑ i y i j 2 - ∑ j (∑ i y i j) 2 I j < displaystyle sum _soma _y_^ <2> - sum _< frac <( sum _y_)^<2>><>>>> I - J S S E r o r D F E r r o r < displaystyle < frac <>><>>>>
Total ∑ O b s e r v a t i on s (y i j - m) 2 < displaystyle sum _(y_-m) ^ <2>> ∑ j ∑ i y i j 2 - (∑ j ∑ i y i j) 2 I < displaystyle sum _soma _y_^ <2> - < frac <( sum _soma _y_)^<2>>>> I - 1

Resumo da análise Editar

A análise ANOVA básica consiste em uma série de cálculos. Os dados são coletados em forma de tabela. Então

  • Cada grupo de tratamento é resumido pelo número de unidades experimentais, duas somas, uma média e uma variância. Os resumos do grupo de tratamento são combinados para fornecer totais para o número de unidades e as somas. A grande média e a grande variância são calculadas a partir das grandes somas. O tratamento e os grandes meios são usados ​​no modelo.
  • Os três DFs e SSs são calculados a partir dos resumos. Em seguida, os MSs são calculados e uma proporção determina F.
  • Um computador normalmente determina um valor p de F, que determina se os tratamentos produzem resultados significativamente diferentes. Se o resultado for significativo, o modelo provisoriamente tem validade.

Em um experimento mais complexo, onde as unidades experimentais (ou efeitos ambientais) não são homogêneas, as estatísticas de linha também são usadas na análise. O modelo inclui termos que dependem de i < displaystyle i>. A determinação dos termos extras reduz o número de graus de liberdade disponíveis.

Considere um experimento para estudar o efeito de três níveis diferentes de um fator em uma resposta (por exemplo, três níveis de um fertilizante no crescimento da planta). Se tivéssemos 6 observações para cada nível, poderíamos escrever o resultado do experimento em uma tabela como esta, onde uma1, uma2, e uma3 são os três níveis do fator que está sendo estudado.

uma1 uma2 uma3
6 8 13
8 12 9
4 9 11
5 11 8
3 6 7
4 8 12

A hipótese nula, denotada H0, para o geral F-teste para este experimento seria que todos os três níveis do fator produzem a mesma resposta, em média. Para calcular o F-Razão:

Passo 1: Calcule a média dentro de cada grupo:

Passo 2: Calcule a média geral:

Etapa 3: Calcule a soma "entre grupos" das diferenças quadradas:

Onde n é o número de valores de dados por grupo.

Os graus de liberdade entre os grupos são um a menos que o número de grupos

então o valor médio do quadrado entre os grupos é

Passo 4: Calcule a soma dos quadrados "dentro do grupo". Comece centralizando os dados em cada grupo

uma1 uma2 uma3
6−5=1 8−9=−1 13−10=3
8−5=3 12−9=3 9−10=−1
4−5=−1 9−9=0 11−10=1
5−5=0 11−9=2 8−10=−2
3−5=−2 6−9=−3 7−10=−3
4−5=−1 8−9=−1 12−10=2

A soma dos quadrados dentro do grupo é a soma dos quadrados de todos os 18 valores nesta tabela

Os graus de liberdade dentro do grupo são

Assim, o valor quadrático médio dentro do grupo é

Etapa 5: O F-ratio é

O valor crítico é o número que a estatística de teste deve exceder para rejeitar o teste. Nesse caso, Fcrit(2,15) = 3,68 em α = 0,05. Desde a F= 9,3 & gt 3,68, os resultados são significativos ao nível de significância de 5%. Seria rejeitada a hipótese nula, concluindo que há fortes evidências de que os valores esperados nos três grupos são diferentes. O valor p para este teste é 0,002.

Depois de realizar o F-teste, é comum realizar algumas análises "post-hoc" das médias do grupo. Neste caso, as primeiras duas médias de grupo diferem em 4 unidades, a primeira e a terceira médias de grupo diferem em 5 unidades e as médias do segundo e terceiro grupo diferem em apenas 1 unidade. O erro padrão de cada uma dessas diferenças é 4,5 / 6 + 4,5 / 6 = 1,2 < displaystyle < sqrt <4,5 / 6 + 4,5 / 6 >> = 1,2>. Assim, o primeiro grupo é fortemente diferente dos outros grupos, pois a diferença média é mais vezes o erro padrão, portanto, podemos estar altamente confiantes de que a média populacional do primeiro grupo difere das médias populacionais dos outros grupos. Porém, não há evidências de que o segundo e o terceiro grupos tenham médias populacionais diferentes entre si, pois sua diferença média de uma unidade é comparável ao erro padrão.

Observação F(x, y) denota um F-distribuição função de distribuição cumulativa com x graus de liberdade no numerador e y graus de liberdade no denominador.


Prática

Use as informações a seguir para responder aos próximos cinco exercícios. Existem cinco suposições básicas que devem ser atendidas para realizar um teste ANOVA de uma via. O que eles são?

Escreva uma quarta suposição.

Escreva a suposição final.

Declare a hipótese nula para um teste ANOVA de uma via se houver quatro grupos.

Declare a hipótese alternativa para um teste ANOVA de uma via se houver três grupos.

Quando você usa um teste ANOVA?

13.2 A Distribuição F e a Razão F

Use as informações a seguir para responder aos próximos oito exercícios. Grupos de homens de três áreas diferentes do país devem ser testados para peso médio. As entradas na Tabela 13.13 são os pesos para os diferentes grupos.

Qual é o fator de soma dos quadrados?

Qual é o erro da soma dos quadrados?

O que é df para o numerador?

O que é df para o denominador?

Qual é o fator quadrático médio?

Qual é o erro quadrático médio?


Use as informações a seguir para responder aos próximos oito exercícios. Meninas de quatro times de futebol diferentes devem ser testadas para a média de gols marcados por jogo. As entradas na tabela são os gols por jogo para as diferentes equipes. Os resultados da ANOVA de uma via são mostrados na Tabela 13.14.

O que é df para o numerador?

O que é df para o denominador?

Julgando pelo F estatística, você acha provável ou improvável que rejeite a hipótese nula?

13.3 Fatos sobre a distribuição F

A F a estatística pode ter quais valores?

O que acontece com as curvas à medida que os graus de liberdade do numerador e do denominador aumentam?

Use as informações a seguir para responder aos próximos sete exercícios. Quatro equipes de basquete coletaram uma amostra aleatória de jogadores em relação à altura em que cada jogador pode pular (em polegadas). Os resultados são mostrados na Tabela 13.15.

Quais são a soma dos quadrados e os fatores dos quadrados médios?

Quais são os erros da soma dos quadrados e dos quadrados médios?

No nível de significância de 5%, há diferença nas alturas médias dos saltos entre as equipes?


Use as informações a seguir para responder aos próximos sete exercícios. Um desenvolvedor de videogame está testando um novo jogo em três grupos diferentes. Cada grupo representa um mercado-alvo diferente para o jogo. O desenvolvedor coleta pontuações de uma amostra aleatória de cada grupo. Os resultados são mostrados na Tabela 13.16

No nível de significância de 10%, as pontuações entre os diferentes grupos são diferentes?


Use as informações a seguir para responder aos próximos três exercícios. Suponha que um grupo esteja interessado em determinar se os adolescentes obtêm suas carteiras de motorista aproximadamente com a mesma idade média em todo o país. Suponha que os dados a seguir sejam coletados aleatoriamente de cinco adolescentes em cada região do país. Os números representam a idade em que os adolescentes obtiveram a carteira de habilitação.

Nordeste Sul Oeste Central leste
16.3 16.9 16.4 16.2 17.1
16.1 16.5 16.5 16.6 17.2
16.4 16.4 16.6 16.5 16.6
16.5 16.2 16.1 16.4 16.8
x ¯ = x ¯ = ________ ________ ________ ________ ________
s 2 = s 2 = ________ ________ ________ ________ ________

Insira os dados em sua calculadora ou computador.

Declare as decisões e conclusões (em sentenças completas) para os seguintes níveis pré-concebidos de α.

uma. Decisão: ____________________________

b. Conclusão: ____________________________

uma. Decisão: ____________________________

b. Conclusão: ____________________________

13.4 Teste de Duas Variâncias

Use as informações a seguir para responder aos próximos dois exercícios. Existem duas suposições que devem ser verdadeiras para realizar um F teste de duas variâncias.

Cite uma suposição que deve ser verdadeira.

Qual é a outra suposição que deve ser verdadeira?


Use as informações a seguir para responder aos próximos cinco exercícios. Dois colegas de trabalho saem do mesmo prédio. Eles estão interessados ​​em saber se há alguma variação no tempo que levam para dirigir até o trabalho. Cada um deles registra seus tempos de 20 deslocamentos. Os tempos do primeiro trabalhador têm uma variação de 12,1. Os tempos do segundo trabalhador têm uma variação de 16.9. O primeiro trabalhador acha que ele é mais consistente com seus tempos de deslocamento. Teste a afirmação no nível de 10%. Suponha que os tempos de deslocamento sejam normalmente distribuídos.

Declare as hipóteses nula e alternativa.

O que é s1 neste problema?

O que é s2 neste problema?


Use as informações a seguir para responder aos próximos quatro exercícios. Dois alunos estão interessados ​​em saber se há ou não variação em seus resultados de teste para a aula de matemática. Há 15 testes de matemática no total que fizeram até agora. As notas do primeiro aluno têm um desvio padrão de 38,1. As notas do segundo aluno têm um desvio padrão de 22,5. O segundo aluno acha que suas notas são mais consistentes.

Declare as hipóteses nula e alternativa.

No nível de significância de 5%, rejeitamos a hipótese nula?


Use as informações a seguir para responder aos próximos três exercícios. Dois ciclistas estão comparando as variações de seus ritmos gerais na subida. Cada ciclista registra sua velocidade ao subir 35 morros. O primeiro ciclista tem uma variância de 23,8 e o segundo ciclista tem uma variância de 32,1. Os ciclistas querem ver se suas variações são iguais ou diferentes. Suponha que os tempos de deslocamento sejam normalmente distribuídos.

Declare as hipóteses nula e alternativa.

No nível de significância de 5%, o que podemos dizer sobre as variâncias dos ciclistas?

Como um associado da Amazon, ganhamos com compras qualificadas.

Quer citar, compartilhar ou modificar este livro? Este livro é Creative Commons Attribution License 4.0 e você deve atribuir o OpenStax.

    Se você estiver redistribuindo todo ou parte deste livro em formato impresso, deverá incluir em cada página física a seguinte atribuição:

  • Use as informações abaixo para gerar uma citação. Recomendamos o uso de uma ferramenta de citação como esta.
    • Autores: Barbara Illowsky, Susan Dean
    • Editor / site: OpenStax
    • Título do livro: Estatísticas introdutórias
    • Data de publicação: 19 de setembro de 2013
    • Local: Houston, Texas
    • URL do livro: https://openstax.org/books/introductory-statistics/pages/1-introduction
    • URL da seção: https://openstax.org/books/introductory-statistics/pages/13-practice

    © 19 de maio de 2021 OpenStax. O conteúdo do livro didático produzido pela OpenStax é licenciado sob uma licença Creative Commons Attribution License 4.0. O nome OpenStax, logotipo OpenStax, capas de livro OpenStax, nome OpenStax CNX e logotipo OpenStax CNX não estão sujeitos à licença Creative Commons e não podem ser reproduzidos sem o consentimento prévio e expresso por escrito da Rice University.


    9.1 Detalhes

    Se estivermos olhando para apenas dois grupos (duas categorias), a ANOVA de um fator e o teste t de amostra independente nos dão os mesmos resultados.

    Agora, nossa hipótese nula é: as médias populacionais para todos os grupos são iguais. Portanto, se rejeitarmos o nulo do teste ANOVA de uma via, isso significa simplesmente que pelo menos uma das médias da população não é igual. Fazemos análises adicionais para identificar qual.

    O raciocínio por trás da ANOVA de um fator é o mesmo do teste t. Agora, entretanto, nossa distribuição é uma distribuição F, não uma distribuição t. Portanto, procuramos o F crítico em uma tabela F, não em uma tabela t.

    Mostrarei como usar a tabela F nas seções a seguir.


    Análise

    A análise de variância estende a comparação de dois grupos a vários, cada um um nível de uma variável categórica (fator). As amostras de cada grupo são independentes e devem ser selecionadas aleatoriamente de populações normais com variâncias iguais. Testamos a hipótese nula de médias iguais da resposta em todos os grupos versus a hipótese alternativa de um ou mais grupos significa ser diferente dos outros. Um teste de hipótese ANOVA unilateral determina se várias médias populacionais são iguais. A distribuição do teste é a distribuição (F ) com dois graus de liberdade diferentes.

    Premissas:

    1. Cada população da qual uma amostra é retirada é considerada normal.
    2. Todas as amostras são selecionadas aleatoriamente e independentes.
    3. As populações são assumidas como tendo desvios padrão iguais (ou variâncias).

    10.1: ANOVA unilateral

    stats_one_way_anova :: =

    A função de análise de variância unilateral (STATS_ONE_WAY_ANOVA) testa diferenças nas médias (para grupos ou variáveis) quanto à significância estatística, comparando duas estimativas diferentes de variância. Uma estimativa é baseada nas variações dentro de cada grupo ou categoria. Isso é conhecido como quadrados médios dentro ou erro quadrático médio. A outra estimativa é baseada nas variações entre as médias dos grupos. Isso é conhecido como quadrados médios entre. Se as médias dos grupos forem significativamente diferentes, então os quadrados médios entre serão maiores do que o esperado e não corresponderão aos quadrados médios internos. Se os quadrados médios dos grupos forem consistentes, as duas estimativas de variância serão aproximadamente as mesmas.

    STATS_ONE_WAY_ANOVA leva três argumentos: duas expressões e um valor de retorno do tipo VARCHAR2. expr1 é uma variável independente ou de agrupamento que divide os dados em um conjunto de grupos. expr2 é uma variável dependente (uma expressão numérica) contendo os valores correspondentes a cada membro de um grupo. A função retorna um número, determinado pelo valor do terceiro argumento. Se você omitir o terceiro argumento, o padrão é SIG. O significado dos valores de retorno é mostrado na Tabela 7-8.

    Tabela 7-8 Valores de retorno de STATS_ONE_WAY_ANOVA

    Valor de retorno Significado
    SUM_SQUARES_BETEEN Soma dos quadrados entre os grupos
    SUM_SQUARES_WITHIN Soma dos quadrados dentro dos grupos
    DF_BETWEEN Grau de liberdade entre grupos
    DF_WITHIN Grau de liberdade para dentro dos grupos
    MEAN_SQUARES_BETWEEN Quadrados médios entre grupos
    MEAN_SQUARES_WITHIN Quadrados médios dentro de grupos
    F_RATIO Razão dos quadrados médios entre os quadrados médios dentro (MSB / MSW)
    SIG Significado

    A significância da análise de variância unilateral é determinada pela obtenção da significância unilateral de um f-teste sobre a proporção dos quadrados médios entre e os quadrados médios dentro. O f-teste deve usar significância unilateral, porque os quadrados médios entre podem ser apenas iguais ou maiores do que os quadrados médios dentro. Portanto, a significância retornada por STATS_ONE_WAY_ANOVA é a probabilidade de que as diferenças entre os grupos ocorreram por acaso & # x2014 um número entre 0 e 1. Quanto menor o número, maior a significância da diferença entre os grupos. Consulte o STATS_F_TEST para obter informações sobre como realizar um f-teste.


    STATS_ONE_WAY_ANOVA Exemplo

    O exemplo a seguir determina a importância das diferenças nas vendas médias dentro de um nível de receita e as diferenças nas vendas médias entre os níveis de receita. Os resultados, p_valores próximos de zero, indicam que, tanto para homens quanto para mulheres, a diferença na quantidade de mercadorias vendidas nos diferentes níveis de renda é significativa.


    Assista o vídeo: Excel - One-Way ANOVA Analysis Toolpack (Dezembro 2021).