Artigos

9.3: Amostras combinadas ou emparelhadas - matemática


Ao usar um teste de hipótese para amostras combinadas ou emparelhadas, as seguintes características devem estar presentes:

  1. Amostragem aleatória simples é usada.
  2. Os tamanhos das amostras costumam ser pequenos.
  3. Duas medições (amostras) são tiradas do mesmo par de indivíduos ou objetos.
  4. As diferenças são calculadas a partir das amostras combinadas ou emparelhadas.
  5. As diferenças formam a amostra que é usada para o teste de hipótese.
  6. Ou os pares combinados têm diferenças que vêm de uma população normal ou o número de diferenças é suficientemente grande para que a distribuição da média das diferenças da amostra seja aproximadamente normal.

Em um teste de hipótese para amostras combinadas ou emparelhadas, os indivíduos são combinados em pares e as diferenças são calculadas. As diferenças são os dados. A média populacional para as diferenças, ( mu_ {d} ), é então testada usando um teste (t ) de Student para uma única média populacional com (n - 1 ) graus de liberdade, onde ( n ) é o número de diferenças.

A estatística de teste ( (t ) - pontuação) é:

[t = dfrac { bar {x} _ {d} - mu_ {d}} { left ( dfrac {s_ {d}} { sqrt {n}} right)} ]

Exemplo ( PageIndex {1} )

Um estudo foi realizado para investigar a eficácia do hipnotismo na redução da dor. Os resultados para assuntos selecionados aleatoriamente são mostrados na Tabela. Uma pontuação mais baixa indica menos dor. O valor "antes" é correspondido a um valor "depois" e as diferenças são calculadas. As diferenças têm distribuição normal. As medidas sensoriais são, em média, menores após o hipnotismo? Teste a um nível de significância de 5%.

Sujeito:UMABCDEFGH
Antes6.66.59.010.311.38.16.311.6
Após6.82.47.48.58.16.13.42.0

Responder

Os valores "antes" e "depois" correspondentes formam pares correspondentes. (Calcule "depois" - "antes.")

Depois de dadosAntes dos DadosDiferença
6.86.60.2
2.46.5-4.1
7.49-1.6
8.510.3-1.8
8.111.3-3.2
6.18.1-2
3.46.3-2.9
211.6-9.6

Os dados para o teste são as diferenças: ( {0,2, -4,1, -1,6, -1,8, -3,2, -2, -2,9, -9,6 } )

A média da amostra e o desvio padrão da amostra das diferenças são: ( bar {x} _ {d} = -3,13 ) e (s_ {d} = 2,91 ) Verifique esses valores.

Seja ( mu_ {d} ) a média da população para as diferenças. Usamos o subscrito dd para denotar "diferenças".

Variável aleatória:

( bar {X} _ {d} = ) a diferença média das medições sensoriais

[H_ {0}: mu_ {d} geq 0 ]

A hipótese nula é zero ou positiva, o que significa que há a mesma ou mais dor sentida após o hipnotismo. Isso significa que o assunto não mostra nenhuma melhoria. ( mu_ {d} ) é a média populacional das diferenças.

[H_ {a}: mu_ {d} <0 ]

A hipótese alternativa é negativa, o que significa que há menos dor sentida após o hipnotismo. Isso significa que o assunto mostra melhorias. A pontuação deve ser menor após o hipnotismo, então a diferença deve ser negativa para indicar melhora.

Distribuição para o teste:

A distribuição é do Aluno t com (df = n - 1 = 8 - 1 = 7 ). Use (t_ {7} ). (Observe que o teste é para uma única média populacional.)

Calcule o p-valor usando a distribuição t de Student:

[p text {-value} = 0,0095 ]

Gráfico:

Figura 10.5.1.

( bar {X} _ {d} ) é a variável aleatória para as diferenças.

A média da amostra e o desvio padrão da amostra das diferenças são:

( bar {x} _ {d} = -3,13 )

(s_ {d} = 2,91 )

Compare ( alpha ) e (p text {-value} )

( alpha = 0,05 ) e (p text {-valor} = 0,0095 ). ( alpha> p text {-valor} )

Tomar uma decisão

Desde ( alpha> p text {-value} ), rejeite (H_ {0} ). Isso significa que ( mu_ {d} <0 ) e há melhorias.

Conclusão

A um nível de significância de 5%, a partir dos dados amostrais, há evidências suficientes para concluir que as medidas sensoriais, em média, são menores após o hipnotismo. O hipnotismo parece ser eficaz na redução da dor.

Use sua lista de diferenças como os dados. AperteESTADOe seta paraTESTES. Aperte2: Teste T. Seta para cima paraDadose pressioneENTRAR. Use a seta para baixo e entre0para ( mu_ {0} ), o nome da lista onde você colocou os dados, e1para Freq :. Seta para baixo para ( mu ): e seta para cima para< ( mu_ {0} ). AperteENTRAR. Seta para baixo paraCalculare pressioneENTRAR. O (p text {-value} ) é 0,0094, e a estatística de teste é -3,04. Siga estas instruções novamente, exceto, seta paraDesenhar(em vez deCalcular) AperteENTRAR.

Exercício ( PageIndex {1} )

Um estudo foi conduzido para investigar a eficácia de uma nova dieta na redução do colesterol. Os resultados para os assuntos selecionados aleatoriamente são mostrados na tabela. Os níveis de colesterol dos indivíduos são mais baixos em média após a dieta? Teste no nível de 5%.

SujeitoUMABCDEFGHeu
Antes209210205198216217238240222
Após199207189209217202211223201

Responder

O (p text {-value} ) é 0,0130, então podemos rejeitar a hipótese nula. Há evidências suficientes para sugerir que a dieta reduz o colesterol.

Exemplo ( PageIndex {2} )

Um técnico de futebol universitário estava interessado em saber se a classe de desenvolvimento de força da faculdade aumentava a elevação máxima de seus jogadores (em libras) no exercício de supino. Ele pediu a quatro de seus jogadores que participassem de um estudo. A quantidade de peso que eles conseguiam levantar foi registrada antes de fazerem o curso de desenvolvimento de força. Depois de terminar a aula, a quantidade de peso que eles conseguiam levantar cada vez foi medida novamente. Os dados são os seguintes:

Peso em libras)Jogador 1Jogador 2Jogador 3Jogador 4
Quantidade de peso levantado antes da aula205241338368
Quantidade de peso levantado após a aula295252330360

O treinador quer saber se a classe de desenvolvimento de força torna seus jogadores mais fortes, em média.

Registre o diferenças dados. Calcule as diferenças subtraindo a quantidade de peso levantado antes da aula do peso levantado depois de terminar a aula. Os dados para as diferenças são: ( {90, 11, -8, -8 } ). Suponha que as diferenças tenham uma distribuição normal.

Usando os dados das diferenças, calcule a média da amostra e o desvio padrão da amostra.

[ bar {x} _ {d} = 21,3 ]

e

[s_ {d} = 46,7 ]

Usando os dados de diferença, isso se torna um teste de um único __________ (preencha o espaço em branco).

Defina a variável aleatória: ( bar {X} ) significa diferença no levantamento máximo por jogador.

A distribuição para o teste de hipótese é (t_ {3} ).

  • (H_ {0}: mu_ {d} leq 0 ),
  • (H_ {a}: mu_ {d}> 0 )

Gráfico:

Figura 10.5.2.

Calcule o (p text {-valor} ): O (p text {-value} ) é 0,2150

Decisão: Se o nível de significância for 5%, a decisão é não rejeitar a hipótese nula, pois ( alpha

Qual é a conclusão?

A um nível de significância de 5%, a partir dos dados da amostra, não há evidências suficientes para concluir que a classe de desenvolvimento de força ajudou a tornar os jogadores mais fortes, em média.

Exercício ( PageIndex {2} )

Uma nova classe preparatória foi projetada para melhorar os resultados dos testes SAT. Cinco alunos foram selecionados aleatoriamente. Suas notas em dois exames práticos foram registrados, um antes da aula e outro depois. Os dados registrados na Tabela. As pontuações são, em média, maiores após a aula? Teste a um nível de 5%.

Pontuações SATAluno 1Aluno 2Aluno 3Aluno 4
Pontuação antes da aula1840196019202150
Pontuação depois da aula1920216022002100

Responder

O (p text {-value} ) é 0,0874, portanto, recusamos rejeitar a hipótese nula. Os dados não suportam que a classe melhore significativamente as pontuações do SAT.

Exemplo ( PageIndex {3} )

Sete alunos da oitava série da Kennedy Middle School mediram até que ponto conseguiam forçar o arremesso de peso com a mão dominante (escrita) e a mão mais fraca (não escrita). Eles pensaram que poderiam empurrar distâncias iguais com qualquer uma das mãos. Os dados foram coletados e registrados na Tabela.

Distância (em pés) usandoAluno 1Aluno 2Aluno 3Aluno 4Aluno 5Aluno 6Aluno 7
Mão dominante30263417192620
Mão mais fraca28142718172616

Faça um teste de hipótese para determinar se a diferença média nas distâncias entre as mãos dominantes e as mãos mais fracas das crianças é significativa.

Registre o diferenças dados. Calcule as diferenças subtraindo as distâncias com a mão mais fraca das distâncias com a mão dominante. Os dados para as diferenças são: ( {2, 12, 7, –1, 2, 0, 4 } ). As diferenças têm distribuição normal.

Usando os dados das diferenças, calcule a média da amostra e o desvio padrão da amostra. ( bar {x} = 3,71 ), (s_ {d} = 4,5 ).

Variável aleatória: ( bar {X} = ) diferença média nas distâncias entre as mãos.

Distribuição para o teste de hipótese: (t_ {6} )

(H_ {0}: mu_ {d} = 0 H_ {a}: mu_ {d} neq 0 )

Gráfico:

Figura 10.5.3.

Calcule o p-valor: O (p text {-value} ) é 0,0716 (usando os dados diretamente).

(estatística de teste = 2,18. (p text {-valor} = 0,0719 ) usando (( bar {x} _ {d} = 3,71, s_ {d} = 4,5 ).

Decisão: Suponha que ( alpha = 0,05 ). Desde ( alpha

Conclusão: No nível de 5% de significância, a partir dos dados da amostra, não há evidências suficientes para concluir que há uma diferença nas mãos mais fracas e dominantes das crianças para empurrar o arremesso de peso.

Exercício ( PageIndex {3} )

Cinco jogadores de bola pensam que podem lançar a mesma distância com a mão dominante (lançamento) e mão inábil (mão que pega). Os dados foram coletados e registrados na Tabela. Faça um teste de hipótese para determinar se a diferença média nas distâncias entre a mão dominante e a mão inábil é significativa. Teste no nível de 5%.

Jogador 1Jogador 2Jogador 3Jogador 4Jogador 5
Mão dominante120111135140125
De improviso1051099811199

Responder

O (p text {-level} ) é 0,0230, então podemos rejeitar a hipótese nula. Os dados mostram que os jogadores não jogam a mesma distância com as mãos inativas e com as mãos dominantes.

Revisão do Capítulo

Um teste de hipótese para amostras combinadas ou emparelhadas ( (t ) - teste) tem estas características:

  • Teste as diferenças subtraindo uma medição da outra medição
  • Variável aleatória: (x_ {d} = ) média das diferenças
  • Distribuição: distribuição Student’s-t com (n - 1 ) graus de liberdade
  • Se o número de diferenças for pequeno (menos de 30), as diferenças devem seguir uma distribuição normal.
  • Duas amostras são retiradas do mesmo conjunto de objetos.
  • As amostras são dependentes.

Revisão de fórmula

Estatística de teste (t-pontuação): [t = dfrac { bar {x} _ {d}} { left ( dfrac {s_ {d}} { sqrt {n}} right)} ]

Onde:

(x_ {d} ) é a média das diferenças de amostra. ( mu_ {d} ) é a média das diferenças populacionais. (s_ {d} ) é o desvio padrão da amostra das diferenças. (n ) é o tamanho da amostra.


9.3: Amostras combinadas ou emparelhadas - matemática

Suponha que os engenheiros químicos desejem comparar a economia de combustível obtida por duas formulações diferentes de gasolina. Uma vez que a economia de combustível varia amplamente de carro para carro, se a economia média de combustível de duas amostras independentes de veículos rodando com os dois tipos de combustível fosse comparada, mesmo se uma formulação fosse melhor do que a outra, a grande variabilidade de veículo para veículo poderia fazer qualquer diferença decorrente de diferença de combustível difícil de detectar. Imagine uma amostra aleatória com muito mais veículos grandes do que a outra. Em vez de amostras aleatórias independentes, faria mais sentido selecionar pares de carros da mesma marca e modelo e dirigidos em circunstâncias semelhantes, e comparar a economia de combustível dos dois carros em cada par. Assim, os dados seriam parecidos com a Tabela 9.1 "Economia de combustível de pares de veículos", onde o primeiro carro em cada par é operado com uma formulação do combustível (chame-o de gasolina Tipo 1) e o segundo carro é operado com a segunda ( chamá-lo de gasolina tipo 2).

Tabela 9.1 Economia de Combustível de Pares de Veículos

Marca e modelo Carro 1 Carro 2
Buick LaCrosse 17.0 17.0
Dodge Viper 13.2 12.9
Honda CR-Z 35.3 35.4
Hummer H 3 13.6 13.2
Lexus RX 32.7 32.5
Mazda CX-9 18.4 18.1
Saab 9-3 22.5 22.5
Toyota Corolla 26.8 26.7
Volvo XC 90 15.1 15.0

A primeira coluna de números forma uma amostra da População 1, a população de todos os carros movidos a gasolina Tipo 1 e a segunda coluna de números forma uma amostra da População 2, a população de todos os carros movidos a gasolina Tipo 2. Seria incorreto analisar os dados usando as fórmulas da seção anterior, no entanto, uma vez que as amostras não foram extraídas de forma independente. o que é correto é calcular a diferença nos números em cada par (subtraindo na mesma ordem cada vez) para obter a terceira coluna de números conforme mostrado na Tabela 9.2 "Economia de combustível de pares de veículos" e tratar as diferenças como os dados. Neste ponto, a nova amostra de diferenças d 1 = 0,0,…, d 9 = 0,1 na terceira coluna da Tabela 9.2 "Economia de combustível de pares de veículos" pode ser considerada como uma amostra aleatória de tamanho n = 9 selecionado de uma população com média μ d = μ 1 - μ 2. Essa abordagem transforma essencialmente o problema de duas amostras emparelhadas em um problema de uma amostra, conforme discutido nos dois capítulos anteriores.

Tabela 9.2 Economia de Combustível de Pares de Veículos

Marca e modelo Carro 1 Carro 2 Diferença
Buick LaCrosse 17.0 17.0 0.0
Dodge Viper 13.2 12.9 0.3
Honda CR-Z 35.3 35.4 −0.1
Hummer H 3 13.6 13.2 0.4
Lexus RX 32.7 32.5 0.2
Mazda CX-9 18.4 18.1 0.3
Saab 9-3 22.5 22.5 0.0
Toyota Corolla 26.8 26.7 0.1
Volvo XC 90 15.1 15.0 0.1

Observe cuidadosamente que embora não importe a ordem em que a subtração é feita, ela deve ser feita no mesmo pedido para todos os pares. É por isso que existem quantidades positivas e negativas na terceira coluna de números na Tabela 9.2 "Economia de combustível de pares de veículos".


9.3: Amostras combinadas ou emparelhadas - matemática

Na maioria dos casos de dados econômicos ou de negócios, temos pouco ou nenhum controle sobre o processo de coleta dos dados. Nesse sentido, os dados não são o resultado de um experimento controlado planejado. Em alguns casos, entretanto, podemos desenvolver dados que fazem parte de um experimento controlado. Essa situação ocorre com frequência em situações de controle de qualidade. Imagine que duas taxas de produção de duas máquinas construídas com o mesmo projeto, mas em fábricas diferentes, estão sendo testadas quanto a diferenças em algumas métricas de produção, como velocidade de produção ou atendimento a alguma especificação de produção, como resistência do produto. O formato do teste é o mesmo que testamos, mas aqui podemos ter pares correspondentes para os quais podemos testar se existem diferenças. Cada observação tem seu par combinado, contra o qual as diferenças são calculadas. Primeiro, as diferenças entre duas listas de observação devem ser calculadas, e isso é normalmente rotulado com a letra "d". Então, a média dessas diferenças combinadas, X & # 175 d X & # 175 d é calculada como seu desvio padrão, Sd. Esperamos que o desvio padrão das diferenças dos pares combinados seja menor do que os pares não correspondidos porque, presumivelmente, devem existir menos diferenças devido à correlação entre os dois grupos.

Ao usar um teste de hipótese para amostras combinadas ou emparelhadas, as seguintes características devem estar presentes:

  1. Amostragem aleatória simples é usada.
  2. Os tamanhos das amostras costumam ser pequenos.
  3. Duas amostras de medidas (amostras) são retiradas do mesmo par de indivíduos ou objetos.
  4. As diferenças são calculadas a partir das amostras combinadas ou emparelhadas.
  5. As diferenças formam a amostra que é usada para o teste de hipótese.
  6. Ou os pares combinados têm diferenças que vêm de uma população normal ou o número de diferenças é suficientemente grande para que a distribuição da média das diferenças da amostra seja aproximadamente normal.

Em um teste de hipótese para amostras combinadas ou emparelhadas, os sujeitos são combinados em pares e as diferenças são calculadas. As diferenças são os dados. A média da população para as diferenças, μd, é então testado usando um teste t de Student para uma única média populacional com n & # 8211 1 grau de liberdade, onde n é o número de diferenças, ou seja, o número de pares e não o número de observações.

Uma amostra de 20 alunos é retirada para examinar suas pontuações no ACT antes e depois de um curso preparatório. Cada aluno constitui um "par", o antes do curso preparatório e a pontuação após o curso preparatório. As diferenças nas duas pontuações foram calculadas para cada aluno e as médias de antes e depois do curso preparatório foram calculadas. A média da amostra antes do curso preparatório foi de 20,4, e a média da amostra após o curso preparatório foi de 23,9. O desvio padrão das diferenças nas duas pontuações entre os 20 alunos foi de 3,8 pontos. Teste com 90% de confiança a hipótese nula de que as duas médias populacionais são iguais contra a alternativa de que o curso preparatório ajuda a melhorar a pontuação ACT.

O primeiro passo é identificar isso como um caso de dois exemplos: antes da aula preparatória e depois da aula preparatória. Isso diferencia esse problema de problemas simples de um exemplo. Em segundo lugar, determinamos que as duas amostras são "emparelhadas". Cada observação na primeira amostra tem uma observação pareada na segunda amostra. Essas informações nos dizem que as hipóteses nula e alternativa devem ser:

Este formulário reflete a afirmação implícita de que o curso preparatório melhora as pontuações do ACT, o teste é unilateral e a afirmação está na hipótese alternativa. Como o experimento foi conduzido como uma amostra emparelhada, em vez de simplesmente obter pontuações de pessoas que fizeram o curso preparatório e daquelas que não o fizeram, usamos a estatística de teste de pares combinados:

Para resolver essa equação, as pontuações individuais, o curso pré-preparatório e o curso pós-preparatório precisam ser usados ​​para calcular as diferenças individuais. Essas pontuações são então calculadas e a diferença média é calculada:

A partir dessas diferenças, podemos calcular o desvio padrão entre as diferenças individuais:

Podemos agora comparar o valor calculado da estatística de teste, 4,12, com o valor crítico. O valor crítico é um t de Student com graus de liberdade iguais ao número de pares, não observações, menos 1. Neste caso, 20 pares e nível de confiança de 90% ta / 2 = & # 1771.729 em df = 20 - 1 = 19. A estatística de teste calculada está certamente na cauda da distribuição e, portanto, não podemos aceitar a hipótese nula de que não há diferença da classe preparatória. As evidências parecem indicar que o curso preparatório ajuda os alunos a obterem pontuações mais altas no ACT.

Um estudo foi realizado para investigar a eficácia do hipnotismo na redução da dor. Os resultados para assuntos selecionados aleatoriamente são mostrados em [link]. Uma pontuação mais baixa indica menos dor.O valor "antes" é correspondido a um valor "depois" e as diferenças são calculadas. As diferenças têm distribuição normal. As medidas sensoriais são, em média, menores após o hipnotismo? Teste a um nível de significância de 5%.

Sujeito: UMA B C D E F G H
Antes 6.6 6.5 9.0 10.3 11.3 8.1 6.3 11.6
Após 6.8 2.4 7.4 8.5 8.1 6.1 3.4 2.0

Os valores "antes" e "depois" correspondentes formam pares correspondentes. (Calcule "depois" & # 8211 "antes.")

Depois de dados Antes dos Dados Diferença
6.8 6.6 0.2
2.4 6.5 -4.1
7.4 9 -1.6
8.5 10.3 -1.8
8.1 11.3 -3.2
6.1 8.1 -2
3.4 6.3 -2.9
2 11.6 -9.6

Os dados para o teste são as diferenças:

A média da amostra e o desvio padrão da amostra das diferenças são: x & # 8211 d = & # 82113,13 x & # 8211 d = & # 82113,13 es d = 2,91 s d = 2,91 Verifique esses valores.

A hipótese nula é zero ou positiva, o que significa que há a mesma ou mais dor sentida após o hipnotismo. Isso significa que o assunto não mostra nenhuma melhoria. μd é a média populacional das diferenças.)

A hipótese alternativa é negativa, o que significa que há menos dor sentida após o hipnotismo. Isso significa que o assunto mostra melhorias. A pontuação deve ser menor após o hipnotismo, então a diferença deve ser negativa para indicar melhora.

Distribuição para o teste: A distribuição é do Aluno t com df = n & # 8211 1 = 8 & # 8211 1 = 7. Use t7. (Observe que o teste é para uma única média populacional.)

Calcule a estatística de teste e procure o valor crítico usando a distribuição t de Student: O valor calculado da estatística de teste é 3,06 e o ​​valor crítico da distribuição t com 7 graus de liberdade no nível de confiança de 5% é 1,895 com um teste unicaudal.

A média da amostra e o desvio padrão da amostra das diferenças são:

Compare o valor crítico de alfa com a estatística de teste calculada.

A conclusão de usar a comparação da estatística de teste calculada e o valor crítico nos dará o resultado. Nesta questão, a estatística de teste calculada é 3,06 e o ​​valor crítico é 1,895. A estatística do teste está claramente na cauda e, portanto, não podemos aceitar a hipótese nula de que não há diferença entre as duas situações, hipnotizado e não hipnotizado.

Tomar uma decisão: Não pode aceitar a hipótese nula, H0. Isso significa que μd & lt 0 e há melhora.

Conclusão: A um nível de significância de 5%, a partir dos dados amostrais, há evidências suficientes para concluir que as medidas sensoriais, em média, são menores após o hipnotismo. O hipnotismo parece ser eficaz na redução da dor.

Um estudo foi conduzido para investigar a eficácia de uma nova dieta na redução do colesterol. Os resultados para os assuntos selecionados aleatoriamente são mostrados na tabela. As diferenças têm distribuição normal. Os níveis de colesterol dos indivíduos e # 8217 estão mais baixos em média após a dieta? Teste no nível de 5%.

Sujeito UMA B C D E F G H eu
Antes 209 210 205 198 216 217 238 240 222
Após 199 207 189 209 217 202 211 223 201

O p-valor é 0,0130, portanto, podemos rejeitar a hipótese nula. Há evidências suficientes para sugerir que a dieta reduz o colesterol.

Um técnico de futebol universitário estava interessado em saber se a classe de desenvolvimento de força da faculdade aumentava a elevação máxima de seus jogadores (em libras) no exercício de supino. Ele pediu a quatro de seus jogadores que participassem de um estudo. A quantidade de peso que eles conseguiam levantar foi registrada antes de fazerem o curso de desenvolvimento de força. Depois de terminar a aula, a quantidade de peso que eles conseguiam levantar cada vez foi medida novamente. Os dados são os seguintes:

Peso em libras) Jogador 1 Jogador 2 Jogador 3 Jogador 4
Quantidade de peso levantado antes da aula 205 241 338 368
Quantidade de peso levantado após a aula 295 252 330 360

O treinador quer saber se a classe de desenvolvimento de força torna seus jogadores mais fortes, em média.
Registre o diferenças dados. Calcule as diferenças subtraindo a quantidade de peso levantado antes da aula do peso levantado depois de terminar a aula. Os dados para as diferenças são: <90, 11, -8, -8>. Suponha que as diferenças tenham uma distribuição normal.

Usando os dados de diferença, isso se torna um teste de um único __________ (preencha o espaço em branco).

A distribuição para o teste de hipótese é um t de aluno com 3 graus de liberdade.

Calcule a estatística de teste e procure o valor crítico: O valor crítico do t do aluno a um nível de significância de 5% e 3 graus de liberdade são 2,353 e 0,91, respectivamente.

Decisão: Se o nível de significância for 5%, não podemos rejeitar a hipótese nula, pois o valor calculado da estatística de teste não está na cauda.

Qual é a conclusão?

Ao nível de significância de 5%, a partir dos dados da amostra, não há evidências suficientes para concluir que a classe de desenvolvimento de força ajudou a tornar os jogadores mais fortes, em média.

Uma nova classe preparatória foi projetada para melhorar os resultados dos testes SAT. Cinco alunos foram selecionados aleatoriamente. Suas notas em dois exames práticos foram registrados, um antes da aula e outro depois. Os dados registrados em [link]. As pontuações são, em média, maiores após a aula? Teste a um nível de 5%.

Pontuações SAT Aluno 1 Aluno 2 Aluno 3 Aluno 4
Pontuação antes da aula 1840 1960 1920 2150
Pontuação depois da aula 1920 2160 2200 2100

O p-valor é 0,0874, portanto, recusamos rejeitar a hipótese nula. Os dados não suportam que a classe melhore as pontuações do SAT significativamente.

Cinco jogadores de bola pensam que podem lançar a mesma distância com a mão dominante (lançamento) e mão inábil (mão que pega). Os dados foram coletados e registrados em [link]. Faça um teste de hipótese para determinar se a diferença média nas distâncias entre a mão dominante e a mão inábil é significativa. Teste no nível de 5%.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5
Mão dominante 120 111 135 140 125
De improviso 105 109 98 111 99

O p-level é 0,0230, portanto, podemos rejeitar a hipótese nula. Os dados mostram que os jogadores não jogam a mesma distância com as mãos inativas e com as mãos dominantes.

Revisão do Capítulo

Um teste de hipótese para amostras combinadas ou emparelhadas (teste t) tem estas características:

  • Teste as diferenças subtraindo uma medição da outra medição
  • Variável aleatória: x & # 8211 d x & # 8211 d = média das diferenças
  • Distribuição: distribuição Student & # 8217s-t com n & # 8211 1 grau de liberdade
  • Se o número de diferenças for pequeno (menos de 30), as diferenças devem seguir uma distribuição normal.
  • Duas amostras são retiradas do mesmo conjunto de objetos.
  • As amostras são dependentes.

Revisão de fórmula

Use as informações a seguir para responder aos próximos cinco exercícios. Um estudo foi conduzido para testar a eficácia de um patch de software na redução de falhas do sistema em um período de seis meses. Os resultados das instalações selecionadas aleatoriamente são mostrados em [link]. O valor & # 8220before & # 8221 corresponde a um valor & # 8220after & # 8221 e as diferenças são calculadas. As diferenças têm distribuição normal. Teste ao nível de significância de 1%.

Instalação UMA B C D E F G H
Antes 3 6 4 2 5 8 2 6
Após 1 5 2 0 1 0 2 2

Qual é a variável aleatória?

a diferença média das falhas do sistema

Declare as hipóteses nula e alternativa.

Que conclusão você pode tirar sobre o patch de software?

Com um p-valor 0,0067, não podemos aceitar a hipótese nula. Há evidências suficientes para apoiar que o patch de software é eficaz na redução do número de falhas do sistema.


Use as informações a seguir para responder aos próximos cinco exercícios. Um estudo foi realizado para testar a eficácia de uma aula de malabarismo. Antes da aula começar, seis sujeitos fizeram malabarismos com quantas bolas puderam de uma vez. Depois da aula, os mesmos seis sujeitos fizeram malabarismos com quantas bolas puderam. As diferenças no número de bolas são calculadas. As diferenças têm distribuição normal. Teste ao nível de significância de 1%.

Sujeito UMA B C D E F
Antes 3 4 3 2 4 5
Após 4 5 6 4 5 7

Declare as hipóteses nula e alternativa.

Qual é a diferença média da amostra?

Que conclusão você pode tirar sobre a aula de malabarismo?


Use as informações a seguir para responder aos próximos cinco exercícios. Um médico quer saber se um medicamento para pressão arterial é eficaz. Seis sujeitos têm sua pressão arterial registrada. Após doze semanas de medicação, os mesmos seis indivíduos têm sua pressão arterial registrada novamente. Para este teste, apenas a pressão sistólica é preocupante. Teste ao nível de significância de 1%.

Paciente UMA B C D E F
Antes 161 162 165 162 166 171
Após 158 159 166 160 167 169

Declare as hipóteses nula e alternativa.

Qual é a estatística de teste?

Qual é a diferença média da amostra?

Recusamos rejeitar a hipótese nula. Não há evidências suficientes para apoiar que o medicamento seja eficaz.

Trabalho de casa

INSTRUÇÕES: Para cada um dos problemas de palavras, use uma folha de solução para fazer o teste de hipótese. A ficha de solução encontra-se no Apêndice E. Sinta-se à vontade para fazer cópias das fichas de solução. Para a versão online do livro, sugere-se que você copie os arquivos .doc ou .pdf.

Se você estiver usando um aluno t-distribuição para os problemas do dever de casa, inclusive para dados emparelhados, você pode presumir que a população subjacente é normalmente distribuída. (Ao usar esses testes em uma situação real, você deve primeiro provar essa suposição, no entanto.)

Dez indivíduos fizeram uma dieta com baixo teor de gordura por 12 semanas para reduzir o colesterol. Os dados são registrados em [link]. Você acha que seus níveis de colesterol baixaram significativamente?

Nível inicial de colesterol Terminando o nível de colesterol
140 140
220 230
110 120
240 220
200 190
180 150
190 200
360 300
280 300
260 240

No nível de significância de 5%, não há evidências suficientes para concluir que o medicamento reduziu os níveis de colesterol após 12 semanas.

Use as informações a seguir para responder aos próximos dois exercícios. Uma nova droga de prevenção da AIDS foi testada em um grupo de 224 pacientes HIV positivos. Quarenta e cinco pacientes desenvolveram AIDS após quatro anos. Em um grupo de controle de 224 pacientes HIV positivos, 68 desenvolveram AIDS após quatro anos. Queremos testar se o método de tratamento reduz a proporção de pacientes que desenvolvem AIDS após quatro anos ou se as proporções do grupo tratado e do grupo não tratado permanecem as mesmas.

Deixe o subscrito t = paciente tratado e ut = paciente não tratado.

As hipóteses apropriadas são:

  1. H0: pt & lt put e Huma: ptput
  2. H0: ptput e Huma: pt & gt put
  3. H0: pt = put e Huma: ptput
  4. H0: pt = put e Huma: pt & lt put

Use as informações a seguir para responder aos próximos dois exercícios. Um experimento é conduzido para mostrar que a pressão arterial pode ser reduzida conscientemente em pessoas treinadas em um & # 8220 programa de exercícios de biofeedback & # 8221. Seis indivíduos foram selecionados aleatoriamente e as medições da pressão arterial foram registradas antes e depois do treinamento. A diferença entre as pressões sanguíneas foi calculada (depois - antes) produzindo os seguintes resultados: x & # 8211 d x & # 8211 d = & # 872210.2 sd = 8,4. Usando os dados, teste a hipótese de que a pressão arterial diminuiu após o treinamento.

A distribuição do teste é:

Um instrutor de golfe está interessado em determinar se sua nova técnica para melhorar as pontuações dos jogadores e # 8217 é eficaz. Ela aceita quatro novos alunos. Ela registra a pontuação de 18 buracos antes de aprender a técnica e, em seguida, após ter feito sua aula. Ela realiza um teste de hipótese. Os dados são os seguintes.

Jogador 1 Jogador 2 Jogador 3 Jogador 4
Pontuação média antes da aula 83 78 93 87
Pontuação média após a aula 80 80 86 86

Um grupo local de apoio ao câncer acredita que a estimativa de novos casos de câncer de mama feminino no sul é maior em 2013 do que em 2012. O grupo comparou as estimativas de novos casos de câncer de mama feminino no estado do sul em 2012 e em 2013. Os resultados estão em [link].

Estados do Sul 2012 2013
Alabama 3,450 3,720
Arkansas 2,150 2,280
Flórida 15,540 15,710
Georgia 6,970 7,310
Kentucky 3,160 3,300
Louisiana 3,320 3,630
Mississippi 1,990 2,080
Carolina do Norte 7,090 7,430
Oklahoma 2,630 2,690
Carolina do Sul 3,570 3,580
Tennessee 4,680 5,070
Texas 15,050 14,980
Virgínia 6,190 6,280

Teste: dois pares combinados ou amostras emparelhadas (t-teste)

A média das diferenças de novos casos de câncer de mama feminino no sul entre 2013 e 2012 é maior que zero. A estimativa de novos casos de câncer de mama feminino no sul é maior em 2013 do que em 2012.

Decisão: Não posso aceitar H0

Conclusão: Ao nível de significância de 5%, a partir dos dados da amostra, há evidências suficientes para concluir que houve uma estimativa maior de novos casos de câncer de mama feminino em 2013 do que em 2012.

Um viajante quis saber se os preços dos hotéis são diferentes nas dez cidades que mais visita. A lista das cidades com os preços de hotéis correspondentes para suas duas cadeias de hotéis favoritas está em [link]. Teste ao nível de significância de 1%.

Cidades Preços do Hyatt Regency em dólares Preços Hilton em dólares
Atlanta 107 169
Boston 358 289
Chicago 209 299
Dallas 209 198
Denver 167 169
Indianápolis 179 214
Los Angeles 179 169
Cidade de Nova York 625 459
Filadélfia 179 159
Washington DC 245 239

Um político pediu a sua equipe que determinasse se a taxa de subemprego no Nordeste diminuiu de 2011 a 2012. Os resultados estão em [link].

Estados nordestinos 2011 2012
Connecticut 17.3 16.4
Delaware 17.4 13.7
Maine 19.3 16.1
Maryland 16.0 15.5
Massachusetts 17.6 18.2
Nova Hampshire 15.4 13.5
Nova Jersey 19.2 18.7
Nova york 18.5 18.7
Ohio 18.2 18.8
Pensilvânia 16.5 16.9
Rhode Island 20.7 22.4
Vermont 14.7 12.3
West Virginia 15.5 17.3

Teste: amostras combinadas ou emparelhadas (t-teste)

A média das diferenças da taxa de subemprego dos estados do Nordeste entre 2012 e 2011 é menor que zero. A taxa de subemprego caiu de 2011 a 2012.

Conclusão: Ao nível de significância de 5%, a partir dos dados amostrais, não há evidências suficientes para concluir que houve queda nas taxas de subemprego nos estados do Nordeste de 2011 a 2012.

Juntando tudo

Use as informações a seguir para responder aos próximos dez exercícios. indique qual das seguintes opções melhor identifica o teste de hipótese.

  1. médias de grupos independentes, desvios padrão populacionais e / ou variâncias conhecidas
  2. médias de grupos independentes, desvios padrão populacionais e / ou variâncias desconhecidas
  3. amostras combinadas ou emparelhadas
  4. única média
  5. duas proporções
  6. proporção única

Uma dieta em pó é testada em 49 pessoas, e uma dieta líquida é testada em 36 pessoas diferentes. Os desvios padrão da população são de duas libras e três libras, respectivamente. É interessante saber se a dieta líquida produz uma perda média de peso maior do que a dieta em pó.

Uma nova barra de chocolate é testada em consumidores. É interessante saber se a proporção de crianças que gostam da nova barra de chocolate é maior do que a proporção de adultos que gostam.

Acredita-se que o número médio de cursos de inglês realizados em um período de dois anos por estudantes universitários do sexo masculino e feminino seja aproximadamente o mesmo. Um experimento é conduzido e os dados são coletados de nove homens e 16 mulheres.

Uma liga de futebol relatou que o número médio de touchdowns por jogo era cinco. Um estudo é feito para determinar se o número médio de touchdowns diminuiu.

É feito um estudo para determinar se os alunos do sistema de universidades do estado da Califórnia demoram mais para se formar do que os alunos matriculados em universidades privadas. Cem alunos do sistema universitário do estado da Califórnia e de universidades privadas são entrevistados. A partir de anos de pesquisa, sabe-se que os desvios-padrão populacionais são de 1,5811 anos e um ano, respectivamente.

De acordo com um boletim informativo do YWCA Rape Crisis Center, 75% das vítimas de estupro conhecem seus agressores. Um estudo é feito para verificar isso.

De acordo com um estudo recente, as empresas dos EUA têm uma licença-maternidade média de seis semanas.

Uma pesquisa recente sobre drogas mostrou um aumento no uso de drogas e álcool entre os alunos do ensino médio local, em comparação com o percentual nacional. Suponha que uma pesquisa com 100 jovens locais e 100 nacionais seja conduzida para ver se a proporção de uso de drogas e álcool é mais alta localmente do que nacionalmente.

Um novo curso de estudo SAT é testado em 12 indivíduos. As pontuações pré e pós-curso são registradas. De interesse é o aumento médio nas pontuações do SAT. Os seguintes dados são coletados:

Pontuação pré-curso Pontuação pós-curso
1 300
960 920
1010 1100
840 880
1100 1070
1250 1320
860 860
1330 1370
790 770
990 1040
1110 1200
740 850

Pesquisadores da Universidade de Michigan relataram no Journal of the National Cancer Institute que parar de fumar é especialmente benéfico para aqueles com menos de 49 anos. Neste estudo da American Cancer Society, o risco (probabilidade) de morrer de câncer de pulmão foi quase o mesmo que para aqueles que nunca tinha fumado.

Lesley E. Tan investigou a relação entre canhotos vs. destros e competência motora em crianças pré-escolares. Amostras aleatórias de 41 pré-escolares canhotos e 41 pré-escolares destros foram submetidos a vários testes de habilidades motoras para determinar se há evidência de uma diferença entre as crianças com base neste experimento. O experimento produziu as médias e desvios padrão mostrados [link]. Determine o teste apropriado e a melhor distribuição a ser usada para esse teste.

  1. Duas médias independentes, distribuição normal
  2. Dois meios independentes, distribuição Student & # 8217s-t
  3. Amostras combinadas ou emparelhadas, distribuição Student & # 8217s-t
  4. Duas proporções da população, distribuição normal

Um instrutor de golfe está interessado em determinar se sua nova técnica para melhorar as pontuações dos jogadores e # 8217 é eficaz. Ela aceita quatro (4) novos alunos. Ela registra a pontuação de 18 buracos antes de aprender a técnica e, em seguida, após ter feito sua aula. Ela realiza um teste de hipótese. Os dados são como [link].


9.3: Amostras combinadas ou emparelhadas - matemática

Ao usar um teste de hipótese para amostras combinadas ou emparelhadas, as seguintes características devem estar presentes:

  1. Amostragem aleatória simples é usada.
  2. Os tamanhos das amostras costumam ser pequenos.
  3. Duas medições (amostras) são tiradas do mesmo par de indivíduos ou objetos.
  4. As diferenças são calculadas a partir das amostras combinadas ou emparelhadas.
  5. As diferenças formam a amostra que é usada para o teste de hipótese.
  6. Ou os pares combinados têm diferenças que vêm de uma população normal ou o número de diferenças é suficientemente grande para que a distribuição da média das diferenças da amostra seja aproximadamente normal.

Em um teste de hipótese para amostras combinadas ou emparelhadas, os indivíduos são combinados em pares e as diferenças são calculadas. As diferenças são os dados. A média da população para as diferenças, & # 956 & # 956 d, é então testado usando um teste t de Student para uma única média populacional com n n & # 8211 1 graus de liberdade, onde n n é o número de diferenças.

Um estudo foi realizado para investigar a eficácia do hipnotismo na redução da dor. Os resultados para assuntos selecionados aleatoriamente são mostrados em [link]. Uma pontuação mais baixa indica menos dor.O valor "antes" é correspondido a um valor "depois" e as diferenças são calculadas. As diferenças têm distribuição normal. As medidas sensoriais são, em média, menores após o hipnotismo? Teste a um nível de significância de 5%.

Sujeito: UMA B C D E F G H
Antes 6.6 6.5 9.0 10.3 11.3 8.1 6.3 11.6
Após 6.8 2.4 7.4 8.5 8.1 6.1 3.4 2.0

Os valores "antes" e "depois" correspondentes formam pares correspondentes. (Calcule "depois" & # 8211 "antes.")

Depois de dados Antes dos Dados Diferença
6.8 6.6 0.2
2.4 6.5 -4.1
7.4 9 -1.6
8.5 10.3 -1.8
8.1 11.3 -3.2
6.1 8.1 -2
3.4 6.3 -2.9
2 11.6 -9.6

A média da amostra e o desvio padrão da amostra das diferenças são: x & # 175 d = x & # 175 d = & # 82113,13 e
s d = s d = 2,91 Verifique esses valores.

A hipótese nula é que a diferença é zero, o que significa que há a mesma quantidade de dor sentida após o hipnotismo. Isso significa que o assunto não mostra nenhuma melhoria. (& # 956 e # 956 d é a média populacional das diferenças.)

A hipótese alternativa é negativa, o que significa que há menos dor sentida após o hipnotismo. Isso significa que o assunto mostra melhorias. A pontuação deve ser menor após o hipnotismo, então a diferença deve ser negativa para indicar melhora.

A média da amostra e o desvio padrão da amostra das diferenças são:

Conclusão: A um nível de significância de 5%, a partir dos dados amostrais, há evidências suficientes para concluir que as medidas sensoriais, em média, são menores após o hipnotismo. O hipnotismo parece ser eficaz na redução da dor.

Para as calculadoras TI-83 + e TI-84, você pode calcular as diferenças antecipadamente (depois antes) e colocar as diferenças em uma lista ou você pode colocar o após dados em uma primeira lista e o antes dados em uma segunda lista. Em seguida, vá para uma terceira lista e vá até o nome. Insira o primeiro nome da lista - o segundo nome da lista. A calculadora fará a subtração e você terá as diferenças na terceira lista.

Um estudo foi conduzido para investigar a eficácia de uma nova dieta na redução do colesterol. Os resultados para os assuntos selecionados aleatoriamente são mostrados na tabela. As diferenças têm distribuição normal. Os níveis de colesterol dos indivíduos e # 8217 estão mais baixos em média após a dieta? Teste no nível de 5%.

Sujeito UMA B C D E F G H eu
Antes 209 210 205 198 216 217 238 240 222
Após 199 207 189 209 217 202 211 223 201

Um técnico de futebol universitário estava interessado em saber se a classe de desenvolvimento de força da faculdade aumentava a elevação máxima de seus jogadores (em libras) no exercício de supino. Ele pediu a quatro de seus jogadores que participassem de um estudo. A quantidade de peso que eles conseguiam levantar foi registrada antes de fazerem o curso de desenvolvimento de força. Depois de terminar a aula, a quantidade de peso que eles conseguiam levantar cada vez foi medida novamente. Os dados são os seguintes:

Peso em libras) Jogador 1 Jogador 2 Jogador 3 Jogador 4
Quantidade de peso levantado antes da aula 205 241 338 368
Quantidade de peso levantado após a aula 295 252 330 360

O treinador quer saber se a classe de desenvolvimento de força torna seus jogadores mais fortes, em média.

Registre o diferenças dados. Calcule as diferenças subtraindo a quantidade de peso levantado antes da aula do peso levantado depois de terminar a aula. Os dados para as diferenças são: <90, 11, -8, -8>. Suponha que as diferenças tenham uma distribuição normal.

Usando os dados das diferenças, calcule a média da amostra e o desvio padrão da amostra.

Os dados fornecidos aqui indicam que a distribuição está realmente inclinada para a direita. A diferença de 90 pode ser um outlier extremo? Está puxando a média da amostra para 21,3 (positivo). As médias dos outros três valores de dados são realmente negativas.

Usando os dados de diferença, isso se torna um teste de um único __________ (preencha o espaço em branco).

A distribuição para o teste de hipótese é t t 3.

Decisão: Se o nível de significância for 5%, a decisão é não rejeitar a hipótese nula, porque p -valor & gt & # 945 & # 945.

Qual é a conclusão?

A um nível de significância de 5%, a partir dos dados da amostra, não há evidências suficientes para concluir que a classe de desenvolvimento de força ajudou a tornar os jogadores mais fortes, em média.

Uma nova classe preparatória foi projetada para melhorar os resultados dos testes SAT. Cinco alunos foram selecionados aleatoriamente. Suas notas em dois exames práticos foram registrados, um antes da aula e outro depois. Os dados registrados em [link]. As pontuações são, em média, maiores após a aula? Teste a um nível de 5%.

Pontuações SAT Aluno 1 Aluno 2 Aluno 3 Aluno 4
Pontuação antes da aula 1840 1960 1920 2150
Pontuação depois da aula 1920 2160 2200 2100

Sete alunos da oitava série da Kennedy Middle School mediram até que ponto conseguiam empurrar o arremesso de peso com a mão dominante (escrita) e a mão mais fraca (não escrita). Eles pensaram que poderiam empurrar distâncias iguais com qualquer uma das mãos. Os dados foram coletados e registrados em [link].

Distância (em pés) usando Aluno 1 Aluno 2 Aluno 3 Aluno 4 Aluno 5 Aluno 6 Aluno 7
Mão dominante 30 26 34 17 19 26 20
Mão mais fraca 28 14 27 18 17 26 16

Faça um teste de hipótese para determinar se a diferença média nas distâncias entre as mãos dominantes da criança e as mãos mais fracas é significativa.

Registre o diferenças dados. Calcule as diferenças subtraindo as distâncias com a mão mais fraca das distâncias com a mão dominante. Os dados para as diferenças são:
<2, 12, 7, & # 82111, 2, 0, 4>. As diferenças têm distribuição normal.

Usando os dados das diferenças, calcule a média da amostra e o desvio padrão da amostra.
x & # 175 d x & # 175 d = 3,71, s d s d = 4,5.

Distribuição para o teste de hipótese: t t 6.

Conclusão: No nível de 5% de significância, a partir dos dados da amostra, não há evidência suficiente para concluir que há uma diferença nas mãos das crianças mais fracas e dominantes para empurrar o arremesso de peso.

Cinco jogadores de bola pensam que podem lançar a mesma distância com a mão dominante (lançamento) e mão inábil (mão que pega). Os dados foram coletados e registrados em [link]. Faça um teste de hipótese para determinar se a diferença média nas distâncias entre a mão dominante e a mão inábil é significativa. Teste no nível de 5%.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5
Mão dominante 120 111 135 140 125
De improviso 105 109 98 111 99

Revisão da Seção

Um teste de hipótese para amostras combinadas ou emparelhadas (t t -test) tem estas características:

  • Teste as diferenças subtraindo uma medição da outra medição
  • Variável aleatória: x & # 175 d x & # 175 d = média das diferenças
  • Distribuição: Student & # 8217s- distribuição t t com n n & # 8211 1 grau de liberdade
  • Se o número de diferenças for pequeno (menos de 30), as diferenças devem seguir uma distribuição normal.
  • Duas amostras são retiradas do mesmo conjunto de objetos.
  • As amostras são dependentes.

Revisão de fórmula

Use as informações a seguir para responder aos próximos cinco exercícios. Um estudo foi conduzido para testar a eficácia de um patch de software na redução de falhas do sistema em um período de seis meses. Os resultados das instalações selecionadas aleatoriamente são mostrados em [link]. O valor & # 8220before & # 8221 corresponde a um valor & # 8220after & # 8221 e as diferenças são calculadas. As diferenças têm distribuição normal. Teste ao nível de significância de 1%.


Revisão do Capítulo

Um teste de hipótese para amostras combinadas ou emparelhadas (teste t) tem estas características:

  • Teste as diferenças subtraindo uma medição da outra medição
  • Variável aleatória: (< overline>_) = média das diferenças
  • Distribuição: distribuição t de Student com n - 1 grau de liberdade
  • Se o número de diferenças for pequeno (menos de 30), as diferenças devem seguir uma distribuição normal.
  • Duas amostras são retiradas do mesmo conjunto de objetos.
  • As amostras são dependentes.

Exemplo 1

Um estudo foi realizado para investigar a eficácia do hipnotismo na redução da dor. Os resultados para assuntos selecionados aleatoriamente são mostrados na tabela abaixo. Uma pontuação mais baixa indica menos dor. O valor & # 8220before & # 8221 corresponde a um valor & # 8220after & # 8221 e as diferenças são calculadas. As diferenças têm distribuição normal. As medidas sensoriais são, em média, menores após o hipnotismo? Teste a um nível de significância de 5%.

Sujeito: UMA B C D E F G H
Antes 6.6 6.5 9.0 10.3 11.3 8.1 6.3 11.6
Após 6.8 2.4 7.4 8.5 8.1 6.1 3.4 2.0

Solução

Os valores & # 8220antes & # 8221 e & # 8220após & # 8221 correspondentes formam pares correspondentes. (Calcule & # 8220após & # 8221 - & # 8220antes. & # 8221)

Depois de dados Antes dos Dados Diferença
6.8 6.6 0.2
2.4 6.5 -4.1
7.4 9 -1.6
8.5 10.3 -1.8
8.1 11.3 -3.2
6.1 8.1 -2
3.4 6.3 -2.9
2 11.6 -9.6

Os dados para o teste são as diferenças:

A média da amostra e o desvio padrão da amostra das diferenças são [latex] displaystyle overline <>_<> = - <3.13> < quad text quad>_<> = <2,91> [/ latex]. Verifique esses valores.

Deixar µd ser a média da população para as diferenças. Usamos o subscrito para denotar & # 8220diferenças. & # 8221

Variável aleatória: [latex] displaystyle overline <>_<> [/ latex] = a diferença média das medições sensoriais

    O que estamos testando?

Observação:

Usando uma calculadora:

  • Use sua lista de diferenças como os dados.
  • Pressione STAT e selecione TESTES.
  • Pressione 2: T-Test.
  • Selecione Dados e pressione ENTER.
  • Pressione a seta para baixo e insira 0 para, o nome da lista onde você colocou os dados e 1 para Freq :.
  • Seta para baixo para μ: e seta para cima para & lt.
  • Pressione Enter .
  • Use a seta para baixo para calcular e pressione ENTER.
  • O p-valor é 0,0094 e a estatística de teste é –3,04.

Tente

Um estudo foi conduzido para investigar a eficácia de uma nova dieta na redução do colesterol. Os resultados para os assuntos selecionados aleatoriamente são mostrados na tabela. As diferenças têm distribuição normal.

Sujeito UMA B C D E F G H eu
Antes 209 210 205 198 216 217 238 240 222
Após 199 207 189 209 217 202 211 223 201

Os níveis de colesterol dos indivíduos e # 8217 estão mais baixos em média após a dieta? Teste no nível de 5%.


10.4 Amostras combinadas ou emparelhadas

Ao usar um teste de hipótese para amostras combinadas ou emparelhadas, as seguintes características devem estar presentes:

  1. Amostragem aleatória simples é usada.
  2. Os tamanhos das amostras costumam ser pequenos.
  3. Duas medições (amostras) são tiradas do mesmo par de indivíduos ou objetos.
  4. As diferenças são calculadas a partir das amostras combinadas ou emparelhadas.
  5. As diferenças formam a amostra que é usada para o teste de hipótese.
  6. Ou os pares combinados têm diferenças que vêm de uma população normal ou o número de diferenças é suficientemente grande para que a distribuição da média das diferenças da amostra seja aproximadamente normal.

Em um teste de hipótese para amostras combinadas ou emparelhadas, os indivíduos são combinados em pares e as diferenças são calculadas. As diferenças são os dados. A média da população para as diferenças, µd, é então testado usando um teste t de Student para uma única média populacional com n - 1 grau de liberdade, onde n é o número de diferenças.

Exemplo 10.11

Um estudo foi realizado para investigar a eficácia do hipnotismo na redução da dor. Os resultados para indivíduos selecionados aleatoriamente são mostrados na Tabela 10.11. Uma pontuação mais baixa indica menos dor. O valor "antes" é correspondido a um valor "depois" e as diferenças são calculadas. As diferenças têm distribuição normal. As medidas sensoriais são, em média, menores após o hipnotismo? Teste a um nível de significância de 5%.

Solução 1

Os valores "antes" e "depois" correspondentes formam pares correspondentes. (Calcule "depois" - "antes.")

Depois de dados Antes dos Dados Diferença
6.8 6.6 0.2
2.4 6.5 -4.1
7.4 9 -1.6
8.5 10.3 -1.8
8.1 11.3 -3.2
6.1 8.1 -2
3.4 6.3 -2.9
2 11.6 -9.6

Os dados para o teste são as diferenças:

A média da amostra e o desvio padrão da amostra das diferenças são: x d ¯ = –3,13 x d = –3,13 es d = 2,91 s d = 2,91 Verifique esses valores.

A hipótese nula é zero ou positiva, o que significa que há a mesma ou mais dor sentida após o hipnotismo. Isso significa que o assunto não mostra nenhuma melhoria. µd é a média populacional das diferenças.)

A hipótese alternativa é negativa, o que significa que há menos dor sentida após o hipnotismo. Isso significa que o assunto mostra melhorias. A pontuação deve ser menor após o hipnotismo, então a diferença deve ser negativa para indicar melhora.

Distribuição para o teste: A distribuição é do Aluno t com df = n - 1 = 8 - 1 = 7. Use t7. (Observe que o teste é para uma única média populacional.)

Calcule o p-valor usando a distribuição t de Student: p-valor = 0,0095

A média da amostra e o desvio padrão da amostra das diferenças são:

Comparar α e a p-valor: α = 0,05 e p-valor = 0,0095. α & gt p-valor.

Tomar uma decisão: Desde a α & gt p-valor, rejeitar H0. Isso significa que µd & lt 0 e há melhora.

Conclusão: A um nível de significância de 5%, a partir dos dados amostrais, há evidências suficientes para concluir que as medidas sensoriais, em média, são menores após o hipnotismo. O hipnotismo parece ser eficaz na redução da dor.

Para as calculadoras TI-83 + e TI-84, você pode calcular as diferenças antecipadamente (depois antes) e colocar as diferenças em uma lista ou você pode colocar o após dados em uma primeira lista e o antes dados em uma segunda lista. Em seguida, vá para uma terceira lista e vá até o nome. Insira o primeiro nome da lista - o segundo nome da lista. A calculadora fará a subtração e você terá as diferenças na terceira lista.

Usando a calculadora TI-83, 83+, 84, 84+

Um estudo foi conduzido para investigar a eficácia de uma nova dieta na redução do colesterol. Os resultados para os assuntos selecionados aleatoriamente são mostrados na tabela. As diferenças têm distribuição normal. Os níveis de colesterol dos indivíduos são mais baixos em média após a dieta? Teste no nível de 5%.

Sujeito UMA B C D E F G H eu
Antes 209 210 205 198 216 217 238 240 222
Após 199 207 189 209 217 202 211 223 201

Exemplo 10.12

Um técnico de futebol universitário estava interessado em saber se a classe de desenvolvimento de força da faculdade aumentava a elevação máxima de seus jogadores (em libras) no exercício de supino. Ele pediu a quatro de seus jogadores que participassem de um estudo. A quantidade de peso que eles conseguiam levantar foi registrada antes de fazerem o curso de desenvolvimento de força. Depois de terminar a aula, a quantidade de peso que eles conseguiam levantar cada vez foi medida novamente. Os dados são os seguintes:

Peso em libras) Jogador 1 Jogador 2 Jogador 3 Jogador 4
Quantidade de peso levantado antes da aula 205 241 338 368
Quantidade de peso levantado após a aula 295 252 330 360

O treinador quer saber se a classe de desenvolvimento de força torna seus jogadores mais fortes, em média.
Registre o diferenças dados. Calcule as diferenças subtraindo a quantidade de peso levantado antes da aula do peso levantado depois de terminar a aula. Os dados para as diferenças são: <90, 11, -8, -8>. Suponha que as diferenças tenham uma distribuição normal.

Usando os dados das diferenças, calcule a média da amostra e o desvio padrão da amostra.

Os dados fornecidos aqui indicam que a distribuição está realmente inclinada para a direita. A diferença de 90 pode ser um outlier extremo? Está puxando a média da amostra para 21,3 (positivo). As médias dos outros três valores de dados são realmente negativas.

Usando os dados de diferença, isso se torna um teste de um único __________ (preencha o espaço em branco).

A distribuição para o teste de hipótese é t3.

Calcule o p-valor: O p-valor é 0,2150

Decisão: Se o nível de significância for 5%, a decisão é não rejeitar a hipótese nula, porque α & lt p-valor.

Qual é a conclusão?

A um nível de significância de 5%, a partir dos dados da amostra, não há evidências suficientes para concluir que a classe de desenvolvimento de força ajudou a tornar os jogadores mais fortes, em média.

Uma nova classe preparatória foi projetada para melhorar os resultados dos testes SAT. Cinco alunos foram selecionados aleatoriamente. Suas notas em dois exames práticos foram registrados, um antes da aula e outro depois. Os dados registrados na Tabela 10.15. As pontuações são, em média, maiores após a aula? Teste a um nível de 5%.

Pontuações SAT Aluno 1 Aluno 2 Aluno 3 Aluno 4
Pontuação antes da aula 1840 1960 1920 2150
Pontuação depois da aula 1920 2160 2200 2100

Exemplo 10.13

Sete alunos da oitava série da Kennedy Middle School mediram até que ponto conseguiam empurrar o arremesso de peso com a mão dominante (escrita) e a mão mais fraca (não escrita). Eles pensaram que poderiam empurrar distâncias iguais com qualquer uma das mãos. Os dados foram coletados e registrados na Tabela 10.16.

Distância (em pés) usando Aluno 1 Aluno 2 Aluno 3 Aluno 4 Aluno 5 Aluno 6 Aluno 7
Mão dominante 30 26 34 17 19 26 20
Mão mais fraca 28 14 27 18 17 26 16

Faça um teste de hipótese para determinar se a diferença média nas distâncias entre as mãos dominantes e as mãos mais fracas das crianças é significativa.

Registre o diferenças dados. Calcule as diferenças subtraindo as distâncias com a mão mais fraca das distâncias com a mão dominante. Os dados para as diferenças são: <2, 12, 7, -1, 2, 0, 4>. As diferenças têm distribuição normal.

Usando os dados das diferenças, calcule a média da amostra e o desvio padrão da amostra. x ¯ d x ¯ d = 3,71, s d s d = 4,5.

Distribuição para o teste de hipótese: t6

Calcule o p-valor: O p-valor é 0,0716 (usando os dados diretamente).

(estatística de teste = 2,18. p-valor = 0,0719 usando (x ¯ d = 3,71, s d = 4,5.) (x ¯ d = 3,71, s d = 4,5.)

Decisão: Presumir α = 0,05. Desde a α & lt p-valor, não rejeitar H0.

Conclusão: No nível de 5% de significância, a partir dos dados da amostra, não há evidências suficientes para concluir que há uma diferença nas mãos mais fracas e dominantes das crianças para empurrar o arremesso de peso.

Cinco jogadores de bola pensam que podem lançar a mesma distância com a mão dominante (lançamento) e mão inábil (mão que pega). Os dados foram coletados e registrados na Tabela 10.17. Faça um teste de hipótese para determinar se a diferença média nas distâncias entre a mão dominante e a mão inábil é significativa. Teste no nível de 5%.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5
Mão dominante 120 111 135 140 125
De improviso 105 109 98 111 99

Como um associado da Amazon, ganhamos com compras qualificadas.

Quer citar, compartilhar ou modificar este livro? Este livro é Creative Commons Attribution License 4.0 e você deve atribuir o OpenStax.

    Se você estiver redistribuindo todo ou parte deste livro em formato impresso, deverá incluir em cada página física a seguinte atribuição:

  • Use as informações abaixo para gerar uma citação. Recomendamos o uso de uma ferramenta de citação como esta.
    • Autores: Barbara Illowsky, Susan Dean
    • Editor / site: OpenStax
    • Título do livro: Estatísticas introdutórias
    • Data de publicação: 19 de setembro de 2013
    • Local: Houston, Texas
    • URL do livro: https://openstax.org/books/introductory-statistics/pages/1-introduction
    • URL da seção: https://openstax.org/books/introductory-statistics/pages/10-4-matched-or-pair-samples

    © 19 de maio de 2021 OpenStax.O conteúdo do livro didático produzido pela OpenStax é licenciado sob uma licença Creative Commons Attribution License 4.0. O nome OpenStax, logotipo OpenStax, capas de livro OpenStax, nome OpenStax CNX e logotipo OpenStax CNX não estão sujeitos à licença Creative Commons e não podem ser reproduzidos sem o consentimento prévio e expresso por escrito da Rice University.


    Um instrutor deseja comparar as pontuações dos alunos no exame intermediário e final. Na maioria das vezes, isso é feito obtendo-se uma amostra dos alunos e registrando a pontuação do exame intermediário e a pontuação final de cada aluno. Em outras palavras, haveria duas medidas para cada aluno. Este é um exemplo de pares combinados design porque os dados seriam emparelhados por aluno.

    Uma empresa de calçados está estudando quantos sapatos homens e mulheres italianos possuem. Em um estudo de pesquisa, eles pegam uma amostra aleatória de 500 italianos adultos e perguntam a cada indivíduo se eles se identificam como homem ou mulher e quantos pares de sapatos eles possuem. Os homens e mulheres neste estudo estão em dois independente grupos.


    9.3: Amostras combinadas ou emparelhadas - matemática

    Os testes de duas amostras comparam uma amostra com a outra. Sua implementação em R é semelhante a um teste de uma amostra, mas há diferenças a serem observadas.

    11.1 Testes de proporção de duas amostras

    Como antes, usamos o comando prop.test para lidar com esses problemas. Só precisamos aprender quando e como usá-lo.

    O teste de hipótese padrão é H 0: p 1 = p 2 contra a alternativa (bilateral) H 1: p 1 p 2. A função prop.test costuma ser chamada de prop.test (x, n) onde x é o número favorável en é o total. Aqui não é diferente, mas como existem dois x, parece um pouco diferente. Aqui está como deixamos R fazer o trabalho para encontrar on, mas caso contrário, isso é simples. A conclusão é semelhante às anteriores, e observamos que o valor p é 0,9172, portanto, aceitamos a hipótese nula de que p 1 = p 2.

    11.2 Testes t de duas amostras

    e foi usado quando os dados eram aproximadamente normais e s era desconhecido.

    O teste t de duas amostras é baseado na estatística

    e as premissas de que os X i são normalmente ou aproximadamente normalmente distribuídos.

    Observamos que o denominador é muito diferente do teste de uma amostra e isso nos dá algumas coisas para discutir. Basicamente, isso simplifica se pudermos assumir que as duas amostras têm o mesmo (desconhecido) desvio padrão.

    11.3 Variâncias iguais

    Quando se presume que as duas amostras têm variâncias iguais, os dados podem ser combinados para encontrar uma estimativa para a variância. Por padrão, R assume variâncias desiguais. Se as variâncias forem consideradas iguais, você precisará especificar var.equal = TRUE ao usar t.test.

    Exemplo: tempo de recuperação para novo medicamento
    Suponha que o tempo de recuperação para pacientes que tomam um novo medicamento seja medido (em dias). Um grupo de placebo também é usado para evitar o efeito placebo. Os dados são os seguintes: Após um boxplot lado a lado (boxplot (x, y), mas não mostrado), é determinado que as suposições de variâncias iguais e normalidade são válidas. Um teste unilateral para equivalência de médias usando o teste t é encontrado. Isso testa a hipótese nula de variâncias iguais em relação à alternativa unilateral de que o grupo de drogas tem uma média menor. ( 1 - 2 & lt 0). Aqui estão os resultados Aceitamos a hipótese nula com base neste teste.

    11.4 Variâncias desiguais

    Se as variâncias são desiguais, o denominador na estatística t é mais difícil de calcular matematicamente. Mas não com R. A única diferença é que você não precisa especificar var.equal = TRUE (então é realmente mais fácil com R).

    Se continuarmos o mesmo exemplo, obteremos o seguinte Observe que os resultados são ligeiramente diferentes, mas neste exemplo as conclusões são as mesmas - aceite a hipótese nula. Quando assumimos variâncias iguais, a distribuição amostral da estatística de teste tem uma distribuição t com menos graus de liberdade. Portanto, há menos área nas caudas e, portanto, os valores de p são menores (embora apenas neste exemplo).

    11.5 Amostras combinadas

    Os testes t combinados ou emparelhados usam um modelo estatístico diferente. Em vez de assumir que as duas amostras são amostras normais independentes, embora talvez com médias e desvios-padrão diferentes, o teste de amostras combinadas assume que as duas amostras compartilham características comuns.

    O modelo básico é que Y i = X i + e i onde e i é a aleatoriedade. Queremos testar se os e i são médios 0 contra a alternativa de que eles não são médios 0. Para fazer isso, subtrai-se os X dos Ys e, em seguida, realiza um teste t regular de uma amostra.

    Na verdade, R faz todo esse trabalho. Você só precisa especificar par = TRUE ao chamar a função t.test.

    Exemplo: Dilema de dois alunos
    A fim de promover a justiça na avaliação, cada inscrição foi avaliada duas vezes por avaliadores diferentes. Com base nas notas, podemos ver se há diferença entre os dois alunos? Os dados são claramente diferenças. Eles são descritos por flutuações aleatórias (média e i é 0), ou há um viés de um aluno em relação ao outro? (média e 0). Um teste de amostra correspondente nos dará algumas dicas. Primeiro, devemos verificar a suposição de normalidade com gráficos normais, digamos. (Os dados são discretos devido ao arredondamento necessário, mas a forma geral é considerada normal.) Então, podemos aplicar o teste t da seguinte maneira, o que nos levaria a rejeitar a hipótese nula.

    Observe, os dados não são independentes uns dos outros, pois o aluno 1 e 2 classificam os mesmos papéis. Esperamos que, se o avaliador 1 achar um papel bom, o avaliador 2 também o fará e vice-versa. Isso é exatamente o que significa não independente. Um teste t sem os rendimentos emparelhados = TRUE, o que levaria a uma conclusão diferente.

    11.6 Testes de duas amostras resistentes

    Novamente, o teste de duas amostras resistentes pode ser feito com a função wilcox.test. Seu uso é semelhante ao seu uso com um único teste de amostra.

    Exemplo: tempos de saída de táxi
    Vamos comparar os tempos de saída dos táxis no aeroporto de Newark para a American e a Northwest Airlines. Esses dados estão no dataset ewr, mas precisamos trabalhar um pouco para obtê-los. Esta é uma maneira de usar o subconjunto de comandos: Um boxplot mostra que as distribuições estão distorcidas. Portanto, um teste para as medianas é usado. Obtém-se de wilcox. A mais forte evidência para rejeitar a hipótese nula e aceitar a alternativa de que as medianas não são iguais.

    11.7 Problemas

    Departamento de Matemática
    College of Staten Island
    Universidade da Cidade de Nova York
    1S-215, 2800 Victory Boulevard, Staten Island, NY 10314
    (718) 982-3600
    Este site foi criado usando Twitter Bootstrap, Blosxom e Glyphicons Free.


    Exemplo

    Declaração do Problema

    O conjunto de dados de amostra tem pontuações de teste de nivelamento (de 100 pontos) para quatro áreas temáticas: Inglês, Leitura, Matemática e Redação. Cada aluno fez os quatro testes de nivelamento. Suponha que estejamos particularmente interessados ​​nas seções de Inglês e Matemática e queiramos determinar se Inglês ou Matemática tiveram notas mais altas nos testes, em média. Poderíamos usar um par t teste para testar se houve diferença significativa na média dos dois testes.

    Antes do Teste

    Declare as hipóteses nulas e alternativas

    As hipóteses para este exemplo podem ser expressas como:

    H0: & microinglês - e microMatemática = 0 (& quotthe diferença entre as pontuações médias em inglês e matemática é igual a 0 & quot)
    H1: & microinglês - e microMatemática & ne 0 (& quotthe diferença entre as pontuações médias em inglês e matemática não é 0 & quot)

    Antes de realizarmos nossos testes de hipótese, devemos decidir sobre um nível de significância (denotado &alfa) O nível de significância é o limite que usaremos para decidir se um resultado de teste é significativo. Para este exemplo, vamos usar &alfa = 0,05 ou 5%.

    Configuração de dados

    No conjunto de dados de amostra, as respostas de cada aluno são registradas em uma linha. Suas pontuações em Inglês e Matemática são representadas nas variáveis ​​Inglês e Matemática. Este formato já é apropriado para o teste t de amostras emparelhadas, portanto, nenhuma reestruturação adicional é necessária.

    Executando o Teste

    Programa SAS

    Resultado

    Mesas

    Depois de executar o programa SAS acima, o SAS produz o seguinte conjunto de tabelas:

    O título & quotDiferença: Inglês - Matemática & quot nos diz a ordem da subtração usada para esses números. Isso é importante, pois determina como interpretamos os números positivos e negativos. Como a matemática é subtraída do inglês, números positivos correspondem a pontuações mais altas em inglês e números negativos correspondem a pontuações mais altas em matemática.

    Na primeira tabela, temos estatísticas descritivas para as diferenças de pontuação:

    • N: O tamanho efetivo da amostra (alunos que obtiveram pontuação em Inglês e Matemática).
    • Média e St Dev: A diferença média entre as pontuações de inglês e matemática de um aluno. Em média, os alunos tiveram uma diferença de 17,3 pontos entre suas pontuações em inglês e matemática (+/- um desvio padrão de 9,5).
    • Erro padrão: O erro padrão das pontuações de diferença, s / sqrt (n).
    • Mínimo: A menor pontuação de diferença observada na amostra. Aqui, a pontuação -10,64 representa um aluno que obteve 10,64 pontos a mais em seu teste de matemática do que em seu teste de inglês.
    • Máximo: A maior pontuação de diferença observada na amostra. Aqui, a pontuação 41,69 representa um aluno que obteve 41,69 pontos a mais no teste de inglês do que no teste de matemática.

    Na segunda tabela, temos os intervalos de confiança de 95% para a diferença média e o desvio padrão das diferenças.

    Na terceira tabela, temos os resultados reais do teste t pareado. O valor p é muito pequeno (p & lt 0,0001), então rejeitamos a hipótese nula de que as pontuações médias em inglês e matemática eram iguais e concluímos que as pontuações em inglês tinham uma média significativamente diferente das pontuações em matemática.

    Gráficos

    Gráfico 1: Distribuição das pontuações de diferença

    O primeiro gráfico mostra a distribuição das pontuações de diferença, usando um histograma (painel superior) e um boxplot (painel inferior).

    Se este histograma estivesse centrado em 0, não corresponderia a nenhuma diferença entre as duas pontuações do teste, no entanto, a região destacada no boxplot mostra que o centro da distribuição está entre 17 e 18.

    • No histograma:
      • A linha azul mostra a forma de uma distribuição normal com a média e o desvio padrão desta amostra.
      • A linha vermelha mostra o estimativa de densidade do kernel - um tipo de aproximação para a forma de uma distribuição. Se as pontuações estivessem perfeitamente distribuídas normalmente, a estimativa da densidade do kernel seria & quotline up & quot com a aproximação normal.
      • A linha central da caixa mostra a mediana, enquanto o diamante mostra a média.
      • Existem dois valores discrepantes na extremidade inferior; eles representam indivíduos com pontuação 7 a 10 pontos mais alta no teste de matemática do que no teste de inglês.
      Gráfico 2: Gráfico de Perfil

      O segundo gráfico é um par plotagem de perfil. Os gráficos de perfil representam a "trajetória" dos indivíduos. Cada linha representa um assunto ou caso. No lado esquerdo está a pontuação da pessoa em inglês, e no lado direito está a pontuação em matemática. (Observe que os eixos em ambos os lados têm o mesmo intervalo, esta é uma característica importante dos gráficos de perfil.) Olhando para a inclinação dessas linhas, podemos ter uma ideia se as pontuações são aproximadamente iguais (linhas horizontais), ou se uma pontuação foi maior que a outra (linhas inclinadas).

      Embora algumas das linhas sejam aproximadamente horizontais, a maioria das linhas tende a ter uma inclinação para baixo. Como o inglês fica à esquerda e a matemática à direita, isso corresponde à maioria dos alunos com pontuação mais alta no teste de inglês do que no teste de matemática. A linha vermelha que mostra a tendência média confirma isso.

      Gráfico 3: Gráfico de Acordo

      O terceiro gráfico mostra a & quotacordo & quot das duas pontuações. O gráfico em si é uma variação de um gráfico de dispersão simples. A linha de referência diagonal representa pontuações idênticas em inglês e matemática. Os pontos de dados que se enquadram nesta linha (ou perto desta linha) representam os alunos que tiveram a mesma pontuação em seus testes de inglês e matemática. Os pontos de dados acima da linha representam os alunos com pontuação mais alta no teste de matemática do que no teste de inglês. Os pontos abaixo da linha representam os alunos com notas mais altas em inglês do que em matemática. Neste gráfico, vemos muito mais pontos abaixo da linha do que acima dela, o que significa que a maioria dos alunos pontuou mais em inglês do que em matemática.

      Gráfico 4: Gráfico Quantil-Quantil (Q-Q) de Normalidade para Diferenças

      O quarto gráfico é um gráfico Q-Q, ou gráfico quantil-quantil, das pontuações de diferença. Os gráficos Q-Q são usados ​​para inspecionar se uma variável observada (representada como pontos) corresponde ao que esperaríamos que a variável fosse se fosse realmente distribuída normalmente (representada como uma linha sólida). Para ler um gráfico Q-Q, verificamos se os pontos (os valores observados) correspondem aos valores esperados para uma distribuição normal (a linha diagonal). Se os pontos caírem ao longo da linha, os valores são consistentes com o que esperaríamos que fossem se os dados fossem realmente distribuídos normalmente. Aqui, vemos que a maioria das pontuações de diferença cai na linha diagonal, portanto, podemos dizer que os dados parecem estar aproximadamente normalmente distribuídos.

      Decisão e Conclusões

      Desde a p & lt .0001 é menor do que nosso nível de significância escolhido &alfa = 0,05, podemos rejeitar a hipótese nula e concluir que as pontuações em inglês e matemática foram significativamente diferentes entre si.


      Assista o vídeo: #09 - Amostras Independentes X Dependentes emparelhadas - Teste de Hipóteses para 2 populações (Dezembro 2021).