Artigos

12.2: Teste de Independência - Matemática


Os testes de independência envolvem o uso de um tabela de contingência de valores observados (dados).

A estatística de teste para um teste de independência é semelhante ao de um teste de adequação:

[ sum _ {(i cdot j)} frac {(O-E) ^ {2}} {E} ]

Onde:

  • (O = ) valores observados
  • (E = ) valores esperados
  • (i = ) o número de linhas na tabela
  • (j = ) o número de colunas na tabela

Existem (i cdot j ) termos da forma ( frac {(O-E) ^ {2}} {E} ).

Um teste de independência determina se dois fatores são independentes ou não. Você encontrou pela primeira vez o termo independência em Tópicos de probabilidade. Como uma revisão, considere o seguinte exemplo.

O valor esperado para cada célula precisa ser de pelo menos cinco para que você use este teste.

Exemplo 11.4.1

Suponha que (A = ) uma violação de velocidade no ano passado e (B = ) um usuário de telefone celular enquanto dirige. Se (A ) e (B ) forem independentes, então (P (A text {AND} B) = P (A) P (B) ). (A text {AND} B ) é o evento em que um motorista foi violado por excesso de velocidade no ano passado e também usou um telefone celular enquanto dirigia. Suponha, em um estudo com motoristas que sofreram violação por excesso de velocidade no ano passado e que usaram o telefone celular enquanto dirigiam, que 755 pessoas foram entrevistadas. Dos 755, 70 tiveram uma violação de velocidade e 685 não; 305 usaram telefones celulares enquanto dirigiam e 450 não.

Deixe (y = ) o número esperado de motoristas que usaram um telefone celular enquanto dirigiam e receberam violações de velocidade.

Se (A ) e (B ) forem independentes, então (P (A text {AND} B) = P (A) P (B) ). Por substituição,

[ frac {y} {755} = left ( frac {70} {755} right) left ( frac {305} {755} right) ]

Resolva para (y: y = frac {(70) (305)} {755} = 28,3 )

Espera-se que cerca de 28 pessoas da amostra usem telefones celulares enquanto dirigem e recebam violações de velocidade.

Em um teste de independência, declaramos as hipóteses nula e alternativa em palavras. Uma vez que a tabela de contingência consiste em dois fatores, a hipótese nula afirma que os fatores são independente e a hipótese alternativa afirma que eles são não independente (dependente). Se fizermos um teste de independência usando o exemplo, a hipótese nula será:

(H_ {0} ): Ser um usuário de telefone celular enquanto dirige e receber uma violação de velocidade são eventos independentes.

Se a hipótese nula fosse verdadeira, esperaríamos que cerca de 28 pessoas usassem telefones celulares ao dirigir e recebessem uma infração por excesso de velocidade.

O teste de independência é sempre direto por causa do cálculo da estatística de teste. Se os valores esperados e observados não estiverem próximos, a estatística de teste é muito grande e fica na cauda direita da curva qui-quadrado, pois está em um ajuste perfeito.

O número de graus de liberdade para o teste de independência é:

(df = ( text {número de colunas} - 1) ( text {número de linhas} - 1) )

A seguinte fórmula calcula o número esperado ( (E )):

(E = frac { text {(total da linha) (total da coluna)}} { text {número total pesquisado}} )

Exercício 11.4.1

É feita uma amostra de 300 alunos. Dos alunos pesquisados, 50 eram estudantes de música, enquanto 250 não eram. Noventa e sete estavam no quadro de honra, enquanto 203 não estavam. Se assumirmos que ser um estudante de música e estar na lista de honra são eventos independentes, qual é o número esperado de estudantes de música que também estão na lista de honra?

Responder

Espera-se que cerca de 16 alunos sejam estudantes de música e estejam na lista de honra.

Exemplo 11.4.2

Em um grupo de voluntários, adultos de 21 anos ou mais trabalham de uma a nove horas por semana para passar o tempo com um idoso deficiente. O programa recruta estudantes de faculdades comunitárias, estudantes universitários de quatro anos e não estudantes. Na mesa está um amostra dos voluntários adultos e o número de horas que eles oferecem por semana.

Número de horas trabalhadas por semana por tipo de voluntário (observadas) A tabela contém observado (O) valores (dados).
Tipo de voluntário1-3 horas4-6 horas7–9 horasTotal da linha
Alunos de faculdades comunitárias1119648255
Estudantes universitários de quatro anos9613361290
Não estudantes9115053294
Total da coluna298379162839

É o número de horas voluntárias independente do tipo de voluntário?

Responder

O mesa observada e a pergunta no final do problema, "O número de horas oferecidas é independente do tipo de voluntário?" digo que este é um teste de independência. Os dois fatores são número de horas voluntárias e tipo de voluntário. Este teste é sempre direto.

(H_ {0} ): O número de horas voluntárias é independente do tipo de voluntário.

(H_ {a} ): O número de horas voluntárias é dependente sobre o tipo de voluntário.

Os resultados esperados estão na Tabela.

Número de horas trabalhadas por semana por tipo de voluntário (esperado) A tabela contém esperado( (E )) valores (dados).
Tipo de voluntário1-3 horas4-6 horas7-9 horas
Alunos de faculdades comunitárias90.57115.1949.24
Estudantes universitários de quatro anos103.00131.0056.00
Não estudantes104.42132.8156.77

Por exemplo, o cálculo da frequência esperada para a célula superior esquerda é

[E = frac {( text {total da linha}) ( text {total da coluna})} { text {número total pesquisado}} = frac {(255) (298)} {839} = 90,57 ]

Calcule a estatística de teste: ( chi ^ {2} = 12,99 ) (calculadora ou computador)

Distribuição para o teste: ( chi ^ {2} _ {4} )

(df = (3 texto {colunas} - 1) (3 texto {linhas} - 1) = (2) (2) = 4 )

Gráfico:

Figura 11.4.1.

Declaração de probabilidade: (p text {-valor} = P ( chi ^ {2}> 12,99) = 0,0113 )

Comparar (alfa) e a (p text {-valor} ): Como nenhum ( alpha ) é fornecido, assuma ( alpha = 0,05 ). (p text {-valor} = 0,0113 ). ( alpha> p text {-valor} ).

Tomar uma decisão: Desde ( alpha> p text {-value} ), rejeite (H_ {0} ). Isso significa que os fatores não são independentes.

Conclusão: A um nível de significância de 5%, a partir dos dados, há evidências suficientes para concluir que o número de horas voluntárias e o tipo de voluntário são dependentes um do outro.

Para o exemplo da Tabela, se houvesse outro tipo de voluntário, os adolescentes, quais seriam os graus de liberdade?

aperte oMATRXchave e seta paraEDITAR. Aperte1: [A]. Aperte3 ENTER 3 ENTER. Insira os valores da tabela por linha da Tabela. AperteDIGITARapós cada. Aperte2ª SAIDA. AperteESTADOe seta paraTESTES. Seta para baixo paraC: ( chi ^ {2} ) - TESTE. AperteDIGITAR. Você deveria verObservado: [A] e esperado: [B]. Seta para baixo paraCalcular. A estatística de teste é 12,9999 e o (p text {-value} = 0,0113 ). Faça o procedimento uma segunda vez, mas use a seta para baixo paraEmpateao invés decalcular.

Exercício 11.4.2

O Bureau of Labor Statistics reúne dados sobre o emprego nos Estados Unidos. Uma amostra é retirada para calcular o número de cidadãos americanos que trabalham em um dos vários setores da indústria ao longo do tempo. A tabela mostra os resultados:

Setor industrial200020102020Total
Salário e salário não agrícola13,24313,04415,01841,305
Produção de bens, excluindo agricultura2,4571,7711,9506,178
Prestador de serviços10,78611,27313,06835,127
Agricultura, silvicultura, pesca e caça240214201655
Trabalhador familiar não agrícola e autônomo não remunerado9318949722,797
Salários e empregos salariais secundários na agricultura e nas indústrias domésticas privadas14111136
Trabalhos secundários como autônomo ou trabalhador familiar não remunerado196144152492
Total27,86727,35131,37286,590

Queremos saber se a variação do número de empregos independe da variação dos anos. Declare as hipóteses nula e alternativa e os graus de liberdade.

Responder

  • (H_ {0} ): O número de empregos é independente do ano.
  • (H_ {a} ): O número de empregos depende do ano.

(df = 12 )

Figura 11.4.2.

aperte oMATRXchave e seta paraEDITAR. Insira os valores da tabela por linha. A estatística de teste é 227,73 e o (p text {-valor} = 5,90E - 42 = 0 ). Faça o procedimento uma segunda vez, mas use a seta para baixo paraEmpateao invés decalcular.

Exemplo 11.4.3

O De Anza College está interessado na relação entre o nível de ansiedade e a necessidade de sucesso na escola. Uma amostra aleatória de 400 alunos fez um teste que mediu o nível de ansiedade e a necessidade de sucesso na escola. A tabela mostra os resultados. O De Anza College quer saber se o nível de ansiedade e a necessidade de ter sucesso na escola são eventos independentes.

Necessidade de ter sucesso na escola vs. nível de ansiedade
Necessidade de ter sucesso na escolaAlto
Ansiedade
Médio-alto
Ansiedade
Médio
Ansiedade
Med-baixo
Ansiedade
Baixo
Ansiedade
Total da linha
Alta necessidade3542531510155
Necessidade média1848633331193
Baixa necessidade4511151752
Total da coluna57951276358400
  1. Quantos alunos com alto nível de ansiedade têm grande necessidade de ter sucesso na escola?
  2. Se as duas variáveis ​​são independentes, quantos alunos você espera que tenham uma baixa necessidade de sucesso na escola e um nível mediano de ansiedade?
  3. (E = frac {( text {linha total}) ( text {coluna total})} { text {total pesquisado}} = ) ________
  4. O número esperado de alunos com baixo nível de ansiedade e baixa necessidade de sucesso na escola é de cerca de ________.

Solução

uma. O total da coluna para um alto nível de ansiedade é 57. O total da linha para alta necessidade de sucesso na escola é 155. O tamanho da amostra ou total pesquisado é 400.

[E = frac {( text {total da linha}) ( text {total da coluna})} { text {total pesquisado}} = frac {155 cdot 57} {400} = 22,09 ]

O número esperado de alunos com alto nível de ansiedade e grande necessidade de sucesso escolar é de cerca de 22.

b. O total da coluna para um nível de ansiedade médio-baixo é 63. O total da linha para uma baixa necessidade de sucesso na escola é 52. O tamanho da amostra ou total pesquisado é 400.

c. (E = frac {( text {linha total}) ( text {coluna total})} { text {total pesquisado}} = 8,19 )

d. 8

Exercício 11.4.3

Consulte as informações na Nota. Quantos empregos prestadores de serviços são esperados em 2020? Quantos empregos assalariados não agrícolas são esperados em 2020?

Responder

12,727, 14,965

Revisão do Capítulo

Para avaliar se dois fatores são independentes ou não, você pode aplicar o teste de independência que usa a distribuição qui-quadrado. A hipótese nula para este teste afirma que os dois fatores são independentes. O teste compara os valores observados com os valores esperados. O teste tem cauda direita. Cada observação ou categoria de célula deve ter um valor esperado de pelo menos 5.

Revisão de fórmula

Teste de Independência

  • O número de graus de liberdade é igual a (( text {número de colunas - 1}) ( text {número de linhas - 1}) ).
  • A estatística de teste é ( sum _ {(i cdot j)} frac {(OE) ^ {2}} {E} ) onde (O = ) valores observados, (E = ) valores esperados , (i = ) o número de linhas na tabela e (j = ) o número de colunas na tabela.
  • Se a hipótese nula for verdadeira, o número esperado (E = frac {( text {total da linha}) ( text {total da coluna})} { text {total pesquisado}} ).

Determine o teste apropriado a ser usado nos próximos três exercícios.

Exercício 11.4.4

Uma empresa farmacêutica está interessada na relação entre a idade e a apresentação dos sintomas de uma infecção viral comum. Uma amostra aleatória é retirada de 500 pessoas com a infecção em diferentes faixas etárias.

Responder

um teste de independência

Exercício 11.4.5

O proprietário de um time de beisebol está interessado na relação entre os salários dos jogadores e a porcentagem de vitórias do time. Ele pega uma amostra aleatória de 100 jogadores de diferentes organizações.

Exercício 11.4.6

Um maratonista está interessado na relação entre a marca de sapatos que os corredores usam e seus tempos de corrida. Ela pega uma amostra aleatória de 50 corredores e registra seus tempos de corrida, bem como a marca de calçados que estavam usando.

Responder

um teste de independência

Use as seguintes informações para responder aos próximos sete exercícios: A Transit Railroads está interessada na relação entre a distância da viagem e a classe do bilhete adquirido. Uma amostra aleatória de 200 passageiros é feita. A tabela mostra os resultados. A ferrovia quer saber se a escolha de um passageiro na classe do bilhete é independente da distância que ele deve viajar.

Distância de viagemTerceira classeSegunda classePrimeira classeTotal
1-100 milhas2114641
101–200 milhas1816842
201-300 milhas16171548
301-400 milhas12142147
401-500 milhas661022
Total736760200

Exercício 11.4.7

Declare as hipóteses.

(H_ {0} ): _______

(H_ {a} ): _______

Exercício 11.4.8

(df = ) _______

Responder

8

Exercício 11.4.9

Quantos passageiros devem viajar entre 201 e 300 milhas e comprar passagens de segunda classe?

Exercício 11.4.10

Quantos passageiros devem viajar entre 401 e 500 milhas e comprar passagens de primeira classe?

Responder

6.6

Exercício 11.4.11

Qual é a estatística de teste?

Exercício 11.4.12

Qual é o (p text {-value} )?

Responder

0.0435

Exercício 11.4.13

O que você pode concluir no nível de significância de 5%?

Use as seguintes informações para responder aos próximos oito exercícios: Um artigo no New England Journal of Medicine, discutiu um estudo sobre fumantes na Califórnia e no Havaí. Em uma parte do relatório, a etnia autorreferida e os níveis de tabagismo por dia foram fornecidos. Das pessoas que fumam no máximo dez cigarros por dia, havia 9.886 afro-americanos, 2.745 nativos havaianos, 12.831 latinos, 8.378 nipo-americanos e 7.650 brancos. Das pessoas que fumam 11 a 20 cigarros por dia, havia 6.514 afro-americanos, 3.062 nativos havaianos, 4.932 latinos, 10.680 nipo-americanos e 9.877 brancos. Das pessoas que fumam de 21 a 30 cigarros por dia, havia 1.671 afro-americanos, 1.419 nativos havaianos, 1.406 latinos, 4.715 nipo-americanos e 6.062 brancos. Das pessoas que fumam pelo menos 31 cigarros por dia, havia 759 afro-americanos, 788 nativos havaianos, 800 latinos, 2.305 nipo-americanos e 3.970 brancos.

Exercício 11.4.14

Preencha a tabela.

Níveis de tabagismo por etnia (observado)
Nível de fumo por diaafro-americanoHavaiana nativaLatinaNipo-americanosBrancoTOTALS
1-10
11-20
21-30
31+
TOTALS

Responder

Nível de fumo por diaafro-americanoHavaiana nativaLatinaNipo-americanosBrancoTotais
1-109,8862,74512,8318,3787,65041,490
11-206,5143,0624,93210,6809,87735,065
21-301,6711,4191,4064,7156,06215,273
31+7597888002,3053,9708,622
Totais18,8308,01419,96926,07827,55910,0450

Exercício 11.4.15

Declare as hipóteses.

(H_ {0} ): _______

(H_ {a} ): _______

Exercício 11.4.16

Insira os valores esperados na Tabela. Arredonde para duas casas decimais.

Calcule os seguintes valores:

Responder

Nível de fumo por diaafro-americanoHavaiana nativaLatinaNipo-americanosBranco
1-107777.573310.118248.0210771.2911383.01
11-206573.162797.526970.769103.299620.27
21-302863.021218.493036.203965.054190.23
31+1616.25687.871714.012238.372365.49

Exercício 11.4.17

(df = ) _______

Exercício 11.4.18

( chi ^ {2} text {estatística de teste} = ) ______

Responder

10,301.8

Exercício 11.4.19

(p text {-value} = ) ______

Exercício 11.4.20

Este é um teste de cauda direita, cauda esquerda ou bicaudal? Explique por quê.

Responder

direito

Exercício 11.4.21

Faça um gráfico da situação. Identifique e dimensione o eixo horizontal. Marque a média e teste a estatística. Sombreie na região correspondente a (p text {-valor} ).

Figura 11.4.3.

Declare a decisão e a conclusão (em uma frase completa) para os seguintes níveis pré-concebidos de ( alpha ).

Exercício 11.4.22

( alpha = 0,05 )

  1. Decisão: ___________________
  2. Motivo da decisão: ___________________
  3. Conclusão (escreva uma frase completa): ___________________

Responder

  1. Rejeite a hipótese nula.
  2. (p text {-valor} < alpha )
  3. Existem evidências suficientes para concluir que o nível de tabagismo depende do grupo étnico.

Exercício 11.4.23

( alpha = 0,05 )

  1. Decisão: ___________________
  2. Motivo da decisão: ___________________
  3. Conclusão (escreva uma frase completa): ___________________

Glossário

Tabela de Contingência
uma tabela que exibe valores de amostra para dois fatores diferentes que podem ser dependentes ou contingentes um do outro; facilita a determinação de probabilidades condicionais.

Visualização do conteúdo

Ao testar a significância estatística da relação entre duas variáveis ​​quantitativas, usaremos o procedimento de teste de hipótese de cinco etapas:

Para usar (r ) de Pearson, ambas as variáveis ​​devem ser quantitativas e a relação entre (x ) e (y ) deve ser linear

Questão de pesquisa A correlação na população é diferente de 0? A correlação na população é positiva? A correlação na população é negativa?
Hipótese nula, (H_ <0> ) ( rho = 0 ) ( rho = 0 ) ( rho = 0 )
Hipótese alternativa, (H_ ) ( rho neq 0 ) ( rho & gt 0 ) ( rho & lt 0 )
Tipo de teste de hipótese Bicaudal, não direcional De cauda direita, direcional De cauda esquerda, direcional

Use o Minitab Express para calcular (r )

O Minitab Express fornecerá o valor p para um teste bicaudal (ou seja, (H_a: rho neq 0 )). Se você estiver conduzindo um teste unicaudal, precisará dividir o valor p na saída por 2.

Se (p leq alpha ) rejeitar a hipótese nula, há evidências de um relacionamento na população.

Se (p & gt alpha ) falhar em rejeitar a hipótese nula, não há evidência de um relacionamento na população.

Com base em sua decisão na Etapa 4, escreva uma conclusão em termos da pergunta de pesquisa original.


Determinando contagens esperadas

Vamos supor que o gênero de um aluno e se ele gosta de matemática sejam independentes. Que frequências esperaríamos nesse caso? Vamos considerar novamente os dados da pesquisa do Exemplo 2 na Seção 4.4:

Nesse exemplo, uma pesquisa foi aplicada a 82 alunos em um curso de Álgebra Básica no ECC, com as seguintes respostas para a afirmação & quotEu gosto de matemática & quot.

Em seguida, criamos um distribuição marginal de frequência relativa, que foi calculado tomando os totais de linha / coluna e dividindo pelo tamanho da amostra de 82.

SA UMA N D SD Total
Homens 9 13 5 2 1 30/82
& asymp 0,37
Mulheres 12 18 11 6 5 52/82
& asymp 0,63
Total 21/82
& asymp 0,26
31/82
& asymp 0,39
16/82
& asymp 0,20
8/82
& asymp 0.10
6/82
= 0.07
1

Vamos nos concentrar na primeira célula - & quotMeninas & quot e & quotConcordo totalmente & quot. Na tabela, podemos ver que 30/82 ou cerca de 37% dos alunos eram homens, e 21/82 ou cerca de 26% dos alunos concordaram fortemente com a afirmação & quotEu gosto de matemática & quot. Se eles realmente forem independentes, podemos use a regra de multiplicação para eventos independentes, onde P (E e F) = P (E) & bullP (F).

Portanto, se eles forem independentes, a probabilidade de que um aluno seja do sexo masculino e concorde totalmente seria:

Podemos então usar essa probabilidade para determinar quantos nós Espero nessa célula, se as duas variáveis ​​forem realmente independentes. Nós apenas multiplicamos o número total de indivíduos pela probabilidade de ser do sexo masculino e concordar totalmente:

Em geral, podemos encontrar os valores esperados usando esta fórmula:

Use a tabela fornecida e encontre a frequência esperada para cada resultado.

Agora que temos as frequências esperadas para cada resultado, precisamos de um novo teste de hipótese para ver se essas contagens esperadas estão longe o suficiente do que realmente observamos para dizer que as variáveis não são independente.


Minitab Express & ndash Computing Pearson & # 039s r

Anteriormente, criamos um gráfico de dispersão das médias do questionário e das notas do exame final e observamos uma relação linear. Aqui, calcularemos a correlação entre essas duas variáveis.

  1. Abra o conjunto de dados:
    • EXAM.MTW
  2. Com um PC: Selecione ESTATÍSTICAS & Correlação gt & Correlação gt
    Com um MAC: Selecione Estatísticas e regressão gt e correlação gt
  3. Clique duas vezes no Quiz_A Average e Final na caixa à esquerda para inseri-los no Variáveis caixa
  4. Clique OK

Isso deve resultar na seguinte saída:

Correlação
Correlação de Pearson da Média do Quiz e Final = 0,608630
P-Value = & lt0.0001

Selecione seu sistema operacional abaixo para ver um guia passo a passo para este exemplo.


12.3 A correção de continuidade

Ok, hora de uma pequena digressão. Eu tenho mentido para você um pouco até agora. Há uma pequena alteração que você precisa fazer em seus cálculos sempre que tiver apenas 1 grau de liberdade. É chamado de "correção de continuidade", ou às vezes o Correção de Yates. Lembre-se do que indiquei anteriormente: o teste ( chi ^ 2 ) é baseado em uma aproximação, especificamente na suposição de que a distribuição binomial começa a parecer uma distribuição normal para (N ) grande. Um problema com isso é que muitas vezes não funciona, especialmente quando você tem apenas 1 grau de liberdade (por exemplo, quando você está fazendo um teste de independência em uma tabela de contingência (2 vezes 2 )) . A principal razão para isso é que a verdadeira distribuição de amostragem para a estatística (X ^ 2 ) é realmente discreta (porque você está lidando com dados categóricos!), Mas a distribuição ( chi ^ 2 ) é contínua. Isso pode introduzir problemas sistemáticos. Especificamente, quando (N ) é pequeno e quando (df = 1 ), a estatística de adequação tende a ser "muito grande", o que significa que você realmente tem um valor ( alpha ) maior do que você pensa (ou, equivalentemente, os valores (p ) são um pouco pequenos demais). Yates (1934) sugeriu uma correção simples, na qual você redefine a estatística de qualidade de ajuste como: [X ^ 2 = sum_ frac <(| E_i - O_i | - 0,5) ^ 2> ] Basicamente, ele apenas subtrai 0,5 em todos os lugares. Pelo que eu posso dizer com a leitura do artigo de Yates, a correção é basicamente um hack. Não é derivado de nenhuma teoria de princípio: em vez disso, é baseado em um exame do comportamento do teste e observando que a versão corrigida parece funcionar melhor. Sinto-me obrigado a explicar isso porque às vezes você verá R (ou qualquer outro software para esse assunto) introduzir essa correção, então é meio útil saber do que se trata. Você saberá quando isso acontecer, porque a saída R dirá explicitamente que usou uma "correção de continuidade" ou "correção de Yates".


Capítulo 12: Inferência sobre categorias de dados

Você sabia que os doces de chocolate ao leite M & ampM's & reg devem vir nas seguintes porcentagens: 24% azul, 20% laranja, 16% verde, 14% amarelo, 13% vermelho, 13% marrom? (Observação: esses valores são diferentes daqueles que costumavam estar disponíveis no site do M & ampM, mas foram confirmados pela ScientificAmeriken.) Eles realmente? Um engenheiro de controle de qualidade poderia testar isso? Quão longe dessas porcentagens esperadas é aceitável?

Todas essas são perguntas que responderemos na Seção 12.1, usando algo chamado Teste de adequação.

No Capítulo 4, estudamos os relacionamentos entre duas variáveis. Aprendemos que poderíamos quantificar a força da relação linear entre duas variáveis ​​quantitativas com a correlação.

E quanto às variáveis ​​qualitativas (categóricas)? Por exemplo, suponha que consideremos uma pesquisa dada a 82 alunos em um curso de Álgebra Básica no ECC, com as seguintes respostas para a afirmação & quotEu gosto de matemática. & Quot.

Como estudamos essa relação? Existe uma maneira de saber se o gênero e se o aluno gosta de matemática estão relacionados? Na Seção 4.4, discutimos as distribuições condicionais de construção e sua análise, mas podemos ser mais precisos? Na verdade, existe uma maneira, e a estudaremos nas Seções 12.2.

Se você estiver pronto para começar, basta clicar no link "iniciar" abaixo ou em um dos links da seção à esquerda.


11.8 Laboratório 2: Teste Qui-Quadrado de Independência

Pode ser necessário combinar duas categorias de alimentos para que cada célula tenha um valor esperado de pelo menos cinco.

Teste de hipótese Realize um teste de hipótese para determinar se os fatores são independentes:

  1. H0: ________
  2. Huma: ________
  3. Que distribuição você deve usar para um teste de hipótese?
  4. Por que você escolheu esta distribuição?
  5. Calcule a estatística de teste.
  6. Encontre o p-valor.
  7. Esboce um gráfico da situação. Rotule e dimensione o x-eixo. Sombreie a área correspondente ao p-valor.

  1. A conclusão do seu estudo é a mesma ou diferente da sua resposta à pergunta dois em Colete os dados?
  2. Por que você acha que isso ocorreu?

Como um associado da Amazon, ganhamos com compras qualificadas.

Quer citar, compartilhar ou modificar este livro? Este livro é Creative Commons Attribution License 4.0 e você deve atribuir o OpenStax.

    Se você estiver redistribuindo todo ou parte deste livro em formato impresso, deverá incluir em cada página física a seguinte atribuição:

  • Use as informações abaixo para gerar uma citação. Recomendamos o uso de uma ferramenta de citação como esta.
    • Autores: Barbara Illowsky, Susan Dean
    • Editor / site: OpenStax
    • Título do livro: Estatísticas introdutórias
    • Data de publicação: 19 de setembro de 2013
    • Local: Houston, Texas
    • URL do livro: https://openstax.org/books/introductory-statistics/pages/1-introduction
    • URL da seção: https://openstax.org/books/introductory-statistics/pages/11-8-lab-2-chi-square-test-of-independence

    © 19 de maio de 2021 OpenStax. O conteúdo do livro didático produzido pela OpenStax é licenciado sob uma licença Creative Commons Attribution License 4.0. O nome OpenStax, logotipo OpenStax, capas de livro OpenStax, nome OpenStax CNX e logotipo OpenStax CNX não estão sujeitos à licença Creative Commons e não podem ser reproduzidos sem o consentimento prévio e expresso por escrito da Rice University.


    Estimar um valor

    Teste uma hipótese

    Examine um relacionamento

    Estimando uma média

    Parâmetro
    Estatística
    Tipo de Dados
    Análise
    Comando Minitab

    Estat & gt Estatísticas básicas & gt t de 1 amostra

    Condições

    dados aproximadamente normais OU

    têm um grande tamanho de amostra (n ≥ 30)

    Exemplos
    • Qual é o peso médio dos adultos?
    • Qual é o nível médio de colesterol de mulheres adultas?

    Teste sobre uma média

    Parâmetro
    Estatística
    Tipo de Dados
    Análise
    Comando Minitab

    Estat & gt Estatísticas básicas & gt t de 1 amostra

    Condições

    dados aproximadamente normais

    têm um grande tamanho de amostra (n ≥ 30)

    Exemplos
    • O GPA médio dos juniores na Penn State é superior a 3,0?
    • A temperatura média do inverno no State College é inferior a 42 ° F?

    Estimando uma proporção

    Parâmetro

    Uma proporção da população (p )

    Estatística
    Tipo de Dados
    Análise
    Comando Minitab

    Stat & gt Basic statistics & gt 1-sample ratio

    Condições
    Exemplos
    • Qual é a proporção de homens no mundo?
    • Qual é a proporção de alunos que fumam?

    Teste sobre uma proporção

    Parâmetro

    Uma proporção da população, (p )

    Estatística
    Tipo de Dados
    Análise
    Comando Minitab

    Stat & gt Basic statistics & gt 1-sample ratio

    Condições
    Exemplos
    • A proporção de mulheres é diferente de 0,5?
    • A proporção de alunos reprovados no STAT 500 é inferior a 0,1?

    Estimando a diferença de duas médias *

    Parâmetro

    Diferença em duas médias populacionais,

    Estatística

    Diferença em duas médias de amostra,

    Tipo de Dados
    Análise
    Comando Minitab

    Estat & gt Estatísticas básicas & gt t de 2 amostras

    Condições

    Amostras independentes das duas populações

    Os dados em cada amostra são sobre amostras normais ou grandes

    Exemplos
    • Quão diferentes são os GPAs médios de homens e mulheres?
    • Quantos resfriados a menos os que tomam vitamina C pegam, em média, do que os que não tomam vitamina?

    Teste para comparar dois meios *

    Parâmetro

    Diferença em duas médias populacionais,

    Estatística

    Diferença em duas médias de amostra,

    Tipo de Dados
    Análise

    (H_0 dois pontos mu_1 = mu_2 ) (H_a dois pontos mu_1 ne mu_2 ) OU

    Comando Minitab

    Estat & gt Estatísticas básicas & gt t de 2 amostras

    Condições

    Amostras independentes das duas populações

    Os dados em cada amostra são sobre amostras normais ou grandes

    Exemplos
    • As taxas médias de pulso de praticantes e não praticantes de exercícios são diferentes?
    • A pontuação média de EDS para evasão é maior do que a pontuação média de EDS para graduados?

    * (O erro padrão (S.E.) dependerá de agrupado vs não agrupado)

    Estimando uma média com dados emparelhados

    Parâmetro

    Média da diferença emparelhada,

    Estatística

    Média da diferença da amostra,

    Tipo de Dados
    Análise
    Comando Minitab

    Stat & gt Basic statistics & gt Pair t

    Condições

    Diferenças aproximadamente normais OU

    Tem um grande número de pares (n ≥ 30)

    Exemplos

    Teste sobre uma média com dados emparelhados

    Parâmetro

    Média da diferença emparelhada,

    Estatística

    Média da diferença da amostra,

    Tipo de Dados
    Análise
    Comando Minitab

    Stat & gt Basic statistics & gt Pair t

    Condições

    Diferenças aproximadamente normais OU

    Tem um grande número de pares (n ≥ 30)

    Exemplos
    • A diferença no QI dos pares de gêmeos é zero?
    • A pulsação das pessoas fica mais alta após o exercício?

    Estimando a diferença de duas proporções

    Parâmetro

    Diferença em duas proporções da população,

    Estatística

    Diferença em duas proporções de amostra,

    Tipo de Dados
    Análise
    Comando Minitab

    Estat & gt Estatísticas básicas & gt 2 proporções

    Condições

    Amostras independentes das duas populações

    Tenha pelo menos 5 em cada categoria para ambas as populações

    Exemplos
    • Quão diferentes são as porcentagens de fumantes do sexo masculino e feminino?
    • Quão diferentes são as porcentagens de bebedores compulsivos das classes alta e baixa?

    Teste para comparar duas proporções

    Parâmetro

    Diferença em duas proporções da população,

    Estatística

    Diferença em duas proporções de amostra,

    Tipo de Dados
    Análise
    Comando Minitab

    Estat & gt Estatísticas básicas & gt 2 proporções

    Condições

    Amostras independentes das duas populações

    Tenha pelo menos 5 em cada categoria para ambas as populações

    Exemplos

    A porcentagem de homens com câncer de pulmão é maior do que a porcentagem de mulheres com câncer de pulmão?


    Freqüência esperada e independência

    Em vez de comparar vários pares de proporções, podemos reformular sua pergunta original como uma envolvendo independência de duas variáveis. Lembre-se de que, no Capítulo 4, examinamos a noção de independência: se A e B são independentes, temos P (A) = P (A dado B). Em nosso exemplo, se Gênero e Uso forem realmente independentes, entre as clientes do sexo feminino, a proporção que usa o drive-through será exatamente a mesma que a proporção geral de clientes do drive-through. Como podemos ver pelas frequências na tabela de contingência, claramente não é o caso. Nossa tarefa é usar a estatística para medir até que ponto nossas frequências observadas se desviam das frequências esperadas, como se o gênero e o uso fossem independentes.

    Lembre-se que na última lição, vimos que isso vem da seguinte fórmula:

    Portanto, a principal questão na aplicação é calcular E, as frequências esperadas. Vamos examinar o exemplo anterior. Primeiro, você precisará avaliar as chamadas & quotrow sum & quot e & quotcolumn sum & quot, que nada mais são do que adicionar cada linha e coluna separadamente. Depois de adicionar as linhas e colunas, você também avaliará o & quotgrand total & quot, que é 193 clientes em nosso caso.


    TIPS4RM & # 8211 Unidades matemáticas gratuitas, séries 7-12


    Procurando unidades matemáticas gratuitas? O governo de Ontário, há alguns anos, desenvolveu este excelente recurso chamado & # 8220 Implementação direcionada e apoios de planejamento para matemática revisada (TIPS4RM) & # 8221

    Na vida cotidiana, quem se lembra de um nome tão longo? Portanto, ele evoluiu para ser chamado de & # 8220Tips & # 8221 fichário ou unidades. Essas unidades são baseadas no currículo de Ontário Math, mas os conceitos são universais.

    As unidades não estão 100% completas, então você precisará complementá-las com seu livro-texto / livro de exercícios regular; no entanto, as lições oferecem excelentes oportunidades de aprendizagem experimental / prática para os alunos.

    Uma unidade completa vem com uma visão geral da unidade, mais cada lição adicional é dividida em Minds On (o gancho), Action (o que os alunos farão), Consolidate (como eles praticarão o que aprenderam). Este recurso complementa o projeto de aula de três partes que está se tornando muito popular.

    Se você lecionar em qualquer curso de matemática do ensino fundamental ou médio, vale a pena dar uma olhada neste recurso.

    Não se esqueça de verificar nossa Estratégia de Preparação para o Teste de Matemática grátis


    Assista o vídeo: Teste Qui-Quadrado de Independência (Dezembro 2021).