Artigos

1.6.10: Examinando as evidências usando gráficos e estatísticas - Matemática


Vivemos em um mundo em que as decisões devem ser tomadas sem informações completas. Sabendo disso, buscamos intuitivamente reunir o máximo de informações possível antes de tomar a decisão real. Considere o casamento, que é uma decisão bastante importante. Nunca podemos saber tudo o que é possível sobre uma pessoa com quem gostaríamos de nos casar, mas buscamos o máximo de informações possível namorando primeiro. O emprego é outro exemplo de decisão importante, tanto para o empregador quanto para o potencial empregado. Em cada caso, as informações são obtidas por meio de entrevistas, currículos, referências e pesquisas antes que uma oferta de trabalho seja dada ou aceita.

Diante de uma decisão que se baseará em dados, é a produção de gráficos e estatísticas que serão análogos ao namoro e às entrevistas. Os dados coletados devem ser úteis para responder às perguntas que foram feitas. O Capítulo 2 enfocou tanto o planejamento do experimento quanto o processo de seleção aleatória, que é importante para a produção de bons dados de amostra. O Capítulo 3 agora se concentrará no que fazer com os dados, uma vez que você os tenha.

Tipos de Dados

Já classificamos os dados em duas categorias. Os dados numéricos são considerados quantitativos, enquanto os dados que consistem em palavras são chamados de dados categóricos ou qualitativos. Os dados quantitativos podem ser subdivididos em dados discretos e contínuos.

  • Discreto os dados contêm um número finito de valores possíveis porque geralmente são baseados em contagens. Freqüentemente, esses valores são números inteiros, mas isso não é um requisito. Exemplos de dados discretos incluem o número de salmões migrando rio acima para desovar, o número de veículos que cruzam uma ponte a cada dia ou o número de desabrigados em uma comunidade.
  • Contínuo os dados contêm um número infinito de valores possíveis, porque muitas vezes são baseados em medições, que, em teoria, poderiam ser medidas com muitas casas decimais se existisse a tecnologia para isso. Exemplos de dados contínuos incluem o peso do salmão que está desovando, o tempo que leva para cruzar a ponte ou o número de calorias que um sem-teto consome por dia.

Dados quantitativos discretos e dados categóricos são freqüentemente confundidos. Observe os dados reais que seriam gravados para cada unidade da amostra para determinar o tipo de dados. Como exemplo, considere o besouro marrom, que está infectando árvores no oeste dos Estados Unidos e no Canadá. Se o objetivo da pesquisa era determinar a proporção de árvores infectadas, então os dados que seriam coletados para cada árvore estão “infectados” ou “não infectados”. Em última análise, o pesquisador contaria o número de árvores marcadas como infectadas ou não infectadas, mas os dados em si seriam essas palavras. Se o objetivo da pesquisa era determinar o número médio de besouro marrom em cada árvore, então os dados que seriam coletados seriam “o número de besouro marrom em uma árvore”, que é uma contagem. Assim, as contagens estão envolvidas para dados quantitativos categóricos e discretos. Os dados categóricos são contados como se os dados categóricos fossem contados em vários lugares ou vezes, então as contagens se tornam dados quantitativos discretos. Por exemplo, na aula de hoje, os alunos da lista de alunos podem ser marcados como presentes ou ausentes e isso seria categórico. No entanto, se considerarmos o número de alunos que estiveram presentes em cada aula durante a semana anterior, então os dados nos quais estamos interessados ​​são quantitativos discretos.

Examinando as evidências de dados de amostra

Como os dados de amostra são nossa janela para os dados estocásticos da população, precisamos de maneiras de tornar os dados significativos e compreensíveis. Isso é feito usando uma combinação de gráficos e estatísticas. Existe um ou mais gráficos e estatísticas apropriados para cada tipo de dado. Nas seções a seguir, você aprenderá como fazer os gráficos manualmente e como encontrar as estatísticas. Existem muitos outros gráficos além desta coleção, mas estes são os básicos.

Examinando as evidências fornecidas por dados categóricos de amostra

Existem dois gráficos e duas estatísticas apropriadas para dados categóricos. Os gráficos mais comumente usados ​​são gráficos de barras e gráficos de pizza. As estatísticas são contagens e proporções. Se a hipótese que está sendo testada for sobre contagens, um gráfico de barras e contagens de amostra devem ser usados. Se a hipótese que está sendo testada for sobre proporções, um gráfico de pizza e proporções de amostra devem ser usados. Para dados categóricos, as estatísticas são encontradas primeiro e, em seguida, usadas na produção de um gráfico.

Contagens e gráficos de barras

A liderança política nos Estados Unidos é normalmente dividida entre dois partidos políticos, os democratas e os republicanos. Apenas alguns políticos foram eleitos independentes, o que significa que não pertencem a nenhum desses partidos. Os mais altos cargos eleitos politicamente, além do presidente, são parlamentares, senadores e governadores estaduais. Se quisermos entender a distribuição dos partidos políticos em 2013, então o partido político de nossos líderes são dados categóricos que podem ser colocados em uma tabela de contingência em que cada célula representa uma contagem do número de pessoas que se encaixam tanto na categoria de posição de liderança e a categoria partido político. Um gráfico de barras pode ser feito a partir dessas contagens.

2013Posição de liderança
CongressoSenadoGovernador
Partido politicoDemocratas2005220
Independentes020
Republicanos2334630

Proporções e gráficos de pizza

As pesquisas de opinião freqüentemente usam proporções ou porcentagens para mostrar apoio a candidatos ou iniciativas. A diferença entre proporções e percentuais é que os percentuais são obtidos multiplicando-se a proporção por 100. Assim, uma proporção de 0,25 seria equivalente a 25%. As fórmulas usam proporções, enquanto muitas vezes nos comunicamos verbalmente por meio de porcentagens. Você deve ser capaz de passar de um para o outro sem esforço.

Quase sempre há duas proporções de interesse para nós. A proporção da população, representada pelo símbolo p, é a proporção que realmente gostaríamos de saber, mas que geralmente é desconhecida. Fazemos hipóteses sobre p. A proporção da amostra, representada por ( hat {p} ), é o que podemos encontrar nos dados da amostra e é usada para testar a hipótese. A fórmula para proporções é:

[p = dfrac {x} {N} ]

e

[ hat {p} = dfrac {x} {n} ]

onde (x ) é uma contagem do número de valores em uma categoria, (N ) é o tamanho da população e (n ) é o tamanho da amostra.

Os resultados de duas pesquisas discutidas em um blog washingtonstatewire.com serão usados ​​como exemplo. Dado que grande parte do congestionamento de transporte é causado por carros, e que as pontes do estado de Washington precisam de manutenção (houve um colapso de uma ponte na Interestadual 5 perto de Mount Vernon, WA em 2013), seria natural se perguntar sobre o apoio dos eleitores ao financiamento estadual de transporte projetos. Duas pesquisas foram realizadas quase ao mesmo tempo em 2013. (washingtonstatewire.com/blog/...portation-tax- package-offer-a-measure-of-voter-mood-after-bridge-collapse / visualizado 7-25 -13.)

A pesquisa 1 usou entrevistadores humanos que começaram uma entrevista com roteiro observando que “é claro que os projetos de transporte são caros e demoram muito para serem concluídos” e concluiu com “como eu disse, os projetos de transporte são caros. A outra parte do pacote será como pagar por essas melhorias. Ninguém gosta de aumentar os impostos, mas enquanto leio algumas opções de financiamento, diga-me se você favorece a proposta, se inclina a aceitá-la, se opõe a ela ou se a considera inaceitável. ”

A pesquisa 2 usou a pesquisa robótica, que perguntou aos eleitores se é importante "para a legislatura aprovar um pacote estadual este ano para resolver problemas de congestionamento e segurança, financiar a manutenção e melhoria de estradas e pontes e fornecer financiamento adicional para o trânsito".

Pelo que se pode estimar a partir do artigo, os resultados da Pesquisa 1 foram que 160 entre 400 pessoas pesquisadas apoiaram o aumento de impostos para melhorar o sistema de transporte. Os resultados da Pesquisa 2 foram que 414 de 600 acham que é importante para o Legislativo aprovar o pacote de financiamento.

A partir de dados como esse, podemos fazer um gráfico de pizza. Isso será demonstrado com a Pesquisa 1 e, em seguida, você deve fazer um gráfico de pizza para a Pesquisa 2.

A primeira etapa para fazer um gráfico de pizza é calcular a proporção dos valores em cada grupo. Na Enquete 1, vamos considerar que existem dois grupos. O primeiro grupo é para aqueles que apoiaram o aumento de impostos e o segundo grupo é para aqueles que não apoiaram o aumento de impostos. Como 160 em 400 pessoas apoiavam o aumento de impostos, a proporção é encontrada dividindo 160 por 400. Portanto, ( hat {p} = dfrac {160} {400} = 0,40 ). Como um

lembrete, ( hat {p} ) é a proporção da amostra que apóia o aumento de impostos. É uma estatística, que fornece uma visão sobre a proporção da população, representada pela variável p. Os legisladores gostariam de saber o valor de p, mas isso exigiria fazer um censo, então eles devem se contentar com a proporção da amostra, ( hat {p} ). É provável que p não seja igual a ( hat {p} ), mas é próximo a esse valor. Ao fazer um gráfico de pizza, desenhe a linha que separa as fatias de modo que 40% do círculo esteja em uma fatia, o que significa que 60% do círculo está na outra.

Existem algumas coisas a serem observadas sobre o gráfico de pizza. Primeiro, ele contém um título que descreve o conteúdo do gráfico. Em seguida, cada fatia contém um rótulo que explica resumidamente o significado da fatia, o número de valores de dados que contribuíram para a fatia e a porcentagem de todos os valores colocados na fatia. Por que todas essas informações devem ser incluídas?

Se você for usar qualquer gráfico para mostrar os resultados de sua pesquisa, é importante comunicar esses resultados com clareza. O objetivo é produzir gráficos de fácil leitura. Um leitor olhando para um gráfico sem rótulo não será capaz de obter qualquer compreensão dele e, portanto, você falhou em comunicar algo importante. A porcentagem é incluída para tornar mais fácil para o leitor saber a porcentagem dos valores em cada fatia. Sem as porcentagens, uma pessoa precisaria adivinhar a porcentagem e é provável que sua estimativa não seja precisa. Incluir o número de pessoas em cada fatia é importante porque dá ao leitor uma indicação de quão seriamente deve tratar os resultados. Uma pesquisa com 40 pessoas, das quais 16 impostos suportados, teria um gráfico de pizza idêntico ao acima. Da mesma forma, uma pesquisa com 40.000 pessoas, das quais 16.000 impostos apoiados, também seria idêntica ao gráfico acima. Quanto mais gente houver, mais forte será o apoio. Isso deve ser óbvio no gráfico e, portanto, é importante incluir o valor.

Uma menção deve ser feita sobre os gráficos de computador, uma vez que a maioria dos gráficos de pizza são produzidos em um computador. Embora os computadores possam fazer gráficos muito elaborados e coloridos, as cores podem ser indistinguíveis se impressas em uma impressora em preto e branco ou uma foto copiada em preto e branco. Lembre-se disso ao fazer gráficos e escolher cores que serão distinguíveis quando copiadas em preto e branco.

Use os resultados da Pesquisa 2 para produzir um gráfico de pizza totalmente rotulado. Encontre a proporção da amostra primeiro.

Essas duas pesquisas produzem resultados semelhantes ou opostos? As perguntas foram bem formuladas?

Por que ou por que não?

Uma palavra final sobre os gráficos de pizza precisa ser feita. Em alguns círculos, os gráficos de pizza não são considerados gráficos úteis. Há algumas evidências de que as pessoas não interpretam bem os dados. Os gráficos de pizza raramente aparecem em jornais acadêmicos. No entanto, os gráficos de pizza aparecem na mídia impressa e podem dar uma indicação de como o todo é dividido. Eles podem ser benéficos para aqueles que gostam da representação visual, ao invés de apenas as estatísticas.

Examinando as evidências fornecidas por dados quantitativos de amostra

Os três tipos mais comuns de gráficos usados ​​para dados quantitativos são histogramas, gráficos de caixa e gráficos de dispersão. Histogramas e gráficos de caixa são usados ​​para dados univariados, enquanto os gráficos de dispersão são usados ​​para dados bivariados. Uma variável é uma única medição ou observação de uma variável aleatória obtida para cada sujeito ou unidade em uma amostra (Sokal, Robert R. e F. James Rohlf. Introdução à Bioestatística. New York: Freeman, 1987, Print.) Quando há apenas uma variável aleatória que está sendo considerada, os dados que são coletados são univariados. Quando duas variáveis ​​aleatórias estão sendo consideradas simultaneamente para a mesma unidade, os dados para as duas variáveis ​​são considerados bivariados. Exemplos de dados univariados incluem o número de veículos em um trecho de rodovia, o valor que custa para um aluno receber seu diploma ou a quantidade de água usada por uma família a cada mês. Exemplos de dados bivariados incluem o pareamento do número de carros na rodovia e o tempo de deslocamento, o valor da mensalidade e o valor da ajuda financeira que um aluno usa ou o número de pessoas em uma casa e a quantidade de água usada.

As estatísticas usadas para dados univariados se encaixam em um de dois objetivos. O primeiro objetivo é definir o centro dos dados e o segundo objetivo é definir a variação que existe nos dados. As formas mais comuns de definir o centro são com a média aritmética e a mediana, embora essas não sejam as únicas duas medidas de centro. Nos casos em que a média aritmética é usada, a variação é quantificada usando o desvio padrão. A estatística mais comumente usada para dados bivariados é a correlação, que indica a força da relação linear entre as duas variáveis.

Histogramas

Os capítulos um e dois continham vários exemplos de histogramas. Eles são usados ​​para mostrar a distribuição dos dados, mostrando a frequência ou contagem de dados em cada classe. O processo de criação de histogramas manualmente inclui as etapas a seguir.

  1. Identifique os valores de dados mais baixos e mais altos.
  2. Crie limites de fácil leitura que serão usados ​​para classificar os dados em 4 a 10 classes. O limite mais baixo deve ser um número que seja igual ou seja um bom número abaixo do valor de dados mais baixo. A largura da classe, que é a diferença entre limites consecutivos, deve ser um fator dos valores dos limites.
  3. Faça uma distribuição de frequência para fornecer uma estrutura organizada para contar o número de valores de dados em cada classe.
  4. Crie o histograma rotulando o eixo x com os limites inferiores e o eixo y com as frequências. A altura das barras reflete o número de valores em cada classe. As barras adjacentes devem se tocar.
  5. Coloque um título no gráfico e em cada eixo.

Não há uma maneira matemática precisa de escolher o valor inicial e a largura da classe para um histograma. Em vez disso, é necessário pensar um pouco para usar números de fácil compreensão para o leitor. Por exemplo, se o número mais baixo em um conjunto de dados for 9 e o número mais alto for 62, usar um valor inicial de 0 e uma largura de classe de 10 resultaria na criação de 7 classes com limites de 0 de fácil leitura, 10,20,30,40,50,60 e 70. Por outro lado, começar em 9 e usar uma largura de classe de 10 não produziria limites de fácil leitura (9,19,29, ...). Números como 2,4,6,8 ... ou 5,10,15,20 ... ou qualquer versão desses números, se forem multiplicados por uma potência de 10, constituem bons limites de classe.

Uma vez que os limites da classe foram determinados, uma distribuição de frequência é criada. Uma distribuição de frequência é uma tabela que mostra as classes e fornece um local para registrar o número de valores de dados em cada classe. A distribuição de frequência também deve ajudar a esclarecer qual classe receberá os valores de limite. Por exemplo, um valor de 20 seria colocado em uma classe de 10 a 20 ou em uma classe de 20 a 30? Embora não haja um acordo universal sobre essa questão, parece um pouco mais lógico agrupar todos os valores que começam com o mesmo número. Assim, 20 seriam colocados na classe 20 - 30 que contém todos os valores de 20.000 até 29.999. Isso pode ser mostrado de algumas maneiras, conforme demonstrado na tabela abaixo.

0 até, mas não incluindo 10 (0 le x <10 )[0, 10)
10 até, mas não incluindo 10 (10 ​​ le x <20 )[10, 20)
20 até, mas não incluindo 10 (20 le x <30 )[20, 30)
30 até, mas não incluindo 10 (30 le x <40 )[30, 40)

Todas as três colunas indicam as mesmas classes. A terceira coluna usa notação de intervalo e por ser explícita e usar o mínimo de escrita, será o método usado neste texto. Como um lembrete sobre a notação de intervalo, o símbolo “[“ indica que o número baixo está incluído, enquanto o símbolo “)“ indica que o número alto não está incluído.

Para demonstrar a construção de um histograma, serão usados ​​dados do Departamento de Transporte dos EUA, Administração Federal de Rodovias. (Explore.data.gov/Transportat ... 3-mssz, 7-28-13) Os dados são o número estimado de milhas rodadas em um estado em dezembro de 2010. Será utilizada uma amostra estratificada, uma vez que os dados já estão divididos por regiões do país. Os dados da tabela têm unidades de milhões de milhas.

47787688593816
630544257891517
93893681212648394
583295820342362
71258587387861
5664352162562594
665286954435
  1. O valor baixo é 352, o valor alto é 28.695.
  2. O limite mais baixo da classe será 0, a largura da classe será 5000. Isso produzirá 6 classes.
  3. Esta é a distribuição de frequência que inclui uma contagem do número de valores em cada classe.
AulasFrequência
[0, 5000)19
[5000, 10000)6
[10000, 15000)0
[15000, 20000)1
[20000, 25000)0
[25000, 30000)1

4, Este é o histograma completamente rotulado. Observe como a altura das barras corresponde às frequências na distribuição de frequência.

Suponha que desejemos comparar a quantidade de veículos que dirige em estados com uma grande área com aqueles com uma área menor. Isso pode ser feito usando um histograma de barras múltiplas em que um conjunto de barras será para estados maiores e o outro para estados menores.

Distribuição de frequência e histograma de barras múltiplas:

Interpretação: embora possa ser razoável supor que haveria mais direção em estados maiores porque a distância entre as cidades é maior, é difícil discernir neste gráfico se esse for o caso. Portanto, além da utilização de gráfico, esses dados podem ser comparados por meio da média aritmética e do desvio padrão.

Média aritmética, variância e desvio padrão

A média aritmética e o desvio padrão são estatísticas comuns usadas em conjunto com histogramas. A média é provavelmente a forma mais comumente usada para identificar o centro de dados, mas não é o único método. A média pode ser considerada o ponto de equilíbrio dos dados, bem como o fulcro em uma gangorra.Valores distantes da média têm um impacto maior do que valores mais próximos da média, da mesma forma que uma criança pequena sentada na ponta de uma gangorra pode se equilibrar com uma pessoa maior sentada perto do fulcro.

Quase sempre há dois meios aritméticos de interesse para nós. A média da população, representada pelo símbolo ( mu ) (mu), é a média que realmente gostaríamos de saber, mas que geralmente é desconhecida. Fazemos hipóteses sobre ( mu ). A média da amostra, representada por ( bar {x} ) (x-bar), é o que podemos encontrar a partir de uma amostra e é o que é usado para testar a hipótese. A fórmula para as médias, conforme mostrado no Capítulo 1, são:

( mu = dfrac { sum x_i} {N} ) e ( bar {x} = dfrac { sum x_i} {n} )

Onde ( sum ) é um sigma maiúsculo usado na notação de soma que significa adicionar tudo o que segue, xeué o conjunto de valores de dados e N é o número de valores na população e n é o número de valores na amostra. Essas fórmulas dizem para adicionar todos os valores e dividir pelo número de valores.

Existem vários motivos pelos quais a média aritmética é comumente usada e alguns motivos pelos quais ela não deve ser usada às vezes. Um dos principais motivos pelos quais ele é comumente usado é porque a média da amostra é um estimador imparcial da média da população. Isso ocorre porque cerca de metade das médias da amostra que poderiam ser obtidas de uma população será menor do que a média da população e a outra metade será maior. Uma média aritmética não é a melhor medida de centro quando há alguns valores extremamente altos nos dados, pois eles terão um impacto maior na média do que os valores restantes.

Além da média, também é útil saber quanta variação existe nos dados. Observe no histograma de barra dupla como os dados nos estados com a maior área estão mais espalhados do que os dados nos estados com a menor área. Quanto mais espalhados os dados, mais difícil é obter um resultado significativo ao testar hipóteses.

O desvio padrão é a principal maneira pela qual a disseminação dos dados é quantificada. Pode ser considerado como a distância média aproximada entre cada valor de dados e a média. Tal como acontece com a média, existem dois valores de desvio padrão que nos interessam. O desvio padrão da população, representado pelo símbolo σ (sigma minúsculo), é o desvio padrão que realmente gostaríamos de saber, mas que geralmente é desconhecido. O desvio padrão da amostra, representado com s, é o que podemos encontrar em uma amostra. As fórmulas do desvio padrão são:

[ sigma = sqrt { dfrac { sum (x - mu) ^ 2} {N}} ]

e

[s = sqrt { dfrac { sum (x - bar {x}) ^ 2} {n - 1}} ]

Os dados do furacão no Atlântico Norte serão usados ​​para demonstrar o processo de encontrar a média e o desvio padrão. (Dados de: www.wunderground.com/hurrican...asp?region=ep.)

Ano2005200620072008200920102011
Número de furacões155683127

Como se trata de uma amostra, a fórmula apropriada para encontrar a média da amostra é ( bar {x} = dfrac { sum x_i} {n} ). O cálculo é ( dfrac {15 + 5 + 6 + 8 + 3 + 12 + 7} {7} = dfrac {56} {7} = 8 ). Houve uma média de 8 furacões no Atlântico Norte por ano entre 2005 e 2011. Observe que não havia 8 furacões por ano. Isso ocorre porque há uma variação natural no número de furacões. Podemos usar o desvio padrão como uma forma de determinar a quantidade de variação. Para isso, construiremos uma tabela de 3 colunas para ajudar nos cálculos.

x ((x - bar {x}) ) ((x - bar {x}) ^ 2 )
1515- 8 = 7((7)^2 = 49)
55 - 8 = -3((-3)^2 = 9)
66 - 8 = -2((-2)^2 = 4)
88 - 8 = 0((0)^2 = 0)
33 - 8 = -5((-5)^2 = 25)
1212 - 8 = 4((4)^2 = 16)
77 - 8 = -1((-1)^2 = 1)
( sum (x - bar {x}) = 0 ) ( sum (x - bar {x}) ^ 2 = 0 )

Como esta é uma amostra, a fórmula apropriada para encontrar o desvio padrão da amostra é (s = sqrt { dfrac { sum (x - bar {x}) ^ 2} {n - 1}} ) que, após a substituição é ( sqrt { dfrac {104} {7 - 1}} = 4,16 ). Este número indica que a variação média da média em cada ano é de 4,16 furacões.

A variância é outra medida de variação relacionada ao desvio padrão. A variância é o quadrado do desvio padrão ou, inversamente, o desvio padrão é a raiz quadrada da variância. As fórmulas para variação são:

[ sigma ^ 2 = dfrac { sum (x - mu) ^ 2} {N} ]

e

[s ^ 2 = dfrac { sum (x - bar {x}) ^ 2} {n - 1} ]

No exemplo sobre furacões, a variação é (s ^ 2 = dfrac {104} {7 - 1} = 17,33 ).

Médias e gráficos de caixa

Outra combinação de estatísticas e gráficos são as medianas e os gráficos de caixa. Uma mediana é encontrada antes que um gráfico de caixa possa ser criado. Uma mediana é o valor de uma variável em uma matriz ordenada que possui um número igual de itens em cada lado dela. (5 Sokal, Robert R. e F. James Rohlf. Introdução à Bioestatística. New York: Freeman, 1987. Print.) Para encontrar a mediana, coloque os dados em ordem, do pequeno ao grande. Atribua uma classificação aos números. O menor número tem uma classificação 1, o segundo menor tem uma classificação 2, etc. A classificação da mediana é encontrada usando a fórmula 4.5.

[Classificação da mediana = dfrac {n + 1} {2} ]

Se n for ímpar, ou seja, se houver um número ímpar de valores de dados, a mediana será um dos valores de dados. Se n for um número par, a mediana será a média dos dois valores intermediários.

Os mesmos dados de furacão serão usados ​​na primeira das duas demonstrações para encontrar a mediana.

Ano2005200620072008200920102011
Número de furacões155683127

A primeira etapa é criar uma matriz ordenada.

Número de furacões356781215
Classificação1234567

A segunda etapa é encontrar a classificação da mediana usando a fórmula (Classificação de Mediana = dfrac {n + 1} {2} ), ( dfrac {7 + 1} {2} = 4 )

A terceira etapa é encontrar o valor dos dados que corresponde à classificação da mediana.

Como a classificação da mediana é 4 e o número correspondente é 7 furacões, o número médio é 7 furacões.

A segunda demonstração será com o número de furacões do Pacífico Leste. Como não há dados para 2011, serão utilizados apenas os anos de 2005-2010.

Ano2005200620072008200920102011
Número de furacões5102473

A primeira etapa é criar uma matriz ordenada.

Número de furacões2345710
Classificação123456

A segunda etapa é encontrar o posto da mediana usando a fórmula (Rank of Median = dfrac {n + 1} {2} )

( dfrac {6 + 1} {2} = 3,5 ). Isso significa que a mediana está a meio caminho entre o terceiro e o quarto valores.

A terceira etapa é encontrar o valor dos dados que corresponde à classificação da mediana.

A média do terceiro e quarto valores é ( dfrac {4 + 5} {2} = 4,5 ). Portanto, o número médio de East Pacific

furacões entre 2005 e 2010 é de 4,5. Observe que, neste caso, 4,5 não é um dos valores dos dados e nem mesmo é possível ter a metade de um furacão, mas ainda é a mediana.

Um gráfico de caixa é um gráfico que mostra a mediana junto com os valores mais alto e mais baixo e dois outros valores chamados de primeiro quartil e terceiro quartil. O primeiro quartil pode ser considerado a mediana da metade inferior dos dados e o terceiro quartil pode ser considerado a mediana da metade superior dos dados.

Os dados de furacões do Atlântico Norte serão usados ​​para produzir um gráfico de caixa.

A primeira etapa é criar uma matriz ordenada.

Número de furacões356781215
Classificação1234567

A segunda etapa é identificar o valor mais baixo, a mediana e o valor mais alto.

O mais baixoMedianaAltíssima
Número de furacões356781215
Classificação1234567

A terceira etapa é identificar o primeiro quartil e o terceiro quartil. Isso é feito encontrando a mediana de todos os valores abaixo da mediana e acima da mediana.

O gráfico de caixa divide os dados em 4 grupos. Mostra como os dados dentro de cada grupo são distribuídos.

Ao representar graficamente dados quantitativos, é melhor usar um histograma ou gráfico de caixa? Compare os gráficos a seguir que mostram uma comparação do número de furacões em quatro áreas, Atlântico Norte, Pacífico Leste, Pacífico Oeste, Oceano Índico. Os dados são dos anos 1970-2010.

Embora o histograma forneça uma análise mais detalhada dos dados, é muito confuso e difícil de interpretar. Portanto, apesar das informações adicionais que ele fornece, o leitor deve estudar o gráfico atentamente para entender o que ele mostra. Por outro lado, o gráfico de caixa fornece menos informações, mas é muito mais fácil fazer uma comparação entre as diferentes áreas de furacão. Em geral, se houver apenas um conjunto de dados sendo representado graficamente, um histograma é a melhor escolha. Se houver três ou mais conjuntos de dados sendo representados graficamente, um gráfico de caixa é a melhor escolha. Se houver dois conjuntos de dados sendo representados graficamente, faça um histograma e um gráfico de caixa e decida qual é mais eficaz para ajudar o leitor a compreender os dados.

Gráficos de dispersão e correlação

Algumas questões de pesquisa resultam do desejo de encontrar uma associação entre duas variáveis ​​quantitativas. Os exemplos incluem disparidade de riqueza (coeficiente de Gini) / taxas de pobreza, velocidade de direção / distância para parar, altura / capacidade de salto. O objetivo é determinar a relação entre essas duas variáveis ​​aleatórias e, em muitos casos, ver se essa relação é linear.

Para fins de demonstração, exploraremos a relação entre a diferença de riqueza medida pelo coeficiente de Gini e a taxa de pobreza. As unidades serão selecionadas aleatoriamente em estados dos EUA a partir do ano de 2010. Um gráfico de dispersão dará uma compreensão rápida da relação.

A partir desse gráfico de dispersão, parece que quanto maior o hiato de riqueza, menor a taxa de pobreza, embora a relação não seja forte, uma vez que os pontos não parecem estar agrupados juntos para formar uma linha reta. Para determinar a força da relação linear entre essas variáveis, usamos o coeficiente de correlação do momento do produto de Pearson.

Quase sempre há dois coeficientes de correlação de interesse para nós. A correlação populacional, representada pelo símbolo ρ (rho), é o coeficiente de correlação que realmente gostaríamos de saber, mas que geralmente é desconhecido. Fazemos hipóteses sobre ρ. A correlação da amostra, representada com r, é o que podemos encontrar em uma amostra e é o que é usado para testar a hipótese. A fórmula para o coeficiente de correlação da amostra é:

[r = dfrac { text {cov} (x, y)} {s_x s_y} ]

O numerador é a covariância entre as duas variáveis, o denominador é o produto do desvio padrão de cada variável.

A correlação sempre será um valor entre -1 e 1. Uma correlação de 0 significa que não há correlação. Uma correlação de 1 significa uma relação linear direta em que y fica maior à medida que x fica maior. Uma correlação de -1 significa uma relação linear inversa em que y fica menor à medida que x fica maior.

Segue uma breve explicação da fórmula de correlação. Pense nos dados bivariados como um par ordenado (x, y). O par ordenado (( bar {x}, bar {y}) ) é o centroide dos dados. Para esses dados, o centróide está em (0,4467, 11,7857). Isso é mostrado no gráfico abaixo.

A covariância é dada pela fórmula ( text {cov} (x, y) = dfrac { sum (x - bar {x}) (y - bar {y})} {n - 1} ) Mostra o produto de

a distância de cada ponto está longe do valor médio de xe do valor médio de y. Uma vez que a multiplicação dos valores xey por 10 resultaria em uma covariância que é 100 vezes maior do que esses dados produziriam, mas o gráfico seria o mesmo, a covariância é padronizada dividindo pelo produto dos desvios padrão de x e y.

Calcule a covariância

(x, y) ou (gini, pov) ((x - bar {x}) )
( (x ) - 0,4467)
((y - bar {y}) )
( (y ) - 11,7857)
((x - bar {x}) (y - bar {y}) )
(0.486, 10.1)0.0393-1.6857-0.0662
(0.443, 9.9)-0.0037-1.88570.0070
(0.44, 11.6)-0.0067-0.18570.0012
(0.433, 13)-0.01371.2143-0.0167
(0.419, 13.2)-0.02771.4143-0.0392
(0.442, 14.4)-0.00472.6143-0.0123
(0.464, 10.3)0.0173-1.4857-0.0257
Soma0.00000.0000-0.1518

( text {cov} (x, y) = dfrac { sum (x - bar {x}) (y - bar {y})} {n - 1} )

( text {cov} (x, y) = dfrac {-0,1518} {7 - 1} )

( text {cov} (x, y) = -0,0253 )

Calcule o desvio padrão de (x ) e (y )

( (x ), (y )) ou (gini, pov) ((x - bar {x}) )
((x - 0,4467) )
((x - bar {x}) ^ 2 ) ((y - bar {y}) )
((y - 11.7857) )
((y - bar {y}) ^ 2 )
(0.486, 10.1)0.03930.00154-1.68572.84163
(0.443, 9.9)-0.00370.00001-1.88573.55592
(0.44, 11.6)-0.00670.00005-0.18570.03449
(0.433, 13)-0.01370.000191.21431.47449
(0.419, 13.2)-0.02770.000771.41432.00020
(0.442, 14.4)-0.00470.000022.61436.83449
(0.464, 10.3)0.01730.00030-1.48572.20735
Soma0.00000.00290.000018.9486

[S_x = sqrt { dfrac { sum (x - bar {x}) ^ 2} {n - 1}} ] [S_y = sqrt { dfrac { sum (y - bar { y}) ^ 2} {n - 1}} ] [S_x = sqrt { dfrac {0,0029} {7 - 1}} ] [S_y = sqrt { dfrac {19,9486} {7 - 1 }} ] [S_x = 0,0219 ] [S_y = 1,777 ]

Use esses resultados para calcular a correlação.

[ begin {align *} = dfrac { text {cov} (x, y)} {S_x S_y} [4pt] & = dfrac {-0,0253} {0,0219 cdot 1,77} [4pt ] & = -0,650 end {align *} ]

Essa correlação indica que Coeficientes de Gini mais altos correspondem a níveis de pobreza mais baixos. Se uma correlação de -0,650 indica que os dados são significativos ou simplesmente resultados aleatórios de uma população sem correlação, é um assunto para um capítulo posterior. (www.census.gov/prod/2012pubs/acsbr11-02.pdf)

Embora seja importante entender que uma correlação entre variáveis ​​não implica causalidade, um gráfico de dispersão é desenhado com uma das variáveis ​​sendo o valor x independente, também conhecido como a variável explicativa e a outra sendo o valor y dependente, também conhecido como a variável de resposta. Os nomes explicativo e resposta são usados ​​porque, se houver uma relação linear entre as duas variáveis, a variável explicativa pode ser usada para prever a variável resposta. Por exemplo, seria de se esperar que a velocidade de direção influenciasse a distância de parada em vez de a distância de parada influenciando a velocidade de direção, de forma que a velocidade de direção fosse a variável explicativa e a distância de parada fosse a variável de resposta. No entanto, uma pessoa pode optar por dirigir mais devagar sob certas condições devido ao tempo que pode levar para ela parar (por exemplo, uma zona escolar), então a escolha das variáveis ​​explicativas e de resposta deve ser consistente com a intenção da pesquisa. A precisão da previsão é baseada na força da relação linear. (www.census.gov/prod/2012pubs/acsbr11-01.pdf Sheskin, David J. Manual de procedimentos estatísticos paramétricos e não paramétricos. Boca Raton: Chapman & Hall / CRC, 2000. Print.)

Se uma correlação entre a variável explicativa e a variável de resposta pode ser estabelecida, uma das sete possibilidades existe.

  1. Mudar a variável x causará uma mudança na variável y
  2. Mudar a variável y causará uma mudança na variável x
  3. Pode existir um ciclo de feedback em que uma mudança na variável x leva a uma mudança na variável y que leva a outra mudança na variável x, etc.
  4. As mudanças em ambas as variáveis ​​são determinadas por uma terceira variável
  5. As mudanças em ambas as variáveis ​​são coincidentes.
  6. A correlação é o resultado de outliers, sem os quais não haveria correlação significativa.
  7. A correlação é o resultado de variáveis ​​de confusão.

A melhor diretriz é presumir que a correlação não é causa, mas se você acha que é em uma determinada circunstância, uma prova adicional precisará ser fornecida. Uma relação causal pode ser estabelecida mais facilmente com um experimento manipulativo do que com um experimento observacional, uma vez que o último pode conter variáveis ​​de confusão ocultas que não são levadas em consideração.

Calculadora TI-84

A calculadora TI-84 tem a capacidade de localizar rapidamente todas as estatísticas apresentadas neste capítulo. Para encontrar a média aritmética, o desvio padrão e todos os 5 números do gráfico de caixa, use a tecla Stat da calculadora. Você terá três opções: EDIT, CALC, TESTS. Editar já está destacado, então pressione a tecla Enter e você encontrará três listas denominadas L1, L2 e L3. Existem também três outras listas rotuladas L4, L5, L6 que podem ser encontradas rolando para a direita. Insira seus dados em uma das listas. Depois disso, pressione a tecla stat novamente, use as setas do cursor para rolar para a direita até que Calc seja destacado e pressione enter. A primeira opção é 1-Var Stats. Já está destacado, então pressione enter, depois pressione a 2ª tecla e o número correspondente à lista em que seus dados estão (1-6). Você receberá as seguintes informações.

( bar {x} ) - Média Aritmética de Amostra

( sum x )

( sum x ^ 2 )

(S_x ) - Amostra S bronzeado Desvio tardio

( sigma_x ) - População S bronzeado Dard Deviation

(n ) - tamanho da amostra

min (X ) - valor mais baixo

(Q ) 1 - primeiro quartil

Med - mediana

(Q ) 3 - terceiro quartil

max (X ) - valor mais alto

Para dados bivariados, insira os valores x em uma lista e os valores y em uma lista diferente, certificando-se de que estejam emparelhados corretamente. Use a tecla stat, selecione Calc e, em seguida, selecione 4: LinReg (ax + b). Use a segunda tecla para inserir o número da lista para a variável x seguido por uma vírgula e, em seguida, insira o número da lista para a variável y. Isso fornecerá mais informações do que estamos prontos no momento, mas o único valor que você procurará é rotulado como r. Se r não estiver visível, você precisará ativar o diagnóstico da calculadora. Isso é feito usando a tecla 2 (^ { text {nd}} ) seguida por 0 (que obterá o catálogo). Role para baixo até diagnosticOn e pressione Enter duas vezes.


Fundamentos do raciocínio estatístico

Descrição:
Índice: Raciocínio Estatístico Obtenção de Evidências Úteis Examinando as Evidências Usando Gráficos e Estatística Teoria Inferencial Testando Hipóteses Intervalos de Confiança e Análise de Tamanho de Amostra de Dados Quantitativos Bivariados Qui Quadrado Atividades em sala de aula.

Baixe ou leia online gratuitamente aqui:
Link para Download
(4,6 MB, PDF)


Stem Plots

Os gráficos de tronco são uma maneira rápida e fácil de observar pequenas amostras de dados numéricos. Você pode procurar por quaisquer padrões ou quaisquer valores de dados estranhos. É fácil comparar duas amostras usando plotagens de caule.

O primeiro passo é dividir cada número em 2 partes, a haste (como o dígito mais à esquerda) e a folha (como o dígito mais à direita). Não há regras definidas, você só precisa olhar os dados e ver o que faz sentido.

Exemplo de gráfico de haste ( PageIndex <1> ) para distribuição de notas

A seguir estão as notas percentuais de 25 alunos de um curso de estatística. Desenhe um gráfico de tronco dos dados.

Tabela ( PageIndex <1> ): Dados das notas de teste
62 87 81 69 87 62 45 95 76 76
62 71 65 67 72 80 40 77 87 58
84 73 93 64 89

Divida cada número de forma que o dígito das dezenas seja o caule e o dígito da unidade seja a folha. 62 torna-se 6 | 2.

Faça um gráfico vertical com as hastes à esquerda de uma barra vertical. Certifique-se de preencher todas as hastes ausentes. Em outras palavras, as hastes devem ter espaçamento igual (por exemplo, contar por unidades ou contar por dezenas). O Gráfico 2.3.1 mostra as hastes para este exemplo.

Figura ( PageIndex <1> ): Gráfico de tronco para notas de teste, etapa 1

Agora vá até a lista de dados e adicione as folhas. Coloque cada folha ao lado de sua haste correspondente. Não se preocupe com a ordem, mas apenas abaixe todas as folhas.

Quando o valor de dados 62 é colocado no gráfico, ele se parece com o gráfico em Gráfico 2.3.2.

Figura ( PageIndex <2> ): Gráfico de tronco para notas de teste, etapa 2

Quando o valor de dados 87 é colocado no gráfico, ele se parece com o gráfico em Gráfico 2.3.3.

Figura ( PageIndex <3> ): Gráfico de tronco para notas de teste, etapa 3

Preenchendo o restante das folhas para obter a parcela em Gráfico 2.3.4.

Figura ( PageIndex <4> ): Gráfico de tronco para as notas de teste, etapa 4

Agora você precisa adicionar rótulos e deixar o gráfico bonito.Você precisa adicionar um rótulo e classificar as folhas em ordem crescente. Você também precisa dizer às pessoas o que os caules e as folhas significam ao inserir uma legenda. Tenha o cuidado de alinhar as folhas em colunas. Você precisa ser capaz de comparar os comprimentos das linhas ao interpretar o gráfico. O gráfico-tronco final para os dados da nota do teste está em Gráfico 2.3.5.

Figura ( PageIndex <5> ): Gráfico de tronco para notas de teste

Agora você pode interpretar a exibição de caule e folha. Os dados são bimodais e um tanto simétricos. Não há lacunas nos dados. O centro de distribuição gira em torno de 70.

Você pode criar um gráfico de caule e folha em R. o comando é:

caule (variável) & ndash cria um gráfico de caule e folha, se você não obtiver um gráfico de caule que mostre todos os caules, use escala = um número. Ajuste o número até ver todas as hastes. Então você teria radical (variável, escala = um número)

Por exemplo ( PageIndex <1> ), o comando seria

graus & lt-c (62, 87, 81, 69, 87, 62, 45, 95, 76, 76, 62, 71, 65, 67, 72, 80, 40, 77, 87, 58, 84, 73, 93, 64, 89)
caule (notas, escala = 2)

O ponto decimal é 1 dígito (s) à direita do |

Agora é só colocar um título no enredo de raiz


Método

Participantes

Examinamos dados de 1.056 alunos da 7ª série (530 homens, 526 mulheres) do estado de Michigan, nos Estados Unidos. Nota de rodapé 1. A idade média dos alunos foi de 12,12 anos (mínimo = 10 anos, máximo = 14 anos). Os alunos eram de 26 salas de aula diferentes em 11 escolas e eram predominantemente de origem branca / não hispânica (91,4% branco / não hispânico, 2,5% negro / afro-americano, 1,7% índio americano / nativo do Alasca, 1% asiático / asiático-americano, 1,5% hispânico / hispano-americano e 2,0% multirracial). Antes da participação dos alunos no estudo, os pais ou responsáveis ​​receberam uma carta descrevendo a pesquisa e um formulário para preencher e devolver aos pesquisadores se eles não desejassem que os dados de seus filhos fossem incluídos no estudo. O estudo foi conduzido sob a orientação do Comitê de Revisão Institucional da Universidade de Cincinnati.

Medida de habilidades espaciais

O instrumento de habilidades espaciais administrado neste estudo foi uma medida de vinte itens criada usando itens de dois testes psicométricos de habilidades espaciais, o Teste de Aptidão Diferencial: Relações Espaciais (DAT: SR Bennett, Seashore, & amp Wesman, 1973) e o Purdue Spatial Visualization Teste: Rotações (PSVT: R Guay, 1977). O DAT: SR é um subteste do Teste de Aptidão Diferencial (DAT), um teste de habilidades cognitivas padronizado nos EUA com alunos de 13 a 18 anos de idade (Lynn, 1992). Os dez problemas do DAT: SR avaliaram as habilidades dos alunos em dobramento mental, exigindo que os participantes vissem uma figura 2D com várias marcas de identificação em várias faces e pedindo aos participantes que selecionassem o objeto 3D construído quando a figura 2D é dobrada (Bennett et al. , 1973). O PSVT: R é um subteste do Purdue Spatial Visualization Test (PSVT) - uma bateria de testes que mede várias habilidades espaciais. Os dez problemas do PSVT: R avaliaram as habilidades dos alunos em rotação mental. Para cada item, os participantes viram duas imagens de um objeto, uma em sua posição original e outra depois de girado. Eles então selecionaram o emparelhamento correto para um conjunto análogo de objetos girados da mesma maneira que o primeiro conjunto. Os participantes tiveram 14 minutos para completar a medida espacial completa de 20 itens. Cada item correto recebeu um ponto de alfa de Cronbach para esta medida foi de 0,67.

Outras medidas

Questionário de motivação matemática (MMQ)

O MMQ é um questionário de autoavaliação que mede os alunos motivação para aprender matemática adaptado do Science Motivation Questionnaire (SMQ) de Glynn et al. (2007). Glynn et al. (2009) criaram a SMQ para estudar os alunos motivação para aprender ciências. No estudo dos alunos motivação para aprender ciências, “Os pesquisadores examinam por que os alunos se esforçam para aprender ciências, com que intensidade eles se esforçam e quais crenças, sentimentos e emoções os caracterizam no processo” (p. 128). Neste estudo, adaptamos a SMQ para examinar os alunos motivação para aprender matemática, ou o nível em que os alunos se esforçam para aprender o domínio matemático, alterando a palavra “ciência” para a palavra “matemática” em cada um dos itens.

Escolhemos o MMQ porque abrange a amplitude de construções motivacionais potencialmente relevantes para o desempenho em matemática de alunos do ensino médio. Uma vez que nenhum trabalho de nosso conhecimento foi conduzido examinando a ligação entre habilidades espaciais e motivação matemática especificamente, não tínhamos insights anteriores sobre quais fatores motivacionais estariam relacionados a habilidades espaciais. Dessa forma, optou-se por utilizar um instrumento que inclui múltiplos construtos motivacionais. Além disso, a SMQ foi desenvolvida para uso com alunos de graduação matriculados em cursos não científicos, o que significa que foi desenvolvida para um público geral, semelhante ao que seria esperado em um ambiente de classe do ensino médio.

Os seis construtos medidos pelo MMQ são aprendizagem matemática intrinsecamente motivada (α = .78), aprendizagem matemática motivada extrinsecamente (α = .63), relevância da aprendizagem matemática para objetivos pessoais (ou seja, relevância pessoal α = .83), responsabilidade por aprender matemática (ou seja, autodeterminação α = .57), confiança em aprender matemática (ou seja, autoeficácia α = 0,86), e ansiedade sobre avaliação matemática (baixa ansiedade matemática α = 0,73). O MMQ inclui 30 itens (α = 0,90). Para cada item, os participantes escolheram uma resposta em uma escala de 5 pontos variando de 1 (nunca) a 5 (sempre). O preenchimento do questionário não foi cronometrado. Os itens do MMQ e sua correspondência com os construtos motivacionais estão listados no Apêndice.

A pontuação dos participantes no MMQ foi a soma de todas as seis pontuações do construto. As pontuações variaram de 30 a 150 pontuações mais altas indicam maior motivação para aprender matemática. Concentramos nossas análises na pontuação total dos alunos no MMQ por causa do bom conteúdo da medida e validade de critério encontrada em pesquisas anteriores (Glynn et al., 2007, 2009), bem como a alta confiabilidade da medida em nosso conjunto de dados (α = 0,90). Os itens que medem a ansiedade sobre a avaliação matemática foram pontuados de forma reversa, portanto, pontuações mais altas corresponderam a uma ansiedade mais baixa para esse subconjunto específico. Assim, nos referimos a esse construto como baixa ansiedade matemática neste artigo. Antes de calcular as pontuações totais, os dados foram selecionados para avaliações incompletas e as não respostas aos itens foram identificadas. Os dados dos participantes que responderam a menos de 20 dos 30 itens totais foram excluídos de análises adicionais, pois inferir mais de um terço das respostas poderia levar a viés nos resultados (por exemplo, Dong & amp Peng, 2013 Jakobsen, Gluud, Wetterslev, & amp Winkel, 2017). Para os demais participantes, as não respostas aos itens foram tratadas da seguinte maneira: as pontuações dos construtos foram calculadas tomando a média das respostas incluídas e multiplicando-a por cinco. Esse método foi usado para evitar mais perda de informações devido à exclusão listwise e à introdução de erro resultante da imputação de valor ausente (Cheema, 2014).

Teste do aluno de Michigan para o progresso educacional (M-STEP) Matemática (Departamento de Educação de Michigan, 2017)

O subteste de matemática M-STEP é uma medida em uma bateria de avaliações padronizadas dadas a todos os alunos de Michigan perto do final do ano letivo da terceira à oitava série para avaliar o domínio dos padrões estaduais (Departamento de Educação de Michigan, 2017). Examinamos a pontuação do subteste de matemática M-STEP da sexta série para minimizar o grau em que os perfis cognitivos dos alunos podem ter mudado devido às experiências acadêmicas entre o momento das avaliações. Apenas a pontuação geral no subteste de matemática M-STEP foi usada em nosso estudo. Itens de amostra da avaliação estão disponíveis para visualização e prática no site do Departamento de Educação de Michigan: https://www.michigan.gov/mde/0,4615,7-140-22709_70117-350540--,00.html (Michigan Departamento de Educação, 2019).

Média de notas em ciências (GPA)

Ciência GPA é o desempenho médio calculado de um aluno em sua aula de ciências da sexta série, que varia de zero a 4,33 pontos. Como as avaliações de ciências do ensino médio dependem fortemente da memorização dos alunos de informações científicas apresentadas por meio de palestras e em livros didáticos (Stern & amp Ahlgren, 2002), usamos o GPA de ciências como um indicador do nível de habilidade acadêmica dos alunos.

Procedimento

Os professores de matemática e ciências do sétimo ano administraram a medida espacial e o MMQ a seus alunos no início do ano letivo. Nota de rodapé 2. Antes de administrar as avaliações, os professores lêem em voz alta um roteiro informando os alunos sobre o propósito do teste e suas proteções como participantes da pesquisa. Os professores foram solicitados a administrar as avaliações ao longo de 2 dias em uma ordem que foi atribuída aleatoriamente.


Uso de Desvio Padrão

Um dos usos do desvio padrão é descrever como uma população é distribuída usando o Teorema de Chebyshev & rsquos. Este teorema funciona para qualquer distribuição, seja enviesada, simétrica, bimodal ou qualquer outra forma. Dá uma ideia de quantos dados estão a uma certa distância em cada lado da média.

Definição ( PageIndex <6> ): Teorema de Chebyshev

Exemplo ( PageIndex <4> ): Usando o Teorema de Chebyshev

O US Weather Bureau forneceu as informações em Example ( PageIndex <7> ) sobre o número anual total de tornados fortes a violentos (F3 +) relatados nos Estados Unidos nos anos de 1954 a 2012. (& quotU.S. Tornado climatologia, & quot 17).

  1. Use o teorema de Chebyshev & rsquos para encontrar um intervalo centrado no número médio anual de tornados fortes a violentos (F3 +) nos quais você esperaria que caíssem pelo menos 75% dos anos.
  2. Use o teorema de Chebyshev & rsquos para encontrar um intervalo centrado no número médio anual de tornados fortes a violentos (F3 +) nos quais você esperaria que caísse pelo menos 88,9% dos anos.

uma. Variável: (x = ) número de tornados fortes ou violentos (F3 +) O teorema de Chebyshev & rsquos diz que pelo menos 75% dos dados cairão no intervalo de ( mu-2 sigma ) a ( mu + 2 sigma ).

Você não tem a população, portanto, você precisa estimar a média e o desvio padrão da população usando a média e o desvio padrão da amostra. Você pode encontrar a média da amostra e o desvio padrão usando a tecnologia:

( overline aproximadamente 46,24, s aproximadamente 22,18 )

( mu aproximadamente 46,24, sigma aproximadamente 22,18 )

Como você pode & rsquot ter um número fracionário de tornados, arredonde para o número inteiro mais próximo.

Pelo menos 75% dos anos têm entre 2 e 91 tornados fortes a violentos (F3 +). (Na verdade, todos os valores exceto três anos & rsquo caem neste intervalo, o que significa que ( dfrac <56> <59> aproximadamente 94,9 \% ) realmente caem no intervalo.)

b. Variável: (x = ) número de tornados fortes ou violentos (F3 +) O teorema de Chebyshev & rsquos diz que pelo menos 88,9% dos dados cairão no intervalo de ( mu-3 sigma ) a ( mu + 3 sigma ).

Como você pode & rsquot ter um número negativo de tornados, o limite inferior é na verdade 0. Como você pode & rsquot ter um número fracionário de tornados, arredonde para o número inteiro mais próximo.

Pelo menos 88,9% dos anos têm entre 0 e 113 tornados fortes a violentos (F3 +).

(Na verdade, apenas um ano cai neste intervalo, o que significa que ( dfrac <58> <59> approx 98,3 \% ) realmente cai no intervalo.)

O Teorema de Chebyshev & rsquos diz que pelo menos 75% dos dados estão dentro de dois desvios padrão da média. Essa porcentagem é bastante alta. Não há muitos dados fora de dois desvios-padrão. Uma regra que pode ser seguida é que se um valor de dados estiver dentro de dois desvios padrão, então esse valor é um valor de dados comum. Se o valor dos dados estiver fora de dois desvios padrão da média, acima ou abaixo, o número é incomum. Pode até ser chamado de incomum. Um cálculo fácil que você pode fazer para descobrir é encontrar a diferença entre o ponto de dados e a média e, em seguida, dividir essa resposta pelo desvio padrão. Como uma fórmula, isso seria

Se você não souber a média da população, ( mu ), e o desvio padrão da população, ( sigma ), use a média da amostra, ( overline), e o desvio padrão da amostra, (s ), para estimar os valores dos parâmetros da população. No entanto, perceba que usar o desvio padrão da amostra pode não ser muito preciso.

Exemplo ( PageIndex <5> ) determinando se um valor é incomum

  1. Em 1974, havia 131 tornados fortes ou violentos (F3 +) nos Estados Unidos. Este valor é incomum? Por que ou por que não?
  2. Em 1987, havia 15 tornados fortes ou violentos (F3 +) nos Estados Unidos. Este valor é incomum? Por que ou por que não?

uma. Variável: (x = ) número de tornados fortes ou violentos (F3 +)

Para responder a esta pergunta, primeiro encontre quantos desvios-padrão 131 está da média. Por exemplo ( PageIndex <4> ), sabemos ( mu approx 46,24 ) e ( sigma approx 22,18 ). Para (x = 131 ),

Como esse valor é maior que 2, é incomum ter 131 tornados fortes ou violentos (F3 +) em um ano.

b. Variável: (x = ) número de tornados fortes ou violentos (F3 +) Para esta questão, o (x = 15 ),

Como esse valor está entre -2 e 2, não é incomum ter apenas 15 tornados fortes ou violentos (F3 +) em um ano.


Estatisticas

Que tipo de argumento pode ser logicamente extraído da pergunta de pesquisa?

Que tipo de evidência preciso para sustentar o argumento?

Como essa evidência pode ser coletada?

R ^ 2 representa a fração de variabilidade em y que pode ser explicada pela variabilidade em X.

Usado com dados de intervalo ou proporção.

Mede a força e a direção de uma relação linear entre as variáveis ​​X e Y. Esta é a medida usual de associação que varia de -1 a 1.

A significância estatística de r é testada usando um teste t.

Um valor de p baixo para este teste significa que há evidências para rejeitar a hipótese nula em favor da hipótese alternativa ou que há uma relação estatisticamente significativa entre as duas variáveis.

Isso fornece o coeficiente de correlação para dados classificados.

Quanto mais próxima a correlação estiver de +1 ou -1, mais forte será a correlação.

Se a correlação for 0 ou muito próxima de 0, então não há relacionamento

Em um estudo descritivo, nenhuma tentativa é feita para mudar o comportamento ou as condições - você mede as coisas como elas são.

Caracterizado pela determinação de relações de causa e efeito entre duas ou mais variáveis.

No nível mais básico, os experimentos envolvem a introdução da variável independente e, em seguida, observar ou medir as consequências.

O design garante que haja controle para todas as variáveis ​​que podem influenciar o resultado, exceto para as diferenças no tratamento.

Dois elementos essenciais necessários para o controle máximo de ameaças à validade interna: randomização e um grupo de controle

Os assuntos são combinados em uma ou mais variáveis, como aptidão ou pontuação de leitura, que presumivelmente têm uma alta correlação com o DV.

O pesquisador usa as pontuações para identificar pares de alunos que obtiveram pontuações idênticas ou quase idênticas na medida selecionada.

Semelhante aos projetos experimentais randomizados, pois envolvem a manipulação de um FI, mas diferem no sentido de que os sujeitos não são atribuídos aleatoriamente a grupos de tratamento.

Como os projetos quase experimentais não fornecem controle total, é extremamente importante que os pesquisadores estejam cientes das ameaças à validade interna e externa.

Ex. Estudar um programa de matemática pode exigir o uso de classes existentes da quarta série e fazer de um grupo experimental e um grupo de controle.

Este método é freqüentemente usado em vez do projeto experimental para testar hipóteses sobre causa e efeito porque, em muitos casos, seria antiético manipular a variável independente.

Esta é talvez a forma mais dominante de coleta de dados nas ciências sociais, proporcionando uma coleta eficiente de dados sobre amplas populações, passível de administração presencial, por telefone ou pela Internet. Algumas formas de pesquisa por telefone ou pela Internet podem ser totalmente automatizadas.

Este projeto é frequentemente considerado análogo à abordagem qualitativa.

2) próprias práticas do educador-pesquisador - examine suas próprias práticas

3) Colaboração - envolvendo outros co-participantes da pesquisa

4) Processo dinâmico - indo e voltando com as iterações de atividades

5) Plano de ação - desenvolve um plano em resposta a um problema

Este procedimento é usado para desenvolver a teoria

Inclui coletar principalmente dados de entrevistas, desenvolver e relacionar categorias de informações e compor uma figura que retrate a aplicação geral.

Nesse tipo de pesquisa, o pesquisador fornece uma imagem detalhada do grupo de compartilhamento de cultura, valendo-se de várias fontes de informação.

É um procedimento qualitativo no qual pesquisadores descrevem a vida de indivíduos, coletam e contam histórias sobre a vida desses indivíduos e escrevem narrativas sobre suas experiências.

Concentra-se mais na utilidade de procedimentos na abordagem de problemas práticos em escolas e em sala de aula.

Assume uma população normal

Assume homogeneidade de variância

Usa testes como teste t, ANOVA, R de Pearson

Assume que as pontuações são amostradas aleatoriamente, a distribuição da amostra da média é normal e as variâncias dentro do grupo são homogêneas.

Usa testes como Chi Square

O IV teve um efeito real e que o resultado não prova que a hipótese é verdadeira, mas sim que é uma instância em que a hipótese escapou à desconfirmação.

Se o IV não produz uma mudança no VD, ele não tem efeito e os pesquisadores concluem que o IV não tem um efeito real.

Assim, diminuir o alfa (tornando o alfa mais rigoroso) causa uma diminuição na potência. Ao diminuir o alfa, o pesquisador torna mais difícil rejeitar falsamente o nulo. Em termos simples, o valor p do critério para rejeitar a hipótese nula. Quando isso é diminuído, aumenta a probabilidade de rejeitar o nulo quando é de fato verdadeiro.

2) Número de disciplinas:
Existe uma relação direta entre N e potência. Em termos simples, o aumento de N causa um aumento na potência.

Na maioria das vezes, o parâmetro estimado é a média da população. A estimativa do parâmetro da população é calculada como um intervalo de valores, em vez de um único valor.

Este intervalo, ou intervalo de confiança, pode ser muito pequeno ou relativamente grande

Como a estimativa é baseada em uma amostra, o processo de estimativa é impreciso.As amostras devem refletir a população da qual foram retiradas. Nota: Nem todas as amostras retiradas da mesma população serão iguais entre si ou com a população. A dissimilaridade é devido ao erro de amostragem. O erro de amostragem ocorre sempre que uma amostra é retirada de uma população.

Tanto a estimativa quanto o teste de hipóteses são estatísticas inferenciais. O objetivo de ambas as estatísticas é fazer uma inferência sobre a população com base nas informações obtidas na amostra.


Para os 619 motoristas da amostra, uma porcentagem maior de homens estava bêbada do que de mulheres (16,0% vs. 11,6%). Nossos dados, em outras palavras, fornecem algumas evidências de que dirigir embriagado está relacionado ao gênero; no entanto, isso por si só não é suficiente para concluir que tal relação existe na maior população de motoristas com menos de 20 anos. Precisamos investigar mais os dados e decidir entre os seguintes dois pontos de vista:

  • A evidência fornecida pela pesquisa na estrada (16% vs. 11,6%) é forte o suficiente para concluir (além de uma dúvida razoável) que deve ser devido a uma relação entre dirigir embriagado e gênero na população de motoristas com menos de 20 anos.
  • A evidência fornecida pela pesquisa na estrada (16% vs. 11,6%) não é forte o suficiente para fazer essa conclusão e pode ter acontecido por acaso devido à variabilidade da amostragem, e não necessariamente porque existe uma relação na população.

Na verdade, esses dois pontos de vista opostos constituem as hipóteses nula e alternativa do teste qui-quadrado para independência, então agora que entendemos nosso exemplo e o que ainda precisamos descobrir, vamos apresentar o processo de quatro etapas deste teste.

O Teste Qui-Quadrado de Independência

O teste de independência do qui-quadrado examina nossos dados observados e nos diz se temos evidências suficientes para concluir, além de qualquer dúvida razoável, que duas variáveis ​​categóricas estão relacionadas. Muito parecido com a parte anterior do teste F ANOVA, vamos apresentar as hipóteses (etapa 1) e, em seguida, discutir a ideia por trás do teste, que naturalmente levará à estatística de teste (etapa 2).

Etapa 1: Declarando a Hipótese

  • Ho: Não há relação entre as duas variáveis ​​categóricas. (Eles são independentes.)
  • Ha: Existe uma relação entre as duas variáveis ​​categóricas. (Eles não são independentes.)

Em nosso exemplo, as hipóteses nula e alternativa declarariam:

  • Ho: Não há relação entre gênero e dirigir embriagado.
  • Ha: Existe uma relação entre gênero e dirigir embriagado.
  • Ho: Dirigir embriagado e gênero são independentes
  • Ha: Dirigir embriagado e gênero não são independentes e, portanto, o nome & # 8220 Teste de qui-quadrado para independência. & # 8221

Etapa 2: a ideia do teste qui-quadrado

A ideia por trás do teste do qui-quadrado, assim como ANOVA, é medir a que distância os dados estão do que é reivindicado na hipótese nula. Quanto mais longe os dados estão da hipótese nula, mais evidências os dados apresentam contra eles. Usaremos nossos dados para desenvolver essa ideia. Nossos dados são representados pelas contagens observadas:

Como vamos representar a hipótese nula?

Nos testes anteriores que introduzimos, a hipótese nula era representada pelo valor nulo. Aqui não há realmente um valor nulo, mas sim uma afirmação de que as duas variáveis ​​categóricas (dirigir embriagado e sexo, neste caso) são independentes.

Para representar a hipótese nula, calcularemos outro conjunto de contagens - as contagens que esperaríamos ver (em vez das observadas) se dirigir embriagado e o sexo fossem realmente independentes (ou seja, se Ho fosse verdadeiro). Por exemplo, nós realmente observamos 77 homens que dirigiam bêbados se dirigir embriagado e o sexo fossem de fato independentes (se Ho fosse verdade), quantos motoristas bêbados do sexo masculino esperaríamos ver em vez de 77? Da mesma forma, podemos fazer o mesmo tipo de pergunta sobre (e calcular) as outras três células em nossa tabela.

Em outras palavras, teremos dois conjuntos de contagens:

Mediremos a que distância as contagens observadas estão das esperadas. Por fim, basearemos nossa decisão no tamanho da discrepância entre o que observamos e o que esperaríamos observar se Ho fosse verdadeiro.

Como são calculadas as contagens esperadas? Mais uma vez, precisamos de resultados de probabilidade. Lembre-se da seção de probabilidade que se os eventos A e B são independentes, então P (A e B) = P (A) * P (B). Usamos essa regra para calcular as contagens esperadas, uma célula de cada vez.

Aqui estão novamente as contagens observadas:

Aplicando a regra à primeira célula (canto superior esquerdo), se dirigir bêbado e o gênero forem independentes, então: P (bêbado e homem) = P (bêbado) * P (homem).

Ao dividir as contagens em nossa tabela, vemos que:

  • P (bêbado) = 93/619 e
  • P (Masculino) = 481/619, e assim,
  • P (Bêbado e Masculino) = (93/619) (481/619)

Portanto, como há um total de 619 motoristas, se dirigir embriagado e o gênero fossem independentes, a contagem de motoristas bêbados que eu esperaria ver é:

Observe que esta expressão é o produto dos totais de coluna e linha para essa célula específica, dividido pelo total geral da tabela.

Da mesma forma, se as variáveis ​​são independentes,

  • P (Bêbado e Feminino) = P (Bêbado) * P (Feminino) = (93/619) (138/619)
  • Portanto, como há um total de 619 motoristas, se dirigir embriagado e o gênero fossem independentes, a contagem de motoristas bêbados que eu esperaria ver é:
    • Contagem esperada = 619 ∗ (93/619) (138/619) = (93 ∗ 138) / 619

    Novamente, a contagem esperada é igual ao produto dos totais de coluna e linha correspondentes, dividido pelo total geral da tabela. Esse sempre será o caso e ajudará a otimizar nossos cálculos:

    Aqui está a tabela completa de contagens esperadas, seguida pela tabela de contagens observadas:

    Etapa 3: Encontrando o P-Value

    O valor p para o teste de qui-quadrado para independência é a probabilidade de obter contagens como as observadas, assumindo que as duas variáveis ​​não estão relacionadas (o que é reivindicado pela hipótese nula). Quanto menor o valor p, mais surpreendente seria obter contagens como fizemos se a hipótese nula fosse verdadeira.

    Tecnicamente, o valor p é a probabilidade de observar χ2 pelo menos tão grande quanto o observado, assumindo que não existe relação entre a variável explicativa e a variável de resposta. Usando software estatístico, descobrimos que o valor p para este teste é 0,201.

    Etapa 4: Declarando a Conclusão no Contexto

    Como de costume, usamos a magnitude do valor p para tirar nossas conclusões. Um pequeno valor de p indica que a evidência fornecida pelos dados é forte o suficiente para rejeitar Ho e concluir (além de uma dúvida razoável) que as duas variáveis ​​estão relacionadas. Em particular, se um nível de significância de 0,05 for usado, rejeitaremos Ho se o valor p for menor que 0,05.

    Um valor p de 0,201 não é nada pequeno. Não há nenhuma evidência estatística convincente para rejeitar Ho e, portanto, continuaremos a supor que pode ser verdade. Sexo e dirigir embriagado podem ser independentes e, portanto, os dados sugerem que uma lei que proíbe a venda de 3,2% de cerveja para homens e permite para mulheres é injustificada. Na verdade, a Suprema Corte, por uma maioria de 7-2, considerou a lei de Oklahoma discriminatória e injustificada. Na opinião da maioria, a Justiça Brennan escreveu:

    & # 8220Certamente, a proteção da saúde e segurança públicas representa uma função importante dos governos estaduais e locais. No entanto, as estatísticas do recurso & # 8217, em nossa opinião, não podem apoiar a conclusão de que a distinção baseada em gênero serve para atingir esse objetivo e, portanto, a distinção não pode, de acordo com a [jurisprudência anterior], resistir ao desafio de proteção igual

    Testes Post Hoc quando a variável de resposta tem dois níveis

    Para testes post hoc seguindo um qui-quadrado, usamos o que é conhecido como ajuste de Bonferroni. Como os testes post hoc usados ​​no contexto da ANOVA, esse ajuste é usado para neutralizar o problema de Erro Tipo I que ocorre quando várias comparações são feitas. Após um teste de qui-quadrado que inclui uma variável explicativa com 3 ou mais grupos, precisamos subconjunto para cada comparação pareada possível. Ao interpretar essas comparações emparelhadas, em vez de definir o nível α (valor p) em 0,05, dividimos 0,05 pelo número de comparações em pares que faremos. O resultado é nosso novo nível α. Por exemplo, se tivermos um ChiSquare significativo ao examinar a associação entre o número de cigarros fumados por dia (uma variável explicativa categórica de 5 níveis: 1-5 cigarros 6 -10 cigarros 11-15 cigarros 16-20 cigarros e & gt20) e dependência de nicotina (uma variável de resposta categórica de dois níveis - sim vs. não), queremos saber quais pares dos 5 grupos de cigarros são diferentes uns dos outros no que diz respeito às taxas de dependência de nicotina.

    Em outras palavras, faremos 10 comparações (todas as comparações possíveis). Iremos comparar o grupo 1 a 2 1 a 3 1 a 4 1 a 5 2 a 3 2 a 4 2 a 5 3 a 4 3 a 5 4 a 5. Quando avaliamos o valor p para cada um desses post hoc chi- testes quadrados, usaremos 0,05 / 10 = 0,005 como nosso alfa. Se o valor p for & lt .005, rejeitaremos a hipótese nula. Se for & gt .005, não rejeitaremos a hipótese nula.

    Testes Post Hoc quando a variável de resposta tem mais de 2 níveis

    Suponha que estejamos examinando a associação entre o Nível de Exercício Diário (nunca, uma vez por semana, duas vezes por semana e pelo menos 3 vezes por semana) e a Imagem Corporal (baixa, média, alta). Suponha ainda que tenhamos executado um teste qui-quadrado que revelou que havia uma associação significativa entre o Nível de Exercício Diário e a Imagem Corporal. Começa a ficar ainda mais complicado executar testes post-hoc! Em última análise, queremos saber quais níveis de exercício diário estão associados a imagens corporais mais altas ou mais baixas.

    Uma maneira de examinar os valores que variam é examinar os resíduos de Pearson. Pearson Residuals nos informará se estamos obtendo contagens mais altas ou mais baixas em uma categoria de resposta específica do que esperaríamos se não houvesse relacionamento. Como uma medida geral, resíduos de Pearson maiores que 2 representam contagens relativamente altas e valores menores que -2 representam contagens relativamente baixas.

    Teste de Correlação

    Q → Q é diferente no sentido de que ambas as variáveis ​​são quantitativas e, portanto, como você descobrirá, este caso exigirá um tipo diferente de tratamento e ferramentas.

    Vamos começar com um exemplo:

    Uma empresa de pesquisa da Pensilvânia conduziu um estudo em que 30 motoristas (com idades entre 18 e 82 anos) foram amostrados e, para cada um, foi determinada a distância máxima (em pés) na qual ele / ela poderia ler um sinal recém-projetado. O objetivo deste estudo foi explorar a relação entre a idade de um motorista e a distância máxima em que os sinais eram legíveis e, em seguida, usar os achados do estudo para melhorar a segurança para motoristas mais velhos. (Referência: Utts e Heckard, Mind on Statistics (2002). Fonte original: Dados coletados por Last Resource, Inc, Bellfonte, PA.)

    Uma vez que o objetivo deste estudo é explorar o efeito da idade na distância máxima de legibilidade,

    Aqui está a aparência dos dados brutos:

    Observe que a estrutura de dados é tal que para cada indivíduo (neste caso, motorista 1 & # 8230.driver 30), temos um par de valores (neste caso, representando a idade e distância do motorista & # 8217s). Podemos, portanto, pensar nesses dados como 30 pares de valores: (18, 510), (32, 410), (55, 420), & # 8230, (82, 360).

    O primeiro passo para explorar a relação entre a idade do motorista e a distância de legibilidade do sinal é criar um display gráfico informativo e apropriado. A exibição gráfica apropriada para examinar a relação entre duas variáveis ​​quantitativas é o gráfico de dispersão. Aqui está a aparência do gráfico de dispersão para esses dados:

    Interpretando o gráfico de dispersão

    Como exploramos a relação entre duas variáveis ​​quantitativas usando o gráfico de dispersão? O que devemos olhar ou prestar atenção?

    Lembre-se de que, quando descrevemos a distribuição de uma única variável quantitativa com um histograma, descrevemos o padrão geral da distribuição (forma, centro, propagação) e quaisquer desvios desse padrão (outliers). Fazemos a mesma coisa com o gráfico de dispersão. A figura a seguir resume esse ponto:

    Como a figura explica, ao descrever o padrão geral do relacionamento, observamos sua direção, forma e força.

    O direção do relacionamento pode ser positivo, negativo ou nenhum dos dois:

    UMA relacionamento positivo (ou crescente) significa que um aumento em uma das variáveis ​​está associado a um aumento na outra.

    UMA relação negativa (ou decrescente) significa que um aumento em uma das variáveis ​​está associado a uma diminuição na outra.

    Nem todos os relacionamentos podem ser classificados como positivos ou negativos.

    O Formato da relação é sua forma geral. Ao identificar a forma, tentamos encontrar a maneira mais simples de descrever a forma do gráfico de dispersão. Existem muitas formas possíveis. Aqui estão alguns que são bastante comuns:

    Os relacionamentos com uma forma linear são descritos de forma mais simples como pontos espalhados ao redor de uma linha:

    As relações com uma forma curvilínea são descritas de forma mais simples como pontos dispersos em torno da mesma linha curva:

    Existem muitas outras formas possíveis de relacionamento entre duas variáveis ​​quantitativas, mas as formas lineares e curvilíneas são bastante comuns e fáceis de identificar. Outro padrão relacionado ao formulário do qual devemos estar cientes são os clusters nos dados:

    O forçado relacionamento é determinado pela proximidade dos dados com a forma do relacionamento. Vejamos, por exemplo, os dois gráficos de dispersão a seguir que exibem relações lineares positivas:

    A força do relacionamento é determinada pela proximidade dos pontos de dados com o formulário. Podemos ver que no gráfico de dispersão superior os pontos de dados seguem o padrão linear de perto. Este é um exemplo de relacionamento forte. No gráfico de dispersão inferior, os pontos também seguem o padrão linear, mas muito menos de perto e, portanto, podemos dizer que a relação é mais fraca. Em geral, porém, avaliar a força de um relacionamento apenas olhando para o gráfico de dispersão é bastante problemático e precisamos de uma medida numérica para nos ajudar com isso. Discutiremos isso mais tarde nesta seção.

    Os pontos de dados que se desviam do padrão do relacionamento são chamados de outliers. Veremos vários exemplos de outliers durante esta seção. Dois outliers são ilustrados no gráfico de dispersão abaixo:

    Vamos voltar agora ao nosso exemplo e usar o gráfico de dispersão para examinar a relação entre a idade do driver e a distância máxima de legibilidade do sinal. Aqui está o gráfico de dispersão:

    A direção da relação é negativa, o que faz sentido no contexto, já que conforme você envelhece, sua visão enfraquece e, em particular, os motoristas mais velhos tendem a ser capazes de ler sinais apenas em distâncias menores. Uma seta desenhada sobre o gráfico de dispersão ilustra a direção negativa desta relação:

    A forma do relacionamento parece ser linear. Observe como os pontos tendem a se espalhar pela linha. Embora, como mencionamos anteriormente, seja problemático avaliar a resistência sem uma medida numérica, a relação parece ser moderadamente forte, já que os dados estão bastante dispersos ao longo da linha. Finalmente, todos os pontos de dados parecem & # 8220obedecer & # 8221 o padrão - não parece haver outliers.

    O coeficiente de correlação - r

    A medida numérica que avalia a força de uma relação linear é chamada de coeficiente de correlação e é denotada por r. Nós vamos:

    • dê uma definição da correlação r
    • discuta o cálculo de r,
    • explicar como interpretar o valor de r, e
    • fale sobre algumas das propriedades de r

    Definição: O coeficiente de correlação (r) é uma medida numérica que mede a força e a direção de uma relação linear entre duas variáveis ​​quantitativas.

    Cálculo: r é calculado usando a seguinte fórmula:

    No entanto, o cálculo da correlação (r) não é o foco deste curso. Usaremos um pacote estatístico para calcular r para nós, e a ênfase deste curso será na interpretação de seu valor.

    Interpretação e propriedades: Depois de obter o valor de r, sua interpretação com relação à intensidade das relações lineares é bastante simples, como este passo a passo ilustrará:

    Anteriormente, usamos o gráfico de dispersão abaixo para encontrar uma relação linear negativa entre a idade de um motorista e a distância máxima em que um sinal de rodovia era legível. E quanto à força do relacionamento? Acontece que a correlação entre as duas variáveis ​​é r = -0,793.

    Como r & lt 0, ele confirma que a direção do relacionamento é negativa (embora realmente não precisássemos de r para nos dizer isso). Como r é relativamente próximo de -1, isso sugere que a relação é moderadamente forte. No contexto, a correlação negativa confirma que a distância máxima na qual um sinal é legível geralmente diminui com a idade. Como o valor de r indica que a relação linear é moderadamente forte, mas não perfeita, podemos esperar que a distância máxima varie um pouco, mesmo entre motoristas da mesma idade.

    Um departamento de estatística está interessado em acompanhar o progresso de seus alunos desde o ingresso até a formatura. Como parte do estudo, o departamento tabula o desempenho de 10 alunos em um curso introdutório e em um curso de nível superior obrigatório para a graduação. Qual é a relação entre as médias dos alunos e # 8217 dos dois cursos? Aqui está o gráfico de dispersão dos dados:

    O gráfico de dispersão sugere uma relação que é positiva na direção, linear na forma e parece bastante forte. O valor da correlação que encontramos entre as duas variáveis ​​é r = 0,931, que é muito próximo de 1 e, portanto, confirma que de fato a relação linear parece muito forte.

    Avaliação de r em um teste de hipótese

    Agora que podemos interpretar os coeficientes de correlação que obtemos, queremos saber se os coeficientes de correlação indicam uma relação linear significativa.

    As hipóteses que estamos testando são:

    • H0: Não há relação linear entre X e Y (r = 0)
    • Ha: Existe uma relação linear entre X e Y (r ≠ 0)

    Como antes, um pequeno valor de p irá sugerir que há evidência suficiente para rejeitar a hipótese nula. Isso sugere que existe uma relação linear significativa entre X e Y. A saída de um teste de correlação normalmente produzirá o coeficiente de correlação da amostra (r), a estatística de teste (t) e o valor p.

    Suponha que gostaríamos de examinar a relação entre a pontuação de QI e o GPA. Começamos examinando o seguinte enredo:

    Parece haver uma relação positiva muito tênue entre as duas variáveis. Portanto, não foi surpreendente encontrar um coeficiente de correlação de r = 0,1746. Testando a relação, encontramos a seguinte saída:

    O coeficiente de correlação r = 0,1746 não é significativamente diferente de 0 (t = 0,7523, valor de p = 0,4615).Portanto, não há evidências suficientes para sugerir que haja uma relação linear entre o escore de QI e o GPA.


    Animais como modelos de humanos ou outras espécies

    Animais de laboratório são quase sempre usados ​​como modelos ou substitutos de humanos ou outras espécies. Um modelo é uma representação da coisa que está sendo modelada (o alvo). Deve ter certas características que se assemelham ao alvo, mas pode ser muito diferente de outras maneiras, algumas das quais são de pouca importância, enquanto outras podem ser de grande importância prática. Por exemplo, o coelho foi usado por muitos anos como modelo de humanos diabéticos para avaliar a potência das preparações de insulina porque estava bem estabelecido que a insulina reduz os níveis de glicose no sangue tanto em coelhos quanto em humanos. O fato de os coelhos diferirem dos humanos em muitos milhares de aspectos era irrelevante para esta aplicação específica. Este era um modelo bem validado, mas agora foi substituído por métodos químicos.

    Outros modelos podem ser menos validados e, em alguns casos, pode ser difícil, impossível ou impraticável validar um determinado modelo. Por exemplo, é amplamente assumido que muitos produtos químicos industriais que são tóxicos em uma determinada dose em animais de laboratório também serão tóxicos para humanos em aproximadamente a mesma dose após correção para escala. No entanto, geralmente não é possível testar essa suposição. Claramente, a validade de um modelo animal como um preditor da resposta humana depende de quão próximo o modelo se assemelha aos humanos para os caracteres específicos que estão sendo investigados. Portanto, a validade de qualquer modelo, incluindo modelos matemáticos, in vitro e de organismos inferiores, deve ser considerada caso a caso.


    Examinando o contrato didático quando a tecnologia portátil é permitida na sala de aula de matemática

    O uso de software de análise matemática (MAS), incluindo calculadoras científicas e gráficas portáteis, oferece uma gama de oportunidades pedagógicas. A sua utilização pode apoiar a mudança no contrato didático. O MAS pode se tornar uma fonte alternativa de autoridade na sala de aula, capacitando os alunos a explorar a variação e a regularidade, manipular simulações e vincular representações. O uso estratégico pode ajudar os alunos a direcionar sua própria aprendizagem e explorar a matemática, equipando-os para compartilhar suas descobertas com o professor e a classe com mais confiança. Este artigo oferece uma estrutura para examinar o impacto do uso de SMA no contrato didático. As aulas foram observadas em 12 turmas da 10ª série, com 12 professores diferentes novos no MAS. A tecnologia MAS foi usada com uma variedade de contratos didáticos, principalmente tradicionais. A estrutura chamou a atenção para muitas maneiras em que o ensino diferia. A análise do contrato didático deve considerar tanto o ensino de matemática quanto de habilidades tecnológicas, pois estas possuem características diferentes. Em todas as aulas, professores e alunos viram no professor a responsabilidade de ensinar habilidades tecnológicas. Os alunos viam as habilidades tecnológicas como o ponto principal da aula, mas os professores viam a aula principalmente como o ensino de matemática - uma das incompatibilidades que pode precisar de negociação para adaptar os contratos didáticos ao ensino com o MAS.

    Esta é uma prévia do conteúdo da assinatura, acesso através de sua instituição.


    Fontes de dados usadas neste relatório

    As análises apresentadas neste relatório baseiam-se principalmente no Schools and Staffing Survey (SASS) 2011–2012, no Teacher Follow-up Survey (TFS) 2012–2013 e no National Teacher and Principal Survey (NTPS) 2015–2016. As pesquisas coletam dados sobre e de professores, diretores e escolas nos 50 estados e no Distrito de Columbia.20 Todas as três pesquisas foram conduzidas pelo U.S. Census Bureau para o Departamento de Educação dos EUA. Os resultados da pesquisa estão armazenados no Centro Nacional de Estatísticas da Educação (NCES), que faz parte do Instituto de Ciências da Educação (IES) do Departamento de Educação.

    O NTPS é o SASS redesenhado, com foco em “flexibilidade, oportunidade e integração com outros dados da Secretaria de Educação” (NCES 2019). Tanto o NTPS quanto o SASS incluem questionários muito detalhados em nível de professor, escola e diretor, e o SASS também inclui questionários muito detalhados em nível de distrito escolar (NCES 2017). A pesquisa TFS, que é a fonte de dados sobre professores que permanecem ou saem, foi realizada um ano após a pesquisa SASS de 2011-2012 para coletar informações sobre emprego e status de ensino, planos e opiniões de professores no SASS. Após a primeira aplicação do NTPS, nenhum estudo de acompanhamento foi feito, o que nos impediu de realizar uma análise atualizada dos professores por status de ensino no ano seguinte ao NTPS. O NCES planeja realizar um TFS novamente no ano letivo de 2020–2021, após o NTPS de 2019–2020.

    O NTPS 2015–2016 inclui escolas públicas e licenciadas apenas, enquanto o SASS e TFS incluem todas as escolas (públicas, privadas e licenciadas) .21 Restringimos nossas análises a escolas públicas e professores em escolas públicas não regulamentadas.

    Resumo das estatísticas da educação 2018

    O Resumo das estatísticas da educação 2018 (NCES 2018) fornece “uma compilação de informações estatísticas cobrindo o amplo campo da educação americana, desde o jardim de infância até a pós-graduação.” Usamos as informações incluídas no “Capítulo 3 Educação pós-secundária”.

    Nas tabelas consultadas, as informações estão disponíveis de 1970 a 2016–2017, as quais reproduzimos em anexo. No corpo do relatório, nos concentramos nos anos acadêmicos de 2008–2009 e 2015–2016 (o primeiro ano serve como um marcador pré-recessão e nos permite compará-lo com as informações mais antigas disponíveis nos dados do Título II (veja abaixo) 2015–2016 permite-nos compará-lo com os dados NTPS mais recentes). Os valores para outros anos, incluindo os dados do SASS de 2011–2012, os dados do TFS de 2012–2013 e várias taxas de mudança, também são mostrados no apêndice. As tabelas consultadas são:


    Introdução

    Em todo o mundo, há uma enorme necessidade de mais trabalhadores com graduação em ciências, tecnologia, engenharia ou matemática (STEM). O relatório do Conselho de Consultores em Ciência e Tecnologia do Presidente dos Estados Unidos (PCAST) prevê que na próxima década aproximadamente um milhão a mais de graduados STEM acima e além do nível de graduação atual serão necessários para atender às demandas do local de trabalho dos Estados Unidos [1]. O relatório também argumenta que simplesmente aumentar a retenção de cursos STEM em 10% faria um progresso considerável no sentido de atender a essa necessidade. Projeções semelhantes foram feitas no Reino Unido [2].

    Nos Estados Unidos e em outros lugares, os cursos de matemática da faculdade e da universidade costumam funcionar como um gargalo, evitando que um grande número de alunos busque uma carreira em STEM [3–5]. Cursos introdutórios de matemática, como Cálculo I, têm sido repetidamente vinculados às decisões dos alunos de deixar os cursos STEM [6-8]. Embora o cálculo não seja o único obstáculo enfrentado por potenciais graduados em STEM dos EUA, é um dos obstáculos mais desafiadores e um primeiro passo necessário no caminho para uma carreira STEM.

    Tem havido um crescente corpo de trabalho investigando a persistência dos alunos em STEM [3–9]. Uma percepção comum é que os alunos deixam os cursos STEM por causa da baixa capacidade acadêmica e que o cálculo funciona como um curso que “elimina” os alunos matematicamente incapazes [6, 10]. No entanto, a pesquisa sugere que mudar de um curso STEM para um não-STEM não é um evento, mas um processo baseado em uma coleção de questões curriculares, instrucionais e culturais [11, 12]. Seymour e seus colegas identificaram uma série dessas questões, incluindo dificuldades conceituais, instrução ruim, preparação inadequada e barreiras linguísticas [11, 13]. Trabalhos mais recentes sugerem que uma combinação de variáveis ​​de nível de aluno (como interesse dos jovens em STEM, dados demográficos do aluno, identidade, status socioeconômico e preparação para o ensino médio), variáveis ​​de nível de instrutor (como pedagogia e relações professor-aluno) e nível de instituição variáveis ​​(como o apoio ao aluno uma vez na faculdade) juntas contribuem para a decisão de um aluno de persistir ou não no STEM [9, 12, 14-18]. A experiência de um aluno em cursos introdutórios é apenas um de uma série de fatores relacionados à decisão de persistir em um campo STEM, e cálculo é apenas um de vários desses cursos STEM introdutórios. No entanto, uma melhor compreensão de como a instrução de cálculo impacta a persistência de STEM e como diferentes populações são afetadas diferencialmente é um passo importante no aumento da força de trabalho STEM.

    Além desse “vazamento de pipeline STEM” estabelecido, várias populações saem do pipeline com taxas mais altas do que outras e, portanto, são sub-representadas no STEM em todos os estágios de carreira. As mulheres são um grupo sub-representado especialmente interessante para investigar porque representam cerca de 50% da população em geral, mas apenas 25% da força de trabalho geral STEM. Essa porcentagem varia entre disciplinas STEM específicas, com as mulheres ocupando 40% dos empregos em ciências físicas e biológicas em 2009, cerca de um quarto dos empregos em ciências da computação e matemática e apenas 14% dos empregos em engenharia [19]. Embora meninos e meninas da quarta série relatem taxas semelhantes de interesse em ciências, na décima segunda série 59% das mulheres e 70% dos homens relatam tal interesse [20]. Quando os alunos entram na faculdade, 17% das mulheres pretendem estudar uma área STEM, em comparação com 32% dos homens [21]. Estima-se que 40–60% dos alunos que começam um grau STEM realmente concluem um, e desses apenas 35% são concluídos por mulheres [21, 22]. Combinadas, essas diminuições na participação das mulheres em STEM levam às mulheres constituindo apenas 25% da força de trabalho STEM [23] (ver Fig. 1 e Tabela 1 para a derivação desta figura). Ao olhar especificamente para a academia, esses padrões persistem e, embora mais mulheres estejam entrando em cargos acadêmicos do que antes, as mulheres continuam a ser uma minoria sub-representada em muitos campos STEM [30, 31]. Estudos indicam que, embora não haja preconceito contra as mulheres na contratação de cargos de estabilidade permanente [32], as mulheres não têm as mesmas oportunidades, como cargos de pós-doutorado de elite, que os homens as ajudam a serem atraentes para os cargos acadêmicos de topo [33].


    Assista o vídeo: GRÁFICOS ESTATÍSTICOS. ESTATÍSTICA (Dezembro 2021).