Artigos

1.6.4.3: Cores, nomes e sexos - Dados nominais


Nominal, ou categórico, os dados, ao contrário dos classificados, são impossíveis de ordenar ou alinhar. Por exemplo, se atribuirmos valores numéricos a homens e mulheres (digamos, “1” e “2”), isso não implicaria que um sexo é de alguma forma “maior” que o outro. Um valor intermediário (como “1,5”) também é difícil de imaginar. Conseqüentemente, os índices nominais podem ser rotulados com quaisquer letras, palavras ou caracteres especiais - não importa.

Métodos numéricos regulares são apenas não aplicável para dados nominais. Existem, no entanto, maneiras de contornar. O mais simples é contando, calculando frequências para cada nível de variável nominal. Essas contagens e outras medidas derivadas são mais fáceis de analisar.

Vetores de personagens

R tem várias maneiras de armazenar dados nominais. O primeiro é um vetor de caracteres (textuais):

Código ( PageIndex {1} ) (R):

(Observe a função str () novamente. deve ser usado cada vez que você lida com novos objetos!)

A propósito, para inserir cadeias de caracteres manualmente, é mais fácil começar com algo como aa <- c ("" ""), em seguida, inserir vírgulas e espaços: aa <- c ("", "") e, finalmente, inserir valores : aa <- c ("b", "c").

Outra opção é inserir scan (what = "char") e, em seguida, digitar caracteres sem aspas e vírgulas; no final, insira uma string vazia.

Suponhamos que o vetor de sexo registre os sexos dos funcionários de uma pequena empresa. É assim que R exibe seu conteúdo:

Código ( PageIndex {2} ) (R):

Para selecionar elementos do vetor, use colchetes:

Código ( PageIndex {3} ) (R):

Sim, colchetes são o comando! Eles estão acostumados a índice vetores e outros objetos R. Para o provar, corre ? "[". Outra maneira de verificar isso é com crases que permitem o uso de chamadas não triviais que são ilegais de outra forma:

Código ( PageIndex {4} ) (R):

Funções inteligentes e orientadas a objetos em R podem "entender" algo sobre o sexo do objeto:

Code ( PageIndex {5} ) (R):

A tabela de comando () conta os itens de cada tipo e produz o tabela, que é uma das poucas maneiras numéricas de trabalhar com dados nominais (a próxima seção fala mais sobre contagens).

Fatores

Mas plot () não poderia fazer nada com o vetor de caracteres (Verifica por você mesmo). Para plotar os dados nominais, devemos informar R primeiro que este vetor deve ser tratado como fator:

Código ( PageIndex {6} ) (R):

Agora plot () irá “ver” o que fazer. Ele contará itens de maneira invisível e desenhará um gráfico de barras (Figura ( PageIndex {1} )):

Código ( PageIndex {7} ) (R):

Aconteceu porque o vetor de caracteres foi transformado em um objeto de um tipo específico para dados categóricos, um fator com dois níveis:

Código ( PageIndex {8} ) (R):

Figura ( PageIndex {1} ) É assim que plot () plota um fator.

Código ( PageIndex {9} ) (R):

Em R, muitas funções (incluindo plot ()) preferem fatores a vetores de caracteres. Alguns deles podem até transformar o caráter em fator, mas outros não. Portanto, tome cuidado!

Existem alguns outros fatos a serem considerados.

Em primeiro lugar (e mais importante), os fatores, ao contrário dos vetores de caracteres, permitem uma fácil transformação em números:

Código ( PageIndex {10} ) (R):

Mas por que o feminino 1 e o masculino 2? A resposta é muito simples: porque “feminino” é o primeiro em ordem alfabética. R usa essa ordem sempre que os fatores precisam ser convertidos em números.

As razões para tal transformação tornam-se transparentes no exemplo a seguir. Suponha que também medimos os pesos dos funcionários de um exemplo anterior:

Código ( PageIndex {11} ) (R):

Podemos desejar plotar todas as três variáveis: altura, peso e sexo. Aqui está uma maneira possível (Figura ( PageIndex {2} )):

Código ( PageIndex {12} ) (R):

Figura ( PageIndex {2} ) Um gráfico com três variáveis.

Os parâmetros pch (de “imprimir caractere”) e col (de “cor”) definem a forma e a cor dos caracteres exibidos no gráfico. Dependendo do valor da variável sexo, o ponto de dados é exibido como um círculo ou triângulo e também em preto ou vermelho. Em geral, é suficiente usar qualquer forma ou cor para distinguir entre os níveis.

Observe que as cores foram impressas a partir de números de acordo com a paleta atual. Para ver quais números significam quais cores, digite:

Código ( PageIndex {13} ) (R):

É possível alterar a paleta padrão usando esta função com argumento. Por exemplo, paleta (arco-íris (8)) substituirá o padrão por 8 novas cores de “arco-íris”. Para retornar, digite palette ("default"). Também é possível criar sua própria paleta, por exemplo com a função colorRampPalette () (ver exemplos nos próximos capítulos) ou usando o pacote separado (como RColorBrewer ou cetcolor, o último permite criar perceptivamente uniforme paletas).

Como colorir o gráfico de barras da Figura ( PageIndex {1} ) em preto (feminino) e vermelho (masculino)?

Se o seu fator é feito de números e você deseja convertê-lo de volta aos números (esta tarefa não é rara!), converta-o primeiro para o vetor de caracteres e só então - para números:

Código ( PageIndex {14} ) (R):

A próxima característica importante dos fatores é que o subconjunto de um fator retém por padrão o número original de níveis, mesmo se alguns dos níveis não estiverem mais aqui. Comparar:

Código ( PageIndex {15} ) (R):

Existem várias maneiras de excluir os níveis não utilizados, por exemplo, com o comando droplevels (), com o argumento drop, ou pela transformação “para trás e para frente” (fator para caractere para fator) dos dados:

Código ( PageIndex {16} ) (R):

Terceiro, podemos pedido fatores. Vamos apresentar uma quarta variável - os tamanhos das camisetas para esses sete funcionários hipotéticos:

Código ( PageIndex {17} ) (R):

Aqui, os níveis seguem a ordem alfabética, o que não é apropriado porque queremos que S (pequeno) seja o primeiro. Portanto, devemos dizer a R que esses dados são ordenados:

Code ( PageIndex {18} ) (R):

(Agora R reconhece as relações entre os tamanhos, e a variável m.o pode ser tratada como classificado.)

Nesta seção, criamos alguns novos objetos R. Uma das habilidades a desenvolver é entender quais objetos estão presentes em sua sessão no momento. Para vê-los, você pode querer lista de objetos:

Código ( PageIndex {19} ) (R):

Se você quiser todos os objetos junto com suas estruturas, use o comando ls.str ().

Há também uma versão mais sofisticada de listagem de objetos, que relata objetos em uma tabela:

Código ( PageIndex {20} ) (R):

(Para usar Ls (), baixe asmisc.r e, em seguida, source () do disco, ou fonte do URL mencionado no prefácio.)

Ls () também é útil quando você começa a trabalhar com objetos grandes: ajuda a limpar a memória R (^ {[1]} ).

Vetores lógicos e dados binários

Dados binários (não misture com um formato de arquivo binário) são um caso especial relacionado com dados nominais e classificados. Um bom exemplo seria “sim” ou “não” como resposta a um questionário ou presença vs. ausência de algo. Às vezes, os dados binários podem ser ordenados (como com presença / ausência), às vezes não (como com respostas certas ou erradas). Os dados binários podem ser apresentados como números 0/1 ou como vetor lógico que é a sequência de valores TRUE ou FALSE.

Imagine que perguntamos a sete funcionários se eles gostam de pizza e codificamos suas respostas "sim" / "não" em VERDADEIRO ou FALSO:

Código ( PageIndex {21} ) (R):

O vetor resultante não é personagem ou fator, é lógico. Uma das características interessantes é que os vetores lógicos participam de operações aritméticas sem problemas. Também é fácil convertê-los em números diretamente com as.numeric (), bem como converter números em números lógicos com as.logical ():

Código ( PageIndex {22} ) (R):

Este é o recurso mais útil dos dados binários. Todos os outros tipos de dados, da medição ao nominal (o último é o mais útil), pode ser convertido em lógico, e lógico é fácil de converter em números 0/1:

Código ( PageIndex {23} ) (R):

Posteriormente, muitos métodos especializados, como regressão logística ou métricas de similaridade binária, estarão disponíveis até mesmo para os dados inicialmente nominais.

Por exemplo, veja como converter o vetor de sexo do personagem em lógico:

Código ( PageIndex {24} ) (R):

(Nós aplicamos expressão lógica no lado direito da atribuição usando "é igual?" operador de símbolo de dupla equação. Esta é a segunda forma numérica de trabalhar com dados nominais. Observe que 1 vetor de caracteres com dois tipos de valores tornou-se dois vetores lógicos.)

Os vetores lógicos também são úteis para indexação:

Código ( PageIndex {25} ) (R):

(Primeiro, aplicamos a expressão lógica com sinal maior para criar o vetor lógico. Em segundo lugar, usamos colchetes para indexar o vetor de alturas; em outras palavras, nós selecionado aquelas alturas que são maiores que 170 cm.)

Além de sinais maiores e iguais, existem muitos outros Operadores lógicos que permitem criar expressões lógicas em R (ver Tabela ( PageIndex {1} )):

==IGUAL
<=IGUAL OU MENOS
>=IGUAL OU MAIS
&E
|OU
!NÃO
!=NÃO IGUAL
%dentro%PARTIDA

Tabela ( PageIndex {1} ) Alguns operadores lógicos e como entendê-los.

Operadores AND e OR (& e |) ajudam a construir expressões lógicas verdadeiramente avançadas e altamente úteis:

Código ( PageIndex {26} ) (R):

(Aqui selecionamos apenas as pessoas com altura inferior a 170 cm ou peso igual ou inferior a 70 kg, essas pessoas também devem ser mulheres ou portar camisetas pequenas. Observe que o uso de parênteses permite controlar a ordem dos cálculos e também torna a expressão mais compreensível.)

As expressões lógicas são ainda mais poderosas se você aprender a usá-las junto com o comando ifelse () e o operador if (o último é frequentemente fornecido com o else):

Código ( PageIndex {27} ) (R):

(Comando ifelse () é vetorizado por isso, ele passa por várias condições ao mesmo tempo. Operador assume apenas uma condição.)

Observe o uso de chavetas nas últimas linhas. Os colchetes transformam várias expressões em uma única expressão (combinada). Quando há apenas um único comando, as chaves são opcionais. Os colchetes podem conter dois comandos em uma linha se forem separados por ponto-e-vírgula.

Referências

1. Por padrão, Ls () não produz funções. Se necessário, esse comportamento pode ser alterado com Ls (exclude = "nenhum").


Qual é a diferença entre dados nominais e ordinais?

Em estatísticas, os termos "nominal" e "ordinal" referem-se a diferentes tipos de dados categorizáveis. Para entender o que cada um desses termos significa e a que tipo de dados cada um se refere, pense na raiz de cada palavra e deixe que isso seja uma pista quanto ao tipo de dados que ela descreve. Dados nominais envolvem nomear ou identificar dados porque a palavra "nominal" compartilha uma raiz latina com a palavra "nome" e tem um som semelhante, a função de dados nominais é fácil de lembrar. Os dados ordinais envolvem colocar as informações em uma ordem, e "ordinal" e "ordem" soam semelhantes, tornando a função dos dados ordinais também fácil de lembrar.

TLDR (muito tempo não lido)

Os dados nominais atribuem nomes a cada ponto de dados sem colocá-los em algum tipo de ordem. Por exemplo, os resultados de um teste podem ser classificados nominalmente como "aprovado" ou "reprovado".

Os dados ordinais agrupam os dados de acordo com algum tipo de sistema de classificação: ele ordena os dados. Por exemplo, os resultados do teste podem ser agrupados em ordem decrescente por grau: A, B, C, D, E e F.


Ordinal

Os itens em uma escala ordinal são definidos em algum tipo de pedido por sua posição na escala. Isso pode indicar como posição temporal, superioridade, etc.

A ordem dos itens geralmente é definida pela atribuição de números a eles para mostrar sua posição relativa. Letras ou outros símbolos sequenciais também podem ser usados ​​conforme apropriado.

Os itens ordinais são geralmente categóricos, pois pertencem a uma categoria definível, como 'corredores de maratona de 1956'.

Você não pode fazer aritmética com números ordinais - eles mostram apenas a sequência.

Exemplo

A primeira, terceira e quinta pessoa em uma corrida.

Faixas de pagamento em uma organização, conforme indicado por A, B, C e D.


Que tipo de variável é a idade?

Não há pedido associado a valores em nominal variáveis. [Razão] Era está no nível de proporção de medição porque tem um valor zero absoluto e a diferença entre os valores é significativa. Por exemplo, uma pessoa de 20 anos viveu (desde o nascimento) metade do tempo de uma pessoa de 40 anos.

Da mesma forma, a idade é uma variável na pesquisa? Por exemplo, era pode ser considerado um variável Porque era pode assumir valores diferentes para pessoas diferentes ou para a mesma pessoa em momentos diferentes. Da mesma forma, o país pode ser considerado um variável porque o país de uma pessoa pode receber um valor. Variáveis nem sempre são "quantitativos" ou numéricos.

Também perguntado se a idade é uma variável categórica?

Variáveis ​​categóricas pegue valores de categoria ou rótulo e coloque um indivíduo em um dos vários grupos. Quantitativo variáveis tomar valores numéricos e representar algum tipo de medida. Em nosso exemplo médico, era é um exemplo de um quantitativo variável porque pode assumir vários valores numéricos.

A idade é uma variável categórica ou contínua?

UMA variável é dito ser contínuo se pode assumir um número infinito de valores reais. Exemplos de variável contínua estão a distância, era e temperatura.


Eixos categóricos em Python

Plotly é uma biblioteca gráfica gratuita e de código aberto para Python. Recomendamos que você leia nosso guia de primeiros passos para obter as instruções de instalação ou atualização mais recentes e, em seguida, vá para nossos tutoriais de Fundamentos de Plotly ou mergulhe direto em alguns tutoriais de gráficos básicos.

Esta página mostra exemplos de como configurar eixos cartesianos bidimensionais para visualizar dados categóricos (ou seja, dados qualitativos, nominais ou ordinais em oposição a dados numéricos contínuos). Esses eixos são um ajuste natural para gráficos de barras, gráficos em cascata, gráficos de funil, mapas de calor, gráficos de violino e gráficos de caixa, mas também podem ser usados ​​com gráficos de dispersão e gráficos de linha. A configuração de linhas de grade, carrapatos, rótulos de carrapatos e títulos de eixos em eixos logarítmicos é feita da mesma forma que nos eixos lineares.

Tipo de eixo cartesiano 2-D e autodetecção & # 182

Os diferentes tipos de eixos cartesianos são configurados por meio do atributo xaxis.type ou yaxis.type, que pode assumir os seguintes valores:

  • 'linear' (veja o tutorial de eixos lineares)
  • 'log' (veja o tutorial de plotagem de log)
  • 'data' (veja o tutorial sobre séries temporais)
  • 'categoria' veja abaixo
  • 'multicategoria' veja abaixo

O tipo de eixo é detectado automaticamente observando os dados do primeiro traço vinculado a este eixo:

  • Primeiro verifique se há multicategoria, depois data, categoria, caso contrário, o padrão é linear (o log nunca é selecionado automaticamente)
  • multicategoria é apenas um teste de forma: o array está aninhado?
  • data e categoria: requer mais de duas vezes mais datas distintas ou strings de categoria do que números distintos para escolher esse tipo de eixo.
    • Ambos testam uma amostra uniformemente espaçada de no máximo 1000 valores

    Forçando um eixo a ser categórico & # 182

    É possível forçar o tipo de eixo definindo explicitamente xaxis_type. No exemplo abaixo, o tipo de eixo X automático seria linear (porque não há mais do que duas vezes mais strings exclusivas do que números exclusivos), mas nós o forçamos a ser uma categoria.


    Conclusão

    Ao lidar com dados estatísticos, é importante saber se os dados com os quais você está lidando são nominais ou ordinais, pois essas informações ajudam a decidir como usar os dados. Um estatístico é capaz de tomar uma decisão apropriada sobre qual análise estatística aplicar a um determinado conjunto de dados com base no fato de ser nominal ou ordinal.

    O primeiro passo para a identificação adequada de dados nominais e ordinais é conhecer suas respectivas definições. Depois disso, você precisa identificar suas semelhanças e diferenças para não confundi-las durante a análise.

    Esse conhecimento é muito essencial, pois ajuda o pesquisador a determinar o tipo de dados que precisa ser coletado.


    Atividade de software

    O tipos de variáveis você está analisando relacionam-se diretamente com o disponível descritivo e inferencial Métodos estatísticos.

    • avalie como você vai medir o efeito do interesse e
    • saiba como isso determina os métodos estatísticos que você pode usar.

    À medida que avançamos neste curso, enfatizaremos continuamente o tipos de variáveis que são apropriado para cada método que discutimos.


    Tipos de escalas de medição

    Uma vez que uma escala de intervalo não tem um ponto zero verdadeiro, não faz sentido calcular proporções de temperaturas.

    • Não há sentido em que a proporção de 40 a 20 graus Fahrenheit seja a mesma que a proporção de 100 a 50 graus
    • nenhuma propriedade física interessante é preservada nas duas proporções.
    • Afinal, se o rótulo "zero" fosse aplicado na temperatura que Fahrenheit rotula como 10 graus, as duas proporções seriam 30 a 10 e 90 a 40, não mais as mesmas!
    • Por esse motivo, não faz sentido dizer que 80 graus é "duas vezes mais quente" que 40 graus.

    Escala nominal vs escala ordinal: qual é a diferença?

    A Escala Nominal e a Escala Ordinal são duas das quatro escalas de medição variáveis. Ambas as escalas de medição têm sua importância em pesquisas / questionários, pesquisas e suas análises estatísticas subsequentes. A diferença entre a escala Nominal e Ordinal tem um grande impacto nos métodos de análise de pesquisas de mercado devido aos detalhes e informações que cada uma delas tem a oferecer.

    Escala nominal é derivada da palavra latina “nomalis” que denota “relacionado a nomes”, geralmente é usada para indicar categorias. Essas categorias têm números correspondentes atribuídos para análise dos dados coletados. Por exemplo, o sexo, etnia, cor do cabelo, etc. de uma pessoa são considerados dados para uma escala nominal.

    A escala ordinal, por outro lado, envolve organizar as informações em uma ordem específica, ou seja, em comparação entre si e "classificar" cada parâmetro (variável). Por exemplo, depois que um cliente compra em um ponto de venda, ele / ela é solicitado a preencher uma pesquisa de quiosque: “Em uma escala de 1 a 5, como foi sua experiência de compra?” & # 8211

    • 1 indica extremamente insatisfatório, 2 é insatisfatório, 3 é neutro, 4 é satisfatório e 5 indica extremamente satisfatório.
    • Aqui, os dados coletados estarão em uma escala ordinal, pois há uma classificação associada a cada uma das opções de resposta, ou seja, 2 é menor que 4 e 4 é menor que 5.
    • Mas, na escala ordinal, não é obrigatório que a diferença entre 4 (satisfatório) e 2 (insatisfatório) seja igual à diferença entre 5 (extremamente satisfatório) e 3 (neutro), pois o número não é atribuído para medição quantitativa, mas é puramente para fins de marcação.

    Todo estatístico deve avaliar essa diferença precisamente como as outras duas escalas variáveis, ou seja, intervalo e razão são calculados de forma articulada. Antes de prosseguirmos com a discussão sobre escalas nominais vs ordinais, aqui está uma breve descrição dos níveis nominais e ordinais de medição.

    Nível nominal de medição: No nível nominal de medição, as variáveis ​​são diferenciadas por suas denominações. Essas variáveis ​​não têm ordem ou hierarquia associada a elas.

    Os números associados aos nomes são meras tags sem nenhum aspecto matemático associado a eles. Essas variáveis ​​são descritivas por natureza. Em termos de estatísticas, a escala nominal é a mais fácil de entender e implementar. Essas variáveis ​​têm no mínimo duas divisões como Masculino / Feminino, Sim / Não.

    Esta escala não tem valor numérico, por exemplo & # 8211 gênero, etnia, raça etc.

    Nível ordinal de medição: No nível ordinal de medição, a ordem das variáveis ​​é crítica. A diferença entre essas variáveis ​​não está estabelecida e não é um aspecto integrante desta escala de medição.

    As variáveis ​​são identificadas e descritas juntamente com a atribuição de um valor para cada uma dessas variáveis ​​identificadas. Na pesquisa de mercado, escalas ordinais são usadas para analisar percepções, escolhas e feedbacks relativos, ou seja, os profissionais de marketing podem avaliar o grau de satisfação ou felicidade do cliente, entender se seus boletins informativos devem ser publicados com mais frequência, etc.


    Exemplos e definição de dados categóricos

    No campo de estatísticas e gerenciamento de dados, pode ser fornecida uma lista enorme de exemplos de dados categóricos e aplicativos.


    Dados, no sentido científico, são um conjunto de informações coletadas para um propósito. Os dados são normalmente divididos em dois tipos diferentes: categóricos (amplamente conhecidos como dados qualitativos) e numéricos (quantitativos).

    Nesta página você aprenderá:

    • O que são dados categóricos? Definição e características principais.
    • Lista de 22 exemplos de dados categóricos.
    • Dados categóricos vs dados numéricos.
    • Infográfico em PDF

    Como você pode imaginar, dados categóricos são dados divididos em grupos ou categorias. Essas categorias são baseadas em características qualitativas, como gênero e cores ou qualquer outra coisa que não tenha um número associado a ela.

    Isso não significa que os dados categóricos não possam ter valores numéricos.

    Na verdade, os dados categóricos muitas vezes assumem valores numéricos, mas esses números não têm nenhum significado matemático. Eles apenas representam o número de itens em cada grupo. Por exemplo, 12 loiras em uma classe.

    Isso torna possível fazer análises de dados categóricos e diferentes manipulações, especialmente em um aplicativo de planilha.

    Não há ordem para valores e variáveis ​​categóricas. Em outras palavras, eles não são classificados da mais alta para a mais baixa.

    Por exemplo, não há ordem para as categorias de olhos azuis, castanhos e verdes.

    Como exibir variáveis ​​categóricas graficamente?

    Os gráficos de barras e de pizza são ótimas ferramentas para comparar dois ou mais valores categóricos entre si. Eles apenas representam o número de coisas em uma categoria.

    Por exemplo, se você deseja exibir o número de trabalhadores em uma empresa, os resultados podem ser apresentados em um gráfico de pizza ou em um gráfico de barras.

    Exemplos de dados gráficos categóricos:

    Pesquisa sobre & # 8220O que motiva os funcionários a trabalhar melhor? & # 8221

    Antes de criar um gráfico de pizza ou de barras, você deve verificar se os dados estão em contagens ou porcentagens. Para fazer uma exibição gráfica de dados categóricos, é uma condição necessária.

    A análise de dados categóricos muitas vezes inclui tabelas de dados. Os valores são representados como uma tabela bidirecional ou tabela de contingência, contando o número de itens que estão em cada categoria.

    Aqui está um exemplo de uma tabela bidirecional de dados categóricos para um grupo de 50 pessoas.

    A tabela mostra os resultados dos grupos formados pela contagem dos cabelos e cor dos olhos de cada pessoa.

    As tabelas bidirecionais e de contingência são ótimas ferramentas para ver como duas variáveis ​​categóricas estão relacionadas.

    A tabela representa a contagem ou porcentagem de pessoas que pertencem a um grupo para duas ou mais variáveis ​​quantitativas. Isso torna mais fácil encontrar diferentes relacionamentos entre os dados.

    Vamos somar o características principais de dados categóricos nós aprendemos acima:

    • Dados categóricos são dividido em grupos ou categorias.
    • As categorias são baseadas em qualitativo características.
    • nenhuma ordem a valores e variáveis ​​categóricas.
    • Os dados categóricos podem assumir valores numéricos, mas esses números não têm nenhum significado matemático.
    • Os dados categóricos são exibidos graficamente por gráficos de barras e gráficos de pizza.

    Quando se trata de exemplos de dados categóricos, pode-se fornecer uma ampla variedade de exemplos. Em nossos dados nominais vs ordinais anteriores, fornecemos muitos exemplos de variáveis ​​nominais (dados nominais são o principal tipo de dados categóricos).

    Exemplos de dados categóricos:

    • Gênero Masculino Feminino)
    • Marca de sabonetes (Dove, Olay ...)
    • Cor do cabelo (loiro, moreno, castanho, ruivo, etc.)
    • Pesquisa sobre um tópico & # 8220Você tem filhos? & # 8221 (Sim ou Não)
    • Motivos para os funcionários trabalharem melhor: (motivação dos colegas, ser reconhecido, oportunidades de crescimento profissional, cultura de trabalho, sentimento de estar envolvido, etc.)
    • Motivos para viajar (Lazer, Viagem de Negócios, Visitar Amigos e etc.)
    • Verificando o local da conta (Califórnia, Texas, Colorado & # 8230)
    • Nível educacional: (grau de associado & # 8217s, bacharelado & # 8217s, mestrado & # 8217s, doutorado e etc.)
    • Faixa etária (menos de 12 anos, 12-17 anos, 18-24 anos, 25-34 anos, 35-44 anos e etc.)
    • Etnia (hispânica, afro-americana, nativa americana, asiática, outra)
    • Cor dos olhos (verde, azul, marrom, preto)
    • Composição doméstica (solteiro, casado, viúvo, divorciado)
    • Status de emprego (empregado para receber salários, autônomo, dona de casa, estudante, aposentado e etc.)
    • Gêneros de filmes (ação, aventura, comédia, crime, mistério, drama, histórico e etc)
    • País de origem (Canadá, EUA, Austrália, Índia, Alemanha).
    • Cor do carro (vermelho, verde, cinza, preto, branco e etc.)
    • Religião (muçulmano, budista, cristão).
    • Razões para comprar um presente (aniversário, aniversário e etc.)
    • Estações (inverno, primavera, verão, outono)
    • Férias (Ação de Graças, Halloween)
    • Tipos de animal de estimação (cachorro, gato, hamster)
    • Grupos sanguíneos (Grupo A, Grupo B, Grupo AB, Grupo O).

    Quando os dados categóricos têm apenas 2 valores possíveis, eles são chamados de binários. Se usarmos os exemplos de dados categóricos acima, os resultados da pesquisa de gênero (masculino e feminino) e a pesquisa sobre um tópico & # 8220Você tem filhos? & # 8221 (Sim ou Não) são exemplos de dados binários.

    Dados categóricos e quantitativos (numéricos): diferença

    Às vezes, é difícil distinguir entre dados categóricos e quantitativos.

    Os dados quantitativos são medidos e expressos numericamente. Tem significado numérico e é usado em cálculos e aritmética.

    É por isso que o outro nome de dados quantitativos é numérico.

    Exemplos de dados quantitativos são: peso, temperatura, altura, GPA, renda anual, número de horas de trabalho e etc. Mais exemplos que você pode ver no artigo da ThoughtGo & # 8220Dados quantitativos & # 8221.

    Em comparação, os dados categóricos não têm nenhum significado numérico ou quantitativo. Ele apenas descreve as características qualitativas de algo.

    Os tipos de dados quantitativos são: ordinal, intervalo e proporção. Os dados categóricos são sempre um tipo e # 8211 o tipo nominal.

    A distinção entre variáveis ​​categóricas e quantitativas é crucial para decidir quais tipos de métodos de análise de dados usar. Os dados quantitativos são analisados ​​usando estatísticas descritivas, séries temporais, modelos de regressão linear e muito mais. Para dados categóricos, normalmente apenas métodos gráficos e descritivos são usados.

    Como você pode ver, muitos exemplos de dados categóricos podem ser fornecidos para entender o significado e o propósito dos dados qualitativos.


    Ao trabalhar com gerenciamento de dados ou ciências estatísticas, é crucial entender claramente alguns dos principais termos, incluindo dados quantitativos e categóricos e qual é o seu papel.

    É importante entender o significado da terminologia desde o início, então, quando chegar a hora de lidar com os problemas reais de dados, você será capaz de trabalhar com eles da maneira certa.

    Sobre o autor

    Silvia Valcheva

    Silvia Valcheva é uma profissional de marketing digital com mais de uma década de experiência na criação de conteúdo para a indústria de tecnologia. Ela tem uma forte paixão por escrever sobre softwares e tecnologias emergentes, como big data, IA (inteligência artificial), IoT (Internet das coisas), automação de processos, etc.

    3 comentários

    Esta foi a melhor explicação do conjunto de dados categóricos em toda a Internet.


    Assista o vídeo: Sexo cor-de-rosa no Salão Erótico 2008 (Novembro 2021).