Analisando dados de Inquérito no Microsoft Excel: Coding, entrada de dados e criação de distribuições de freqüência


No que se segue fornecem hub um pequeno tutorial sobre como usar o Microsoft Excel para analisar dados do inquérito. Eu uso dois conjuntos de tamanho pequeno de dados, a Pesquisa de Avaliação Board eo Extrato de Pesquisa Social Geral de 2008, para ilustrar algumas técnicas básicas. Os exemplos abaixo devem ajudá-lo a se familiarizar com algumas ferramentas básicas de análise que podem ser aplicadas quando se analisa os resultados de inquéritos.

Microsoft Excel: o básico

Microsoft Excel é uma folha de cálculo com muitas características básicas que são úteis para a análise dos dados. Na folha de cálculo, cada coluna corresponde a uma letra, e cada linha corresponde a um número. A intersecção de uma fila e coluna é referido como uma célula. Ao longo da coluna de cartas é a barra de fórmula, o qual é utilizado para criar e executar cálculos em Excel. Muitos cálculos comum pode ser realizada utilizando o botão AutoSum, localizado no lado direito do ecrã.




Preparação de Dados

Codificação

Antes de levar os dados para o Microsoft Excel, eu sugiro fortemente códigos para todos (intervalo non-level/ratio) a atribuição de dados não numéricos. Para executar determinadas funções em Excel, os dados devem ser numérico. Este é também o caso de quase todos os estatísticos mais avançados pacotes de portanto, é útil obter na codificação prática.

A maioria (intervalo/nível ratio) de dados numéricos não requer codificação. Por exemplo, os dados relativos à idade (em anos) pode ser mantido como é e não deve ser re-codificado. No entanto, se os dados sobre idade foram coletadas usando o categorias/intervalo (eg. Menos de 20, 20-29, 30-39), então essas categorias/intervalos devem ser indicados os códigos numéricos.

Passo 1: Para cada pergunta da pesquisa (variável), em que a codificação é considerado adequado, determinar o número de opções únicas.

  • Es. Na subamostra GSS 2008, os entrevistados são convidados a escolher o seu "mais alto grau concluído" por uma série de cinco opções de resposta (menos de high school, o ensino médio, faculdade júnior, diploma universitário, grau). Então, sabemos que teremos de criar 5 códigos exclusivos.

Passo 2: Determinar se as opções de resposta têm uma ordem lógica (isso é quase sempre neste caso, para as variáveis ​​no nível ordinal, mas não necessariamente para as variáveis ​​no nível nominal). Em caso afirmativo, atribuir valores em conformidade.

  • Es. As opções de resposta GSS 2008 para "mais alto grau completo" pode, logicamente, ser classificados menor para o maior nível de escolaridade. Por isso, decidiu atribuir os seguintes códigos: 1 = menos do que o ensino médio, ensino médio = 2, 3 = 4 = diploma universitário júnior, 5 = pós-graduação.

* As respostas que faltam: Se uma das suas perguntas sobre a pesquisa foram deixadas sem resposta, o melhor é ir em frente e codificá-los de qualquer maneira (embora às vezes as respostas que faltam são simplesmente deixados empty-Excel não lidar bem com células vazias). Seguindo o exemplo acima GSS em 2008, apesar de alguns entrevistados não fornecem uma seleção de "alto grau" concluído, você pode criar um código adicional para representar (6 = ausente).

Entrada de Dados

Uma vez que um esquema de codificação foi criado para todas as opções de resposta correspondente a todas as perguntas da pesquisa (variáveis) obrigando-os, é hora de inserir os dados no Microsoft Excel. Os dados do Estudo de Avaliação revisor é usado para ilustrar a forma como os dados de entrada. Eu já identificaram todas as opções de resposta única e eu criei um esquema de codificação para os cinco elementos para analisar no Excel. As vozes e esquema de codificação são apresentados a seguir:

* Observe que alguns códigos na tabela acima são baseados em combinações de opções. Infelizmente, nem todas as respostas da pesquisa eram mutuamente exclusivas ou mutuamente exaustivo (ou não respondeu desta forma). Apesar de não ser ideal, foi necessário para criar e atribuir códigos adicionais para todas as combinações únicas.

Passo 1: Para cada elemento de investigação, fornecer um nome/designação no topo de cada coluna. Se você optar por fornecer os títulos das colunas que não são inerentemente significativa (eg. QI, Q2), não se esqueça de incluir uma descrição de cada item, juntamente com seus resultados de pesquisa. Se os entrevistados foram divididos estudo ID # s, listá-los na primeira coluna da planilha. Se entrevistados não foram atribuídos estudo ID # s vivamente que você atribuí-los (como eles são obrigados a usar o Excel built-in tabela de contingência). Para levantamento Ranking Colégio de dados, eu escolhi os seguintes títulos das colunas, e listei ID Estudo # s nas linhas:

Etapa # 2: Agora que as colunas do papel devidamente rotulados, é hora de inserir os dados. Os dados de cada participante deve ser inserido na linha correspondente à sua ID # Study. Lembre-se de implementar o sistema de codificação durante a entrada de dados. Na primeira imagem abaixo eu ter fornecido os dados de pesquisa coletados por um dos participantes da pesquisa (ID # 1). Na segunda imagem que mostra todo o conjunto de dados, os dados para esta entrevista é na primeira fila diretamente abaixo os títulos das colunas (esta linha é destacada em azul). Tenho também incluiu o sistema de codificação para cada pesquisa item abaixo sua coluna correspondente na planilha.

levantamento de dados para Reclamado # 1

Imagem 2: planilha com todos os dados (Reclamado # 1 de respostas codificadas destacada em azul)

Analise os dados

Uma vez que todos os dados da pesquisa foi inserido na planilha podemos começar nossa análise. Análise técnica e apresentação dos dados da pesquisa são apresentados no restante deste tutorial.

As distribuições de freqüência

As distribuições de freqüência são uma maneira útil para apresentar e interpretar os dados. A distribuição de frequência é um mostrador numérico que indica o número de casos, e usualmente a percentagem de casos (frequências relativas), correspondendo a cada valor ou grupo de valores de uma variável (definição de Schutt p. 454).

Para ilustrar, vou começar com a criação de uma distribuição do colégio N.1 frequência/Colégio TripAdvisor Pesquisa da universidade Ranking Task # 1. Neste artigo, os entrevistados são convidados a classificar as faculdades/universidades para as suas características de perfil. Símbolos foram dadas em vez de nomes. Optei por incluir apenas # 1 entrevistados seleção.

Os dados relativos a esta variável está na planilha do Excel na coluna D intitulado "alto escalão (símbolos)." Vamos trabalhar através da criação de distribuição de freqüência passo-a-passo. São ambos manual fornecido instrução (com cálculos manuais) e as instruções específicas do Excel (usando fórmulas) (se aplicável). O método escolhido para analisar os dados são susceptíveis de ser influenciada pelo tamanho do conjunto de dados e a sua perícia no Excel.

Passo 1: Escolha um local na planilha do Microsoft Excel para criar a sua distribuição de freqüência. Dê um título à sua distribuição de freqüência. Incluir "Valor", "Frequency" e "Percentual" nos títulos das colunas. De acordo com as opções de resposta lista "valor" é único. Mesmo que os valores tenham sido códigos re-atribuídas, apresentá-los na forma de texto em sua distribuição de freqüência. Incluir "Total" na célula abaixo do seu último valor.

  • Es. Eu escolhi para construir a distribuição de freqüência na mesma planilha como os resultados da pesquisa, de acordo com os dados inseridos e esquema de codificação. Você vai começar na célula B18. Eu fornecer o título "A distribuição de freqüência de alto escalão (símbolos)." I incluem o "Valor", "Frequency" e "Percentual" nos cabeçalhos das colunas. Em "Valor", você lista todas as quatro opções de resposta levantamento exclusivo (Harvard, Yale, MIT, Brandeis) em forma de texto. Estou anexando uma célula para "Total".

Fase 2 (cálculo manual): Conte o número de vezes que cada valor ocorre na folha de dados e introduzir na coluna "Frequência" ao lado do valor correspondente. Inclui a soma das frequências ao lado "Total".

  • Es. (Manual de Cálculo) Retornando a dados da folha de Coluna D (linhas 2-9), eu conto manualmente que "Harvard" (codificados como: 1) foi escolhido como o mais alto escalão três vezes. "Yale" (codificados como 2) foi escolhido por 3 vezes. "MIT" (codificados como 3) foi escolhida uma vez. "Brandeis" foi escolhida uma vez. Dentro dessas contagens na planilha no "freqüência". Nós carregamos as freqüências adicionadas (+ 8) ao lado de "Total".

Passo Alternativa # 2 (usando fórmulas): Para grandes conjuntos de dados, contando com a mão o número de vezes que um valor ocorre pode não ser viável. Felizmente, a Microsoft Excel tem uma função que vai fazer isso por você. A fórmula assume a forma = COUNTIF (variação de critérios). Para usar este recurso, a sua distribuição de freqüência deve estar na mesma planilha como seus dados.

  • Es (usando fórmulas):. Retornando a folha de dados, vemos que os dados sobre o posto mais alto é na coluna D, linhas 2-9. A nossa gama pode ser especificado como D2: D9 (que se traduz literalmente como células de D2 para D9, ou seja, dois pontos "a"). O nosso critério é o número correspondente a um valor específico. Critérios sempre deve ser especificado entre aspas. Para Harvard, nossos critérios é "1" (o seu número de código). Clique na célula que corresponde à frequência de Harvard (C20), digite a fórmula = COUNTIF (D2: D9, "1") e pressione enter. A frequência de Harvard (3) é calculado para nós. Fórmulas para cada valor adicional deve ser construído e entrou em sua célula correspondente. Nunca se esqueça do sinal = (ou a fórmula não será executado).

Uma vez que todas as freqüências foram calculados você pode ter soma Excel das freqüências para o uso de "Sum" (Σ). Frequências destacando para todos os valores de (neste caso existem quatro delas está localizada em células C20 através C23). Para selecionar todos os valores, basta clicar sobre a célula C20, mantenha pressionado o botão do mouse e arraste a caixa que aparece no-C23 inferior. Clique na seta suspensa ao lado do botão "AutoSoma" (Σ). Após clicar em "soma", o cálculo aparece na célula diretamente abaixo a seleção padrão, neste caso, ao lado de "Total".

Etapa # 3 (cálculo manual): Calcule a porcentagem correspondente à frequência para cada valor. Para fazer isso, divida a frequência para cada valor de a frequência total e a percentagem em introduzir a folha. Mesmo Somando as percentagens (deve ser igual a 100%).

  • Ex (cálculo Manual):. Harvard tem uma freqüência de 3. Se você dividir a freqüência de Harvard (3) para a freqüência total (8), obtém-se um percentual de 37,5% para Harvard. Yale: 3/8 = 37,5%. MIT: 1/8 = 12,5%. Brandeis: 1/8 = 12,5%. As percentagens somam 100%. Os cálculos são mostrados na tabela.

Passo Alternativa # 3 (usando fórmulas): Em vez de calcular as percentagens usando uma calculadora, nós também somos capazes de fazer cálculos básicos utilizando fórmulas em Excel (semelhante à ilustração da utilização de fórmulas no Passo Alternativa # 2).

  • . Es (O uso de fórmulas): Se tivéssemos que escolher células D6 poderíamos calcular o percentual de entrar Harvard = 3/8 (/ é o símbolo da divisão em Excel) na barra de fórmulas e pressione Enter. Percentagens de Yale, MIT e Brandeis também calculado usando fórmulas de acordo. Uma vez que todos os quatro percentagens são obtidos, pode-se destacar e somados utilizando a função Sum automaticamente, assim como na etapa # 2 alternativo.

Etapa # 4 (cálculo manual): ". Percentual acumulado" Em muitas distribuições de freqüência é usada para incluir uma coluna para a porcentagem acumulada é simplesmente um "registro ativo" de porcentagens. Embora, muitas vezes, faz mais sentido para variáveis ​​ordinais de nível e intervalo de razão, podemos calcular que para cada distribuição de freqüência, se desejar.

  • Es. Adicionar uma coluna para "porcentagem acumulada" ao lado de "share". Para o primeiro valor (neste caso de Harvard), é suficiente para re-introduzir na célula correspondente na coluna "percentagem cumulativa". Para calcular a segunda porcentagem acumulada, você deve adicionar o percentual correspondente ao primeiro valor (Harvard - 37,5%), o percentual correspondente ao segundo valor (Yale - 37,5%) para um total de 75%. Para calcular a percentagem de terceiro, adicionar as percentagens correspondentes aos dois primeiros valores para o terceiro valor. Continue esse processo. Sua mesa final deve ficar assim:

* Como ler percentual acumulado: 37,5% dos entrevistados escolheram Harvard como suas classificações superiores. 75% dos entrevistados escolheram ou Yale ou Harvard como suas classificações superiores. 87% dos entrevistados escolheram MIT, Yale, Harvard ou como suas classificações superiores. 100% dos entrevistados escolheram Brandeis, MIT, Yale, Harvard ou como suas classificações superiores. Embora o percentual acumulado não é particularmente significativo, neste caso, muitas vezes é útil para incluir para as variáveis ​​que incluem opções de respostas classificadas.

(0)
(0)

Comentários - 0

Sem comentários

Adicionar um comentário

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Caracteres restantes: 3000
captcha