Estatísticas separadas para níveis de uma variável categórica

Estatística:
É comum nos depararmos com a situação de no R termos que computar estatísticas separadas para níveis distintos de uma variável categórica. Temos em mãos um data frame, por exemplo com uma variável numérica contínua e uma variável categórica e precisamos fazer um shapiro.wilk teste de normalidade para a variável numérica separado para cada nível da variável categórica em um vetor onde estão os dados para os dois níveis.
Uma solução para isso é usar o comando by()
exemplo:
by(var.numérica, var.categórica, OQueSeDesejaFazer)
para o exemplo acima teríamos:

by(tamanho, sexo, shapiro.test)
Tentem e vejam o que terão como saída do comando 🙂
isso quebra um galho!
Usando-se a lógica podemos derivar o uso do by() apresentado para outras situações que precisarmos deste tipo de manipulação dos dados.

Abraços!

Espero que essa dica seja útil

Anúncios

Sobre Conrado

Meu interesse é no estudo do comportamento social e comunicação de lagartos. "Infófilo", entusiasta do software livre, da licença creative commons e do livre acesso da produção artística e intelectual.

Publicado em maio 17, 2011, em Dicas. Adicione o link aos favoritos. Deixe um comentário.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: