quarta-feira, 2 de janeiro de 2019

Análise de Cluster: construindo e editando o gráfico no R


1° Carregar o pacote e importar dados
library(vegan)
dados<-read.table("arquivo.txt", h=T) #espécies nas colunas e locais nas linhas

2° Construir uma matriz com os valores de similaridade ou dissimilaridade
#Dissimilaridade: função vegdist
dist.tabela<-vegdist(dados, method="") #colocar o método entre aspas
?vegdist #verificar os argumentos da função para digitar o nome correto do método

"manhattan", "euclidean", "canberra", "clark", "bray", "kulczynski", "jaccard", "gower", "altGower", "morisita", "horn", "mountford", "raup", "binomial", "chao", "cao" or "mahalanobis"

#Similaridade: função 
dist.tabela<-dist(dados, method="") #colocar o método entre aspas 
 ?dist #verificar os argumentos da função para digitar o nome correto do método

3° Fazer o agrupamento
dendrograma<-hcluster(dist.tabela, method="") #colocar o método entre aspas
?hclust #verificar os argumentos da função para digitar o nome do correto do método

"ward.D", "ward.D2", "single", "complete", "average" (= UPGMA), "mcquitty" (= WPGMA), "median" (= WPGMC) or "centroid" (= UPGMC)

O método de ligação muda as posições dos locais,  os valores de distância e o coeficiente de correlação cofenético.

4° Plotar o gráfico
plot(dendrograma)

5° Editar o gráfico
#

#Eixos
plot("dendrograma",axes=F) #axes=F exclui os eixos
axis(1,at=c(x1,x2,x3,...,xn) #editar o eixo x, colocar os valores no x1, x2... axis(2,at=c(y1,y2,y2,...,yn)) #editar o eixo y. colocar os valores no y1, y2...

#Nomes das espécies

6° Matriz de correlação
tabelacluster.cof<-cophenetic(dendrograma) #contruir uma matriz cofenética
cor(tabelacluster.cof, dist.tabela) #correlação entre as duas matrizes
#Se o cluster apresentar coeficiente acima de 7, ele representa bem a matriz de distância

Nenhum comentário:

Postar um comentário