#=======================================================================
# Testes de hipótese Monte Carlo.

#-----------------------------------------------------------------------
# Teste para independência de processo pontual.

plot(xy,
     NULL,
     xlim = c(0, 1),
     ylim = c(0, 1),
     asp = 1,
     axes = FALSE,
     ann = FALSE)
lines(x = c(0, 1, 1, 0, 0),
      y = c(0, 0, 1, 1, 0))

# xy <- locator(n = 20, type = "p", pch = 19)
# dput(lapply(xy, round, digits = 3))

xy <- structure(list(x = c(0.204, 0.186, 0.529, 0.529, 0.385, 0.579,
                            0.793, 0.793, 0.793, 0.793, 0.793, 0.793, 0.793, 0.793, 0.793,
                            0.793, 0.793, 0.793, 0.793, 0.793),
                     y = c(0.793, 0.793, 0.793, 0.793, 0.793, 0.793, 0.793, 0.793,
                           0.793, 0.793, 0.793, 0.793, 0.793, 0.793, 0.793, 0.793, 0.793,
                           0.793, 0.793, 0.793)),
              .Names = c("x", "y"))

# Transforma a lista em matriz.
xy <- do.call(cbind, xy)

plot(xy,
     NULL,
     xlim = c(0, 1),
     ylim = c(0, 1),
     asp = 1,
     axes = FALSE,
     ann = FALSE)
lines(x = c(0, 1, 1, 0, 0),
      y = c(0, 0, 1, 1, 0))

# Calcula todas as distâncias (euclidianas) entre pontos.
d <- dist(xy)
d

# Estatística de teste: soma das distâncias.
m <- sum(d)
m

# Número de pontos.
n <- nrow(xy)

# Geração de estatísticas por simulação do modelo assumido sob
# hipótese nula.
M <- replicate(9999, {
    sum(dist(cbind(x = runif(n), y = runif(n))))
})

# Concatena as estatísticas simuladas com a observada.
M <- c(m, M)

# Gráfico da distribuição acumulada empírica.
plot(ecdf(M))
abline(h = c(0.025, 0.975), lty = 2)
abline(v = m, col = 2)

# P-valor.
2 * sum(M > m)/length(M)

#-----------------------------------------------------------------------
# ATTENTION: dados um tanto patológicos.

xy <- structure(list(x = c(0.088, 0.326, 0.577, 0.846, 0.857, 0.568,
                            0.306, 0.077, 0.077, 0.328, 0.597, 0.883, 0.883, 0.597, 0.328,
                            0.077, 0.077, 0.328, 0.597, 0.883),
                     y = c(0.883, 0.883, 0.883, 0.883, 0.597, 0.597, 0.597, 0.597,
                           0.328, 0.328, 0.328, 0.328, 0.077, 0.077, 0.077, 0.077, 0.883,
                           0.883, 0.883, 0.883)),
              .Names = c("x", "y"))

# Transforma a lista em matriz.
xy <- do.call(cbind, xy)

plot(xy,
     NULL,
     xlim = c(0, 1),
     ylim = c(0, 1),
     asp = 1,
     axes = FALSE,
     ann = FALSE)
lines(x = c(0, 1, 1, 0, 0),
      y = c(0, 0, 1, 1, 0))

#-----------------------------------------------------------------------
# Modificando a estatística de teste 1.

# A soma das menores distâncias entre vizinhos mais próximos.
d <- dist(xy)
D <- as.matrix(d)
diag(D) <- Inf
apply(D, MARGIN = 2, FUN = min)
m <- sum(apply(D, MARGIN = 2, FUN = min))

# Número de pontos.
n <- nrow(xy)

# Geração de estatísticas por simulação do modelo assumido sob
# hipótese nula.
M <- replicate(9999, {
    d <- dist(cbind(x = runif(n), y = runif(n)))
    D <- as.matrix(d)
    diag(D) <- Inf
    sum(apply(D, MARGIN = 2, FUN = min))
})

# Concatena as estatísticas simuladas com a observada.
M <- c(m, M)

# Gráfico da distribuição acumulada empírica.
plot(ecdf(M))
abline(h = c(0.025, 0.975), lty = 2)
abline(v = m, col = 2)

# P-valor.
2 * sum(M > m)/length(M)

#-----------------------------------------------------------------------
# Moficando a estatística de teste 2.

# Todas as distância entre os pontos (a estatística de teste é um vetor
# e não um escalar).
d <- dist(xy)
D <- as.matrix(d)
D[upper.tri(D, diag = TRUE)] <- NA
D <- na.exclude(as.vector(D))

# Geração de estatísticas por simulação do modelo assumido sob
# hipótese nula.
D <- replicate(999, {
    d <- dist(cbind(x = runif(n), y = runif(n)))
    D <- as.matrix(d)
    D[upper.tri(D, diag = TRUE)] <- NA
    na.exclude(as.vector(D))
})
D <- cbind(d, D)

plot(ecdf(D[, 1]), cex = 0)
for (i in 2:ncol(D)) {
    lines(ecdf(D[, i]), cex = 0, col = "gray70")
}
lines(ecdf(D[, 1]), cex = 0, col = 2, lwd = 2)

#=======================================================================
# Avaliação de métodos de amostragem ou delineamentos.

#-----------------------------------------------------------------------
# Amostragem por Conjuntos Ordenados.

# Função para fazer amostragem por conjuntos ordenados.
rssur <- function(m, rho = 0) {
    # Gera valores de uma normal padrão.
    x <- rnorm(m)
    # Ordena os valores.
    x <- sort(x)
    # Sorteia um dos valores.
    i <- sample(1:m, size = 1)
    # Retorna o valor sorteado.
    return(x[i])
}

# Testando a função.
rssur(m = 10, rho = 0)

# Gerando uma amostra.
replicate(500, rssur(m = 10, rho = 0))

# Comparando com amostragem aleatória simples.
m1 <- replicate(500, rssur(m = 1, rho = 0))
m2 <- replicate(500, rssur(m = 5, rho = 0))
m3 <- replicate(500, rssur(m = 10, rho = 0))

library(lattice)

densityplot(~m1 + m2 + m3, layout = c(NA, 1))
qqmath(~m1 + m2 + m3, layout = c(NA, 1))

#-----------------------------------------------------------------------

# Criando um grid de rho.
rho_grid <- seq(0, 0.95, by = 0.05)

res <- lapply(rho_grid,
              FUN = function(rho) {
                  replicate(500, rssur(m = 10, rho = rho))
              })
str(res)

n <- length(res[[1]])
res <- do.call(c, res)

res <- data.frame(rho = rep(rho_grid, each = n), valor = res)
str(res)

densityplot(~valor | rho, data = res) +
    layer(panel.abline(v = 0, lty = 2))

#-----------------------------------------------------------------------