Índice de Competitividad Regional Perú 2021, con R
R permite trabajar con datos geoespaciales haciendo uso de archivos shapefile.
Para que todas las librerías funcionen correctamente, es necesario instalar o actualizar a las últimas versiones de R, RStudio y su complemento RTools.
En este artículo, vamos a utilizar un archivo de formato Shapefile con los datos geoespaciales del Perú por limite departamental obtenidos de GEO GPS PERU y un archivo de formato .cvs
con los índices de competitividad regional de la edición 2021 de INCORE.
Un archivo Shapefile contiene al menos:
.shp
- un archivo tipo shape, es la geometría misma..shx
- un archivo tipo index, tiene las posiciones indexadas del archivo .shp..dbf
- un archivo tipo attribute, tiene los atributos de cada forma en una columna, es de tipo dBase IV.
Adicionalmente, la carpeta donde se encuentran dichos archivos puede contener otros archivos de formato .prj
o .sbn
, estos aportan más datos de la geometría o pueden ser usados en otros programas de sistemas de información geográfica.
Instalación de pre-requisitos
Las librerías de R que usaremos.
library(sf)
library(purrr)
library(tidyverse)
library(ggplot2)
library(ggrepel)
library(sf)
library(purrr)
library(tidyverse)
library(ggplot2)
library(ggrepel)
library(readxl)
library(reshape)
library(stringi)
library(dplyr)
Preparación de los datos
Cargamos el archivo shapefile con los limites departamentales y transformamos en un data frame.
peru_d <- st_read("C:Departamentos/DEPARTAMENTOS.shp")
peru_d
Carga, filtro y limpieza de datos INCORE_2021.csv
CompReg <- read.csv(file = "INCORE_2021.csv")
CompRegF <- subset(CompReg, select = c(Región, Valor, Pilar))
CompRegF <- CompRegF %>%
filter(Pilar == "Índice de Competitividad Regional 2021")
colnames (CompRegF) <- c ('DEPARTAMEN', 'Valor','Pilar')
CompRegF <- subset(CompRegF, select = c(DEPARTAMEN, Valor))
CompRegF <- anti_join(CompRegF,pobrezaF[c(26),])
CompRegF <- mutate_if(CompRegF, is.character, toupper)
CompRegF
Con ggplot
creamos el primer mapa, solo con los limites departamentales.
ggplot(data = peru_d) +
geom_sf()
Podemos seleccionar también solo un departamento, en este caso se grafica el departamento de Lima.
ggplot(data = peru_d %>%
filter(DEPARTAMEN=="LIMA")) +
geom_sf()
Para colocar los nombres de los departamentos en el mapa es necesario crear un punto en el centro de cada departamento.
Creación de centroide:
peru_d <- peru_d %>% mutate(centroid = map(geometry, st_centroid), coords = map(centroid, st_coordinates), coords_x = map_dbl(coords, 1), coords_y = map_dbl(coords, 2))
Mapa con los nombres de departamentos:
ggplot(data = peru_d) +
geom_sf(fill="#c7eafe", color="#000000")+
geom_text_repel(mapping = aes(coords_x, coords_y, label = DEPARTAMEN), size = 2.25)
Luego haremos un 'merge' del df CompRegF
con el df que tiene los datos geoespaciales, en este caso peru_d
.
Debemos fijarnos que la variable 'llave' debe estar escrita igual en las bases de datos que se juntarán. En este caso "DEPARTAMEN" es la variable llave. Además, el nombre de todos los departamentos debe ser el mismo: deben respetar mayúsculas, minúsculas, tildes, etc.
En CompRegFse
, El Callao se encuentra dentro de Lima provincias.
peru_datos <- peru_d %>% #Juntamos ambas bases de datos.
left_join(CompRegF)
peru_datos
Con ggplot
graficamos el mapa con los Índices de competitividad regional por departamento.
ggplot(peru_datos) +
geom_sf(aes(fill = Valor))+
labs(title = "Índice de Competitividad Regional Perú 2021",
caption = "Fuente: INCORE 2021
Elaboración propia",
x="Longitud",
y="Latitud")+
scale_fill_continuous(guide_legend(title = "Índice de Competitividad Regional"))+
geom_text_repel(mapping = aes(coords_x, coords_y, label = DEPARTAMEN), size = 2, color="#4EACEB")
# Preparación de datos para gráfico de barras
CompRegF1 <- CompRegF %>%
arrange(Valor) %>%
mutate(DEPARTAMEN = factor(DEPARTAMEN, levels = .$DEPARTAMEN))
# Gráfico de barras
ggplot(CompRegF1, aes(DEPARTAMEN, Valor)) +
geom_bar(stat = "identity",fill="#3F8FDF", color = "#ffffff") +
coord_flip() +
theme_minimal()
Gráfico de barras; Índice de Competitividad Regional
Lima en 2021 fue la región más competitiva del país al ocupar el primer lugar.
Moquegua la segunda región más competitiva del país, al ubicarse entre los cuatro primeros lugares.
Tacna alcanzó el tercer lugar en competitividad en el INCORE 2021. Destaca que la región se ubica en el primer lugar en el pilar Educación y en la segunda posición en el pilar Infraestructura. Además, se encuentra entre los cinco primeros lugares en 22 de los 40 indicadores evaluados.
Huancavelica en 2021 se mantuvo como la región menos competitiva del país, al ubicarse entre los últimos.