Análisis de relaciones entre indicadores socioeconómicos y emisiones de CO2 de los países del mundo mediante técnicas de machine learning
Cargando...
Autores
Director
Tipo de contenido
Editor
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
Desde la publicación del informe The Limits to Growth - también llamado informe Meadow - en 1972 (Institut national du service public (INSP) 2022), los científicos nos advierten de las consecuencias de la actividad humana sobre el medio ambiente y la biodiversidad. 50 años después, nos encontramos en una crisis climática debida al calentamiento global, un problema que ha sido bien documentado y estudiado pero que aún está lejos de resolverse. De hecho, las temperaturas medias en 2023 eran 1,4 ◦C más altas que en la era preindustrial y podrían subir hasta 5 ◦C en 2100. Este calentamiento global se debe a la liberación masiva por las actividades humanas de gases de efecto invernadero (GHG) que superan la capacidad natural de absorción del planeta. En lo que respecta a las emisiones de carbono, existen grandes disparidades entre países y regiones del mundo. Por ejemplo actualmente, China solo, representa el 29,2% de las emisiones mundiales anuales. Países como Arabia Saudí, Canadá o Estados Unidos emiten mucho más por habitantes que la mediana mundial y otros territorios, con 22,3, 19,4 y 18 tCO2/hab, respectivamente frente a 6.8 tCO2/hab para el mundo. La literatura contiene varios intentos de estudiar los vínculos entre el desarrollo socioeconómico y las emisiones de carbono. Los indicadores y contextos estudiados son variados, al igual que las técnicas utilizadas, que van desde métodos econométricos y estadísticos hasta el machine learning y las redes neuronales. Estos trabajos pueden proporcionar resultados muy diferentes lo que puede hacer difícil de entender las disparidades que existen en términos de emisiones de dióxido de carbono así como conocer y entender todas las variables que influyen en dichas emisiones. Por lo tanto, el presente estudio se centrará en la producción de datos sobre este tema. Concretamente, el objetivo será realizar un análisis de las relaciones entre varios indicadores sociales y económicos y las emisiones de gases de efecto invernadero de los países del mundo, utilizando técnicas de Machine Learning. Esto, considerando 46 indicadores socioeconomicos sobre 118 paises entre 2000 y 2022, desde el conjunto de datos Environment, Social and Governance Data del Banco Mundial (World Bank Group 2025). En primer lugar, se realizó un estudio de correlación entre los indicadores y las emisiones de carbono con el fin de detectar posibles relaciones. A continuación, se aplicó un clustering a los datos para observar posibles dinámicas similares entre los países y explorar más las relaciones detectadas. El objetivo final era producir un modelo de regresión utilizando redes neuronales que permitiera predecir las emisiones de carbono de un país a partir de sus indicadores socioeconómicos. Este trabajo ha permitido observar resultados interesantes y variados. Una de las principales conclusiones que se desprende es que el desarrollo económico y social de los países parece estar, en términos generales, relacionado positivamente con el aumento de los gases de efecto invernadero. Aunque la mayoría de las correlaciones observadas entre el nivel de desarrollo y las emisiones son espurias y están fuertemente influenciadas por la dimensión temporal de los datos, esto revela, no obstante, una relación estructural entre estos dos conceptos en nuestros datos. Esta relación también parece confirmarse a través de los resultados del clustering. Sin embargo, algunos indicadores parecen mostrar una correlación válida e interpretable con las emisiones de gases de efecto invernadero. Cabe mencionar, en particular, Energy use (kg of oil equivalent per capita), Carbon intensity of GDP (kg CO2e per 2021 PPP $) y Fossil fuel energy consumption (% of total), que muestran una correlación positiva ligera o media con las emisiones de GHG, y Renewable energy consumption (% of total final energy consumption), que muestra una correlación negativa ligera o media. Los resultados del clustering también parecen mostrar una relación positiva entre GDP per capita (current US$) y Total greenhouse gas emissions per capita excluding LULUCF (t CO2e/capita) , aunque el análisis de correlación solo muestra una correlación positiva ligera o insignificante, al margen del efecto temporal de los datos. Por el contrario, se observa que algunos de los países más ricos y desarrollados parecen estar experimentando una disminución de sus emisiones, de su consumo energético y de su intensidad carbono y energética de su economía. Estos resultados deben considerarse con prudencia debido a la existencia de una deslocalización de las emisiones de los países más ricos. También se puede ver que las dinámicas y relaciones entre los indicadores y las emisiones son muy diferentes entre los países, las correlaciones entre ellos pueden variar enormemente según los caso. Eso revela que ningún indicador parece, por lo tanto, influir en las emisiones de carbono de manera absoluta, y que la relación depende fuertemente de la dinámica interna de cada país. La regresión, cuyo objetivo era predecir las emisiones de carbono de un país a partir de sus indicadores socioeconómicos, ha dado buenos resultados en general, con un MAE (Mean Absolute Error) de 0.265 tCO2/hab y un MAPE (Mean Absolute Percentage Error) de 4.74% para la regresión global y un MAE de 0.526 tCO2/hab y un MAPE de 9.69% para regresión predictiva. No obstante, se observa cierta variación en la calidad de la predicción según los casos, pero el modelo logra une buena precisión de manera global. (Texto tomado de la fuente)
Abstract
Since the publication of the report The Limits to Growth — also known as the Meadows Report — in 1972
(Institut national du service public (INSP) 2022), scientists have warned us of the consequences of human
activity on the environment and biodiversity. Fifty years later, we are facing a climate crisis driven by global
warming — a problem that has been well documented and studied, yet remains far from being resolved.
Indeed, average temperatures in 2023 were 1,4 ◦C higher than in the pre-industrial era and could rise as
high as 5 ◦C by 2100. This global warming is caused by the massive release of greenhouse gases (GHG) from
human activities, which exceed the planet’s natural absorption capacity. Regarding carbon emissions, there
are significant disparities between countries and regions worldwide. For example, China alone currently
accounts for 29.2 % of annual global emissions. Countries such as Saudi Arabia, Canada, or the United
States emit far more per capita than the global median — 22.3, 19.4, and 18 tCO2/hab, respectively —
compared to 6.8 tCO2/hab globally. The literature includes multiple attempts to study the links between
socioeconomic development and carbon emissions. The indicators and contexts studied are varied, as are the
techniques used ranging from econometric and statistical methods to machine learning and neural networks.
These studies can yield very different results, making it difficult to understand the disparities in carbon
dioxide emissions and to identify and comprehend all variables influencing them.
Therefore, this study focuses on generating data on this topic. Specifically, the objective is to analyze the
relationships between various social and economic indicators and greenhouse gas emissions across countries
worldwide, using Machine Learning techniques. This analysis considers 46 socioeconomic indicators across
118 countries between 2000 and 2022, drawn from the Environment, Social and Governance Data dataset of
the World Bank (World Bank Group 2025). First, a correlation study was conducted between the indicators
and carbon emissions to detect potential relationships. Next, clustering was applied to the data to observe
possible similar dynamics among countries and further explore the detected relationships. The final objective
was to build a regression model using neural networks capable of predicting a country’s carbon emissions
based on its socioeconomic indicators.
This work has yielded interesting and varied results. One of the main conclusions is that, in general, a country’s
economic and social development appears positively correlated with increased greenhouse gas emissions.
Although most of the observed correlations between development levels and emissions are spurious and
strongly influenced by the temporal dimension of the data, this nonetheless reveals a structural relationship
between these two concepts in our dataset. This relationship is also supported by the clustering results.
However, some indicators show valid and interpretable correlations with greenhouse gas emissions. In
particular, Energy use (kg of oil equivalent per capita), Carbon intensity of GDP (kg CO2e per 2021 PPP
$), and Fossil fuel energy consumption ( % of total) exhibit a slight to moderate positive correlation with
GHG emissions, while Renewable energy consumption ( % of total final energy consumption) shows a slight
to moderate negative correlation. Clustering results also suggest a positive relationship between GDP per
capita (current US$) and Total greenhouse gas emissions per capita excluding LULUCF (t CO2e/capita),
although the correlation analysis only reveals a weak or insignificant positive correlation, apart from the
temporal effect of the data. Conversely, it appears that some of the wealthiest and most developed countries
are experiencing a decline in their emissions, energy consumption, and carbon and energy intensity of their
economies. These results must be interpreted with caution due to the existence of emission delocalisation from wealthier countries. It is also evident that the dynamics and relationships between indicators and emissions
vary greatly across countries, correlations can differ substantially depending on the case. This suggests that
no single indicator appears to influence carbon emissions absolutely, and the relationship strongly depends on
each country’s internal dynamics. The regression model — designed to predict a country’s carbon emissions
based on its socioeconomic indicators — yielded good overall results: a MAE (Mean Absolute Error) of
0.265 tCO2/hab and a MAPE (Mean Absolute Percentage Error) of 4.74 % for the global regression, and a
MAE of 0.526 tCO2/hab and a MAPE of 9.69 % for the predictive regression. Nevertheless, some variation
in prediction quality is observed across cases, though the model achieves good overall accuracy.
Palabras clave propuestas
Análisis de correlación; Aprendizaje automático; Banco Mundial; Cambio climático; Clustering; Emisiones de carbono; Gases de efecto invernadero; Indicadores socioeconómicos; Pearson; PIB; Red neuronal; Regresión; Spearman; Carbon Emissions; Climate change; Clustering; Correlation analysis; GDP; Greenhouse gas; Machine learning; Neural network; Pearson; Regression; Socioeconomic indicators; Spearman; World Bank Group
Descripción
ilustraciones a color, diagramas, mapas, tablas

