2025-09-14

Analysis and Downscaling of Precipitation over East Africa and Djibouti: Observed Data, GCM-CMIP6, and CORDEX

This study provides a multi-scale comparison of simulated and observed precipitation. Global simulations from the CanESM5 model (CMIP6, 282 km) are contrasted with results obtained through stochastic downscaling at 3.5 km using CSTools. Observed rainfall for 1981 is spatially interpolated using Inverse Distance Weighting (IDW).

In addition, climate projections from the EC-Earth3-Veg model (CMIP6) under the SSP585 scenario are analyzed for the period 2021–2040, focusing on both the Republic of Djibouti and the wider East Africa region. Finally, downscaled daily precipitation from CORDEX (1981–1985) is generated using Nearest Neighbor and Bilinear interpolation, allowing an assessment of the sensitivity of results to methodological choices.




Figure 0.
Comparison of rainfall variability from satellite products versus observation in situ from 1980 to 2021.


Figure 1. CMIP6 GCM CanESM5 precipitation for 1981 (spatial resolution: 282 km).


Figure 2. CMIP6 GCM CanESM5 precipitation for 1981 downscaled to 3.5 km using stochastic methods with CSTools.



Figure 3. Spatial distribution of observed rainfall in 1981 using Inverse Distance Weighting (IDW) interpolation




Figure 4. Projected total monthly precipitation (mm) from the EC-Earth3-Veg model (GCM-CMIP6), based on the ssp585 scenario Over the Republic of Djibouti during 2021-2040.



Figure 5. Projected total monthly precipitation (mm) from the EC-Earth3-Veg model (GCM-CMIP6), based on the ssp585 scenario Over the Eastern of Africa during 2021-2040.


Figure 6. Downscaled daily precipitation from CORDEX (1981–1985) using (a) Nearest Neighbor interpolation, (b) Bilinear interpolation, and (c) original CORDEX data for comparison.



Figure 7. Performance comparison of the occurrence, duration and intensity of rainfall simulated by Canadian global and regional climate models against the observed rainfall at the airport station.





The Abdi-Basid Courses Institute (tABCi)

@ 2023 Abdi-Basid ADAN

2025-09-13

Predictive Analysis of Customer Behavior in E-Commerce: Prediction of Average Order Value and Identification of High-Value Customers

Description:

This data analysis project explores customer behavior on an e-commerce platform using a dataset containing key metrics such as session duration, product detail views, app transactions, add-to-cart rate per session, discount rate per visited products, credit card info saving, average order value (“avg order value”), and a high-value customer indicator (“high_value_customer”). The code is structured in several steps:

Data Preparation: Loading from the clipboard, cleaning (replacing commas with periods for decimals), numeric conversion, and encoding of categorical variables (e.g., yes/no via LabelEncoder). 

Regression Modeling: Use of an XGBoost model to predict average order value, with evaluation via RMSE and R² on a test set (30% of the data). Visualizations include a scatter plot of predictions vs. actual values, a correlation matrix, a boxplot of average basket by card saving, and a histogram of prediction errors. 

Classification Modeling: Logistic regression with L2 regularization to identify high-value customers, based on selected features (session duration, product views, etc.). Evaluation via ROC-AUC score and ROC curve.







Abdi-Basid ADAN, 09–2025

🎯 The detailed methodology and results can be accessed through this link:

👉Click here now! : https://github.com/abdibasidadan-byte

2025-09-08

Facteurs Climatiques et Environnementaux Influençant la Dynamique du NDVI dans une Région Aride : Importance des Prédicteurs, Corrélation Partielle et Analyse des Tendances (1987–2022)

Compréhension des changements dans les écosystèmes de mangroves

La compréhension des changements dans les écosystèmes de mangroves, induits par les activités humaines, le changement climatique et les variations environnementales, est essentielle pour une gestion écologique efficace. Cette étude se concentre sur la variabilité spatiotemporelle de l'Indice de Végétation par Différence Normalisée (NDVI) et examine ses réponses à des paramètres tels que le niveau de la mer (SL), l'Évapotranspiration Potentielle (PET), les précipitations (RF), l'Indice Standardisé de Précipitation (SPI-1 mois), l'humidité du sol (SM), la température minimale (TN) et la température maximale (TX) dans la zone d'étude.

Les tendances, les influences relatives, l'autocorrélation spatiale et les relations entre le NDVI et les variables climatiques et environnementales, ainsi que les corrélations partielles, ont été analysées à l'aide du test de tendance monotone de Mann-Kendall (MKMT), de l'Analyse de Pondération Relative (RWA), des coefficients de corrélation partielle (PCC) et des méthodes de Régression Linéaire Multiple (MLR).

Les schémas spatiotemporels du NDVI révèlent une réduction des sols nus et une augmentation de la végétation éparse et dense entre 1987 et 2022. Néanmoins, des zones de dégradation ont été observées, notamment dans le sud de Godoria en 2022 par rapport à 1987, comme l'indique le NDVI. Une détérioration notable du NDVI (> 0,2) a été enregistrée entre 2000 et 2012, tandis que la tendance interannuelle globale montre un léger déclin.

De plus, les analyses avec Mann-Kendall et la pente de Theil-Sen révèlent que TN, TX, PET et SPI-1 montrent des tendances à la hausse, bien que non statistiquement significatives, tandis que SM et LST affichent des tendances à la baisse. Pour les variables environnementales, SL indique une tendance à la hausse. En outre, l'analyse de corrélation partielle identifie SL, TN, SPI-1, TX et PET comme les principaux facteurs climatiques contrôlant la dynamique de la végétation pendant la saison JJAS, avec des valeurs PCC de -0,89, 0,87, 0,77, -0,76, -0,75 et 0,86 avec le NDVI, respectivement.

 

2.1.1.Calcul de superficie à partir d'un raster et shapefile :

          Objectif : Déterminer le nombre de pixels d'une image raster situés dans une zone définie par un shapefile, puis calculer la superficie correspondante en m² et hectares.

           Superficie (m²) = N × (Résolution_x × Résolution_y)

          Superficie (ha) = [N × (Résolution_x × Résolution_y)] ÷ 10 000

          Nombre de pixels (N) : 12 500 pixels. Résolution : 20 m × 20 m (pixels carrés):

         Calcul : Superficie_m² = 12 500 × (20 × 20) = 12 500 × 400 = 5 000 000 m² ou Superficie_ha = 5 000 000 ÷ 10 000 = 500 ha


             Correlation Partiel

Les coefficients de corrélation bivariés peuvent ne pas représenter efficacement les relations complexes entre les variables dans une analyse de corrélation multivariée, étant donné que de multiples facteurs peuvent influencer ces relations. Par conséquent, des coefficients de corrélation partielle ont été calculés pour évaluer la force et la direction spatiotemporelles de la relation linéaire entre le NDVI et chaque variable climatique, tout en contrôlant les effets des autres variables climatiques (c'est-à-dire le niveau de la mer, PET, SM, SPI, LST, TN et TX). La corrélation la plus forte est proche de 1, tandis que la plus faible est inférieure à 0,5. Ainsi, la corrélation partielle peut être calculée comme suit (Cheng et al., 2017) :

                                                                                                 

(1)
Où :
Rxy·Z = coefficient de corrélation partielle entre x et y, en contrôlant Z
Rxy = corrélation bivariée entre x et y
Rxz = corrélation bivariée entre x et z
Ryz = corrélation bivariée entre y et z
Z = ensemble des variables de contrôle (autres variables climatiques)

En d'autre termes :

x = NDVI
y = une variable climatique spécifique (par exemple, TN)
Z = les autres variables climatiques (SL, PET, SM, SPI, LST, TX, etc.)
Cette approche permet d'isoler l'effet spécifique de chaque variable climatique sur le NDVI, indépendamment des influences confondantes des autres facteurs climatiques.
 (3)


Pour explorer l'autocorrélation spatiale des données NDVI, nous avons utilisé "l'analyse d'autocorrélation globale et locale basée sur les statistiques de Moran I". Cette méthode permet d'évaluer les différences spatiales moyennes entre les cellules individuelles et leurs voisines adjacentes, caractérisant ainsi les attributs spatiaux d'une propriété spécifique à travers toute la zone d'étude via l'analyse d'autocorrélation spatiale globale.

Dans les statistiques de Moran, le z-score normalisé peut varier de -1 à +1. Une valeur de Moran I supérieure à 0 indique une corrélation positive, suggérant un modèle de regroupement (clustering), tandis qu'une valeur inférieure à 0 indique une corrélation négative, reflétant un arrangement dispersé.

Le calcul des statistiques de Moran I pour examiner l'autocorrélation spatiale est fourni par Xu et al. (2015) :


 (2)

  :

n = nombre total d'observations spatiales

x_i et x_j = valeurs du NDVI aux locations i et j

x̄ = moyenne des valeurs du NDVI

w_ij = poids spatiaux entre les locations i et j (matrice de contiguïté)

S² = variance des valeurs du NDVI

∑∑ = double sommation sur toutes les paires i et j

Interprétation :

I > 0 : autocorrélation positive (valeurs similaires se regroupent)

I < 0 : autocorrélation négative (valeurs différentes se mélangent)

I ≈ 0 : pas d'autocorrélation spatiale (distribution aléatoire).


Tandis que l'autocorrélation spatiale globale via les statistiques de Moran I révèle le schéma global de regroupement, elle ne permet pas d'évaluer les modèles d'association spatiale à travers de multiples localisations. En revanche, l'Autocorrélation Spatiale Locale se concentre sur la significativité des statistiques locales à chaque localisation individuelle et identifie la présence de clusters spatiaux, une capacité que l'autocorrélation spatiale globale ne possède pas.

L'équation mathématique de l'autocorrélation spatiale locale utilisant l'indice de Moran local (souvent appelé LISA - Local Indicators of Spatial Association) est décrite par Anselin (2010) :


:

I_i = indice de Moran local pour la localisation i

z_i = valeur standardisée de l'attribut à la localisation i : (x_i - x̄) / σ

z_j = valeur standardisée de l'attribut à la localisation j voisine

w_ij = élément de la matrice de poids spatiaux entre les localisations i et j

x_i = valeur du NDVI à la localisation i

x̄ = moyenne des valeurs du NDVI sur toutes les localisations

σ = écart-type des valeurs du NDVI

∑ = somme sur tous les voisins j de i

Interprétation des quatre types de clusters locaux :

High-High (HH) : Localisation avec valeur élevée entourée de voisins avec valeurs élevées

z_i > 0 et ∑w_ij × z_j > 0

Low-Low (LL) : Localisation avec valeur faible entourée de voisins avec valeurs faibles

z_i < 0 et ∑w_ij × z_j < 0

High-Low (HL) : Localisation avec valeur élevée entourée de voisins avec valeurs faibles

z_i > 0 et ∑w_ij × z_j < 0

Low-High (LH) : Localisation avec valeur faible entourée de voisins avec valeurs élevées

z_i < 0 et ∑w_ij × z_j > 0

Test de significativité :
Pour chaque I_i, un test de permutation (généralement 999 permutations) est utilisé pour calculer une pseudo-valeur p et déterminer si l'autocorrélation locale est statistiquement significative.

Cette analyse permet d'identifier :

Les "hot spots" de NDVI (clusters HH) : zones de végétation dense des mangroves

Les "cold spots" de NDVI (clusters LL) : zones de dégradation ou faible végétation

Les anomalies spatiales (HL et LH) : zones isolées nécessitant une attention particulière

L'approche LISA fournit ainsi une cartographie détaillée des schémas de distribution spatiale du NDVI, complémentaire à l'analyse globale de Moran.







 

(a)

 

(b)

 

Fig. 1. (a)Estimation of relative importance of climate variables as predictors of NDVI. (b) Pearson correlation coefficient between NDVI and climate variables.

 

 

Table 1. Mann Kendall Trend and Theil-sen slope statistics of NDVI and climate variables from 1987 to 2022.


Theil-sen slope

p.value

Mann kendall tau (τ)

p.value

NDVI

-0.001

0.858

-0.023

0.859

Sea level

0.001

0.646

0.057

0.646

Rainfall

0.000

NA

0.000

NA

SPI

0.000

0.917

0.000

0.917

Temp Min

0.057

0.109

0.194

0.109

Temp Max

0.072

0.173

0.166

0.172

Soil Moisture

-0.030

0.739

-0.057

0.739

PET

0.046

0.649

0.085

0.649

LST

-0.222

0.720

-0.111

0.720

 











Abdi-Basid ADAN, 2024



The Abdi-Basid Courses Institute (TABCI)