Office at International Food Policy Research Institute (IFPRI)/ P.O. Box 24063 Dakar, Senegal
IFPRI OFFICE DAKAR
resaksschallenge@cgiar.org
Follow Us

Modélisation Prédictive

Compétition 2 : Modélisation Prédictive

Description

En République démocratique du Congo, l’importance du manioc va bien au-delà de son statut de culture de base. Sa capacité d’adaptation exceptionnelle est cruciale pour la sécurité alimentaire dans diverses zones agroécologiques. En effet, cette culture fournit une source fiable de carbohydrates en dépit des incertitudes climatiques. Sur le plan culturel également, l’introduction du manioc dans les régimes alimentaires enrichit les traditions culinaires et favorise un sentiment d’identité communautaire. Sur le plan économique, toutefois, le potentiel du manioc (son adaptabilité) pourrait être exploité davantage dans les domaines de l’exportation et de la transformation, en s’appuyant sur la demande mondiale croissante de produits dérivés du manioc. Cette tendance du marché place la RDC dans une position favorable, ouvrant la voie à la croissance et à la diversification économiques. Pour ce faire, le pays doit développer sa capacité à prévoir avec précision les futures productions de manioc, un atout crucial pour l’allocation stratégique des ressources, pour la sécurité alimentaire, mais aussi pour la résilience économique.

Le défi qui vous est proposé ici consiste à prévoir la production de manioc en République démocratique du Congo pour l’année 2023 (au niveau du pixel) en utilisant des techniques d’apprentissage automatique. Le modèle que vous allez développer doit utiliser des variables explicatives – c’est-à-dire, des données de télédétection telles que l’indice de végétation par différence normalisée (NDVI – Normalized Difference Vegetation Index), la température à la surface du sol pendant la journée (LST – Land Surface Temperature) et les précipitations (R – Rainfall) – et des variables de réponse – c’est-à-dire, les valeurs historiques de la production de manioc. Ces deux paramètres, « variables explicatives » et « variables de réponse », sont fournis dans des fichiers csv avec des coordonnées de latitude et de longitude. On vous demande de prévoir la production de manioc pour chaque pixel. Ci-dessous, un modèle F fourni à titre d’exemple :

Production de manioc = F (NDVI, LST, R)

Le choix de la technique d’apprentissage automatique revient aux participants qui utiliseront également les variables explicatives disponibles sur les plateformes ReSAKSS, e-Atlas et AAgWa pour plus de précision. Il conviendra toutefois de justifier la pertinence et l’utilisation des variables explicatives utilisées. 

Les ensembles de données fournis sont agrégés sur une base annuelle pour la saison de croissance de chaqueannée. Votre prédiction portera donc sur la saison 2023.

Évaluation

Le paramètre d’évaluation est la racine de l’erreur quadratique moyenne. Votre proposition doit contenir les valeurs de production prévues pour le manioc, pour chaque pixel et pour l’année 2023. Nous avons isolé une partie de la base de données pour l’évaluation de la précision des résultats de votre modèle. Vous devez utiliser la même unité de production que celle utilisée dans la base de données fournie. 

Votre proposition doit présenter les éléments suivants : 

ID du PixelLatitudeLongitudeProduction de manioc en 2023 (valeurs prévues)
0000120
00002
   

Informations sur les paramètres de l’ensemble de données

  • NDVI est l’abréviation de Normalized Difference Vegetation Index (indice de végétation par différence normalisée). L’indice NDVI est obtenu à partir d’images satellites multispectrales et peut aider à évaluer la santé d’une végétation. Pour plus d’informations, veuillez consulter ce site web :
    https://earthobservatory.nasa.gov/features/MeasuringVegetation/measuring_vegetation_2.php.
  • L’indice LST, Land Surface Temperature (température à la surface du sol) est exprimé en degrés Celsius pour le jour et la nuit. Il s’agit de la température de l’air à un mètre au-dessus du sol.
  • Les données sur les précipitations ont été extraites des bases de données CHIRPS (Climate Hazards Group InfraRed Precipitations with Station data). Pour plus d’informations, veuillez consulter le site https://www.chc.ucsb.edu/data/chirps.
  • L’évapotranspiration a été extraite du modèle MOD16A2 version 006 du produit Land Processes Distributed Active Archive Center (LP DAAC). Pour plus d’informations, veuillez consulter le site https://lpdaac.usgs.gov/products/mod16a2v006/.

Règles

La solution doit utiliser des logiciels libres et accessibles au public.

  • Seules les propositions contenant des valeurs de prédiction pour tous les pixels seront prises en compte.
  • Les candidats individuels peuvent former des équipes pour participer à ce concours. Toutefois, vous ne pouvez pas soumettre votre travail en tant que candidat individuel si vous êtes membre d’une équipe participante. 
  • Une seule soumission de projet est autorisée. Cependant, vous pouvez demander la possibilité de soumissionner une deuxième fois et l’équipe du ReSAKSS Data Challenge examinera votre requête. 
  • Si vous êtes le gagnant, l’équipe du ReSAKSS Data Challenge vous demandera de soumettre votre modèle pour vérification des droits d’auteur et des valeurs prédictives.  
  • Si deux solutions obtiennent la même note, la date et l’heure de soumission des projets seront prises en compte dans l’évaluation.
  • Vous acceptez de céder légalement la propriété de tous les droits d’auteur du code de la solution gagnante au ReSAKSS Data Challenge, tout en vous réservant le droit d’utiliser le code de la solution à des fins non commerciales, tout en créditant le ReSAKSS Data Challenge. 
  • Le ReSAKSS Data Challenge peut modifier les règles à tout moment. 
  • Chaque candidat ne peut participer qu’à l’un des deux concours informatiques.

Calendrier

Les candidatures pour la catégorie Modélisation prédictive seront acceptées du 24 aout 2023 au 29 octobre 2023, date de cloture des appels à candidatures. Les candidatures se feront par le biais de ce site web consacré au ReSAKSS data challenge.  

Prix

Seul le 1er prix sera attribué au gagnant de cette sous-catégorie 2, Modélisation prédictive.

Télécharger les instructions et/ou Participer