Date de modification: 8 août 2023
Cette méthodologie résume les étapes suivies pour convertir les données de l’IITA en un format utile aux gouvernements des pays partenaires. Elle permet de déterminer la manière dont les données sont récupérées, retraitées et harmonisées, ainsi que le produit. En règle générale, les étapes s’alignent sur celles suivies au cours du travail précédent détaillé dans la sous-section 1.3. Cette méthodologie sera perfectionnée et mise à jour lors de ce travail, en accord avec le Secrétariat de l’IITA.
À la suite des premiers essais avec diverses API, l’approche convenue est de télécharger toutes les données, puis de les traiter sans utiliser la banque de données de l’IITA ni une autre API. Cette approche est à privilégier étant donné que cet exercice consiste à télécharger l’ensemble des données de l’IITA. Il est possible d’effectuer d’importants gains de performance grâce à cette approche.
Le téléchargement des données depuis le Data Dump de l’IITA prend 53 secondes pour l’archive zip de 537 Mb (9 Gb après désarchivage) qui contient toutes les données de l’IITA.
Les données sont récupérées une fois par jour.
Toutes les activités des versions 2.01 ou suivantes de l’IITA sont incluses. Parmi les fichiers publiés dans le Registre de l’IITA, 94 % utilisent les versions 2.01 ou suivantes. En limitant le traitement de ces fichiers, les frais de maintenance du logiciel seront réduits. Il est également possible qu’un très petit nombre de données obsolètes ou de mauvaise qualité soit exclu.
Les données ne font l’objet d’aucun processus de validation. Ainsi, nous utilisons à la fois des données valides et non valides. Lorsque des problèmes liés à la qualité des données surviendront, ils seront généralement transmis à l’organisme ayant publié les données en question plutôt que d’essayer de mettre en œuvre des solutions techniques.
Chaque fichier est traité afin d’extraire un certain nombre de champs de chaque transaction ou budget. Dans certains cas, on retrouve des données fournies au niveau de l’activité alors qu’elles ne sont pas fournies dans la transaction ou le budget.
L’identifiant IITA et l’organisme déclarant sont toujours extraits de l’activité.
L’identifiant unique associé à l’activité :
iati-activity/iati-identifier/text()
L’intitulé de l’activité. Dans la mesure du possible, nous avons essayé d’obtenir la version pertinente parmi les langues prises en charge (anglais, français, espagnol et portugais). Pour chaque langue, nous nous sommes appuyés sur le titre en langue anglaise ou, à défaut, sur le premier titre disponible :
iati-activity/title/narrative[not(@xml:lang) ou @xml:lang='en']/text()
Le nom de l’organisation qui publie ces données de l’IITA. Nous cartographions ces organisations déclarantes à partir de la liste établie par le Registre de l’IITA et mise à disposition dans la liste de codes (non officielle) des organisations déclarantes :
iati-activity/reporting-org/text()
Le type d’organisme déclarant qui publie ces données de l’IITA :
iati-activity/reporting-org/@type
Les champs suivants sont extraits de chaque transaction. Lorsque ces quatre champs n’existent pas, la transaction n’est pas traitée.
La valeur de la transaction dans la devise publiée :
transaction/value/text()
La date de la transaction (utilisée pour agréger les transactions ainsi que dans le produit) :
transaction/transaction-date/@iso-date
La date de la valeur de la transaction dans la devise publiée (utilisée comme date de la conversion de la devise) :
transaction/value/@value-date
Le type de transaction (p. ex., engagement, décaissement, dépense) :
transaction/transaction-type/@code
Remarque : les transactions n’étant pas de type fonds entrant, engagement, décaissement ou dépense ont été initialement écartées. Cette décision pourra être révisée par la suite en fonction de la demande, tout en tenant compte de la nécessité de conserver une durée de traitement raisonnable.
Pour certains champs, les données proviennent soit de la transaction, soit de l’activité. Cela dépend de l’organisme qui a publié les données.
La devise de la transaction, ou la devise par défaut de l’activité :
transaction/@currency ou iati-activity/@default-currency
Le type d’aide concerné par la transaction, ou le type d’aide par défaut de l’activité (seuls les types d’aide du Comité d’aide au développement [CAD] sont inclus) :
transaction/aid-type [not(@vocabulary) ou @vocabulary='1'] /@code ou iati-activity/default-aid-type[not(@vocabulary) ou @vocabulary='1'] /@code
Le type de financement concerné par la transaction, ou le type de financement par défaut de l’activité :
transaction/finance-type/@code ou iati-activity/default-finance-type/@code
Le type de flux concerné par la transaction, ou le type de flux par défaut de l’activité :
transaction/flow-type/@code ou iati-activity/default-flow-type/@code
L’organisation émettrice de la transaction ou déclarante de l’activité :
transaction/provider-org/text()
L’organisation destinataire de la transaction, ou le ou les organismes de mise en œuvre de l’activité :
transaction/provider-org/text()
Dans les cas où il n’existe pas d’organisme prestataire ou bénéficiaire concernant la transaction, d’autres organismes participant à l’activité servent de remplacement. Les organisations utilisées en remplacement varient selon le type de transaction traité :
Type de transaction | Organisme prestataire | Organisme bénéficiaire |
---|---|---|
1 - Fonds entrants | Organisme de financement | Organisme déclarant |
2 - Engagement sortant | Organisme déclarant | Organisme de mise en œuvre |
3 - Décaissement | Organisme déclarant | Organisme de mise en œuvre |
4 - Dépense | Organisme déclarant | Organisme de mise en œuvre |
S’il existe plusieurs organismes de financement ou de mise en œuvre, ceux-ci sont reliés par des virgules.
Balisage utilisé pour les organismes déclarants :
iati-activity/reporting-org/text()
Balisage utilisé pour les organismes de financement :
iati-activity/participating-org[@role='1']/text()
Balisage utilisé pour les organismes de mise en œuvre :
iati-activity/participating-org[@role='4']/text()
Enfin, les données de deux champs (pays ou région bénéficiaires et secteur) peuvent être extraites à partir d’une transaction ou d’une activité. Concernant les activités, il est possible que ces données aient été publiées à de multiples reprises avec des répartitions par pourcentage. La section qui suit décrit la manière de gérer les données de valeurs différentes.
Le pays bénéficiaire de la transaction, ou la liste de pays bénéficiaires de l’activité (s’il en existe plusieurs, une colonne supplémentaire permet d’indiquer que la transaction s’inscrit dans le cadre d’un projet multipays) :
transaction/recipient-country/@code ou iati-activity/recipient-country/@code
En l’absence de pays bénéficiaires, l’analyse porte sur les régions du CAD :
transaction/recipient-region[not(@vocabulary) ou @vocabulary='1']/@code ou iati-activity/recipient-region[not(@vocabulary) ou @vocabulary='1']/@code
Le secteur concerné par la transaction, ou la liste de secteurs de mise en œuvre de l’activité (seuls les secteurs du CAD sont inclus) :
transaction/sector[not(@vocabulary) ou @vocabulary='1']/@code ou iati-activity/ sector[not(@vocabulary) ou @vocabulary='1']/@code
Le marqueur humanitaire attribué à la transaction ou à l’activité :
transaction/@humanitarian ou iati-activity/@humanitarian
1
), l’élément humanitaire
sera égal à 1
.0
), l’élément humanitaire
sera égal à 0
.Dans les cas où aucun marqueur n’est attribué à la transaction :
1
), l’élément humanitaire
sera égal à 1
.0
), l’élément humanitaire
sera égal à 0
.Comme expliqué dans la section précédente, une seule transaction peut être liée à plusieurs pays et secteurs. Dans chacun de ces cas, la valeur de la transaction est répartie entre les pays ou les secteurs proportionnellement au pourcentage qu’ils ont reçu. Remarque : selon ce qui permet le plus de clarté, les transactions qui n’impliquent pas de pays ou de régions du CAD peuvent être retirées, ou le champ « secteur » laissé vide en l’absence de secteurs.
Dans certains cas, les pourcentages indiqués peuvent être incorrects. Par exemple, il est possible que leur total ne soit pas égal à 100 %, ou qu’aucun pourcentage n’ait été attribué à de multiples secteurs. Les pourcentages sont alors ajustés et leur base de calcul modifiée afin de parvenir à un total égal à 100 %. Par exemple :
Secteur | Pourcentage (publié) | Pourcentage (corrigé) |
---|---|---|
12220 Soins de santé de base | 100% | 50% |
11220 Éducation primaire | 100% | 50% |
Une transaction de 100 dollars US serait divisée en deux lignes : l’une pour les 50 dollars US affectés aux soins de santé de base, et l’autre pour les 50 dollars US réservés à l’éducation primaire. Si la même activité était publiée avec l’inclusion de deux pays bénéficiaires, la transaction serait de nouveau divisée, cette fois en quatre lignes.
Corriger les pourcentages indiqués par pays requiert de prendre des précautions. Les organisations interprètent les lignes directrices de l’IITA différemment. Certaines estiment qu’il est indiqué que le total des pourcentages attribués à tous les pays et à toutes les régions doit être égal à 100 %, tandis que d’autres considèrent que les pourcentages indiqués par pays et par région doivent séparément atteindre un total de 100 %. La logique appliquée est la suivante :
<recipient-country code="LR" />
<recipient-region code="298" />
<recipient-country code="TD" percentage="70" />
<recipient-country code="LR" percentage="30" />
<recipient-region code="298" percentage="100" />
<recipient-country code="TD" percentage="50" />
<recipient-region code="298" percentage="50" />
La devise de publication des données varie selon les signataires. Les transactions doivent donc faire l’objet d’une conversion individuelle en dollars US, en euros et dans les devises locales sur la base du taux de change en vigueur à la date la plus proche de celle à laquelle la valeur de la transaction a été définie. Les taux de change mensuels de 169 devises sont tirés des statistiques financières internationales du FMI2.
Il est également important de collecter des données sur les dépenses prévisionnelles. Ces données sont plus difficiles d’accès, car, contrairement aux transactions, les budgets ne sont pas ventilés par secteur ou par pays. Préciser la part de budget affectée à un pays ou à un secteur en particulier est donc impossible. Afin d’évaluer les dépenses prévisionnelles, certaines des données fournies au sujet d’une transaction ou d’une activité doivent être incorporées à l’analyse du budget. Par exemple, lorsqu’aucun secteur n’est indiqué pour une activité, la part de la valeur des transactions effectuées dans le cadre d’engagements affectée aux différents secteurs sert à décomposer le budget par secteur d’une manière semblable à celle décrite dans la section 2.3 ci-dessus.
Cette méthode de calcul de la répartition des fonds accordés au titre d’engagements est applicable aux catégories suivantes :
Dans le champ correspondant à l’organisme prestataire, indiquer l’organisme déclarant de l’activité. Dans le champ correspondant à l’organisme bénéficiaire, inscrire le ou les organismes de mise en œuvre de l’activité.
Les budgets couvrant plusieurs trimestres sont divisés en plusieurs lignes coïncidant exactement avec un trimestre. La valeur est répartie de manière proportionnelle3. Cette répartition est nécessaire afin de conserver la possibilité de comparer les transactions (dont la date est unique) et les budgets (dont les périodes de mise en œuvre ne concordent pas forcément avec l’exercice fiscal du gouvernement).
En cas de publication des versions initiale et révisée d’un budget couvrant la même période, la dernière plutôt que la première version sera prise en compte.
Les transactions sont regroupées en une ligne par trimestre, l’ensemble des autres champs suivants demeurant identiques :
La date de la transaction est fixée à celle de la fin du trimestre.
Les devises cibles sont le dollar US et l’euro pour tous les pays. L’inclusion d’une devise locale (p. ex., le shilling kényan pour l’analyse du Kenya) est déterminée par le pays destinataire. Le taux de change utilisé correspond à celui en vigueur au dernier jour du trimestre.
Les données sont disponibles en anglais, en français, en espagnol et en portugais. Tous les intitulés disponibles dans ces langues sont inclus dans l’analyse, de même que tous les codes. Certains intitulés et organismes prestataires ou bénéficiaires ne sont indiqués qu’en anglais.
Les fichiers étaient auparavant traités sur Github Actions et stockés sur Github Pages (deux services gratuits). Mais cela a posé des problèmes eu égard aux limites d’utilisation de Github.
Toutes les analyses sont publiées sur Github et librement exploitables dans le cadre de la version 3.0 de la licence publique générale GNU Affero (AGPL)4.