Ajout d'un commentaire expliquant le processus de téléchargement et lecture locale

This commit is contained in:
Louis Lacoste 2022-11-21 22:15:27 +01:00
parent 497b23f768
commit 29b249631e

View file

@ -69,15 +69,13 @@ Voici l'explication des colonnes donnée sur [[https://ns.sentiweb.fr/incidence/
L'indication d'une semaine calendaire en format [[https://en.wikipedia.org/wiki/ISO_8601][ISO-8601]] est populaire en Europe, mais peu utilisée aux Etats-Unis. Ceci explique peut-être que peu de logiciels savent gérer ce format. Le langage Python le fait depuis la version 3.6. Nous utilisons donc ce langage pour la préparation de nos données, ce qui a l'avantage de ne nécessiter aucune bibliothèque supplémentaire. (Note: nous expliquerons dans le module 4 pourquoi il est avantageux pour la réproductibilité de se limiter à un minimum de bibliothèques.) L'indication d'une semaine calendaire en format [[https://en.wikipedia.org/wiki/ISO_8601][ISO-8601]] est populaire en Europe, mais peu utilisée aux Etats-Unis. Ceci explique peut-être que peu de logiciels savent gérer ce format. Le langage Python le fait depuis la version 3.6. Nous utilisons donc ce langage pour la préparation de nos données, ce qui a l'avantage de ne nécessiter aucune bibliothèque supplémentaire. (Note: nous expliquerons dans le module 4 pourquoi il est avantageux pour la réproductibilité de se limiter à un minimum de bibliothèques.)
** Téléchargement ** Téléchargement ou lecture locale
Après avoir téléchargé les données, nous commençons par l'extraction des données qui nous intéressent. D'abord nous découpons le contenu du fichier en lignes, dont nous jetons la première qui ne contient qu'un commentaire. Les autres lignes sont découpées en colonnes. Si le fichier des données n'existe pas localement nous le téléchargeons sinon on utilise le fichier local existant. Nous commençons par l'extraction des données qui nous intéressent. D'abord nous découpons le contenu du fichier en lignes, dont nous jetons la première qui ne contient qu'un commentaire. Les autres lignes sont découpées en colonnes.
#+BEGIN_SRC python :results output :var data_url=data-url #+BEGIN_SRC python :results output :var data_url=data-url
import os import os
from urllib.request import urlopen from urllib.request import urlopen
#data = None
if os.path.exists("incidence-PAY-3.csv"): if os.path.exists("incidence-PAY-3.csv"):
with open("incidence-PAY-3.csv", 'r', encoding='latin') as file: with open("incidence-PAY-3.csv", 'r', encoding='latin') as file:
data = "".join(file.readlines()) data = "".join(file.readlines())