Skip to content

chberti/training

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

training

some training

Etat Global

  • API Flask qui expose une page simple sur l'endpoint /upload
  • En cas le POST, le fichier est chargé et un check de type CSV/XLSX sont effectués
  • Si c'est un CSV, alors on lance la fonction de traitement dans le module csv_importer
  • Si c'est un .xlsx, alors on lance la fonction d etraitement dans le module xlsx_importer
  • Si vous vous rendez sur l'endpoint /person (ou /job, ou /organization), vous aurez un .describe() de la table postgreSQL correspondante

csv_importer

Le csv_importer va traiter la table contenue dans le CSV pour extraire des colonnes, générer des id uniques pour nos 3 tables, puis charger les 3 dataframes dans une abse de données PostgreSQL locale (voir docker-compose)

xlsx_importer

Le xlsx_importer fait des opérations équivalentes au csv_importer.

Build

#Construction image docker
docker build -t current_app .

#Lancement des conteneurs
docker-compose up

TODO

  • Actuellement on fait un replace en Base de données. Pour améliorer cela, il faut charger les données déjà en base (SELECT * FROM {table}), effectuer une union avec le DataFrame courant, puis ré-écrire dans la base en mode replace.
  • Mettre de côté les fonctions de connexion à la base de données. Idem pour les fonctions de traitement de données. J'ai dupliqué les modules en avance de phase au acs où les fichiers avaient un schéma qui n'avait rien à voir entre la version CSV et la version XLSX.
  • Créer un fichier de configuration global de l'API Flask

About

some trining

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published