Créer un environnement de travail
Pour suivre ce tutoriel, il faut avoir une version d’Anaconda installée sur votre ordinateur. Si ce n’est pas le cas, suivez les instructions ici.
Pour pouvoir faire fonctionner votre programme, vous aurez certainement besoin de certaines librairies qui ne font pas partie de la librairie standard. La plupart des librairies que nous allons utiliser dans les différents exemples de ce site doivent être ajoutées. Nous pourrions très bien toutes les charger dans notre environnement de base. Cela fonctionnerait très bien, au moins au début. Cependant, et je le souhaite, vous allez vous lancer dans plusieurs projets, qui nécessiteront des librairies parfois différentes, avec, elles-mêmes, des dépendances à d’autres librairies… Bref, si vous n’utilisez qu’un seul environnement, il va rapidement devenir un vrai capharnaüm !
Heureusement, Python offre la possibilité de créer et de manager très facilement des environnements virtuels. C’est simplement un moyen d’installer les librairies (les dépendances de votre code) dans un endroit particulier et de permettre à votre programme de les trouver lorsqu’il en a besoin. En créant des environnements séparés en fonction des besoins de votre projet, vous allez vous éviter bien des complications et des problèmes de compatibilité. Sans compter que les librairies open source évoluent parfois assez vite, et vous aurez envie de tester votre code avec ces nouvelles versions, sans toucher à l’environnement dans lequel vous savez que votre programme fonctionne. Dans ce cas, il suffit de créer un nouvel environnement avec les librairies et les versions que vous souhaitez, de tester votre programme, et éventuellement d’adopter les nouvelles versions de vos dépendances.
Créer un environnement virtuel avec conda.
Ouvrez la CLI d’Anaconda, en cherchant dans votre menu démarrer Anaconda Prompt (Anaconda 3). Vous trouvez alors l’interface de commande sous cette forme :
(base) devant le chemin actuel indique dans quel environnement virtuel vous vous situez.
Ne modifiez pas votre environnement de base.
Préférez créer un environnement de travail pour chacun de vos projets.
Il est très facile de créer, modifier et d’effacer les environnements virtuels avec conda. Alors autant ne pas s’en priver. Et cela vous évitera bien des désagréments par la suite.
Nous allons créer un environnement avec le minimum requis pour explorer et visualiser des données. C’est l’environnement que je vais utiliser dans la plupart des articles et tutoriels en rapport avec des concepts de base en Python et en exploration de données. Il va nous servir dans plusieurs exemples, il est donc important de l’installer. Dans cet environnement, nous allons ajouter les librairies suivantes :
- pandas, pour l’exploration de données.
- matplotlib, pour la visualisation a l’aide de graphiques.
- jupyter, afin de bénéficier d’un environnement de travail interactif bien utile.
Pour créer l’environnement, nous utilisons la commande conda avec les arguments suivant:
- create: nous voulons creer un nouvel environnement
- -n data-explore : indique que le nom de notre environnement sera data-explore
- puis vient la liste des librairies à installer, séparées par un espace.
conda create -n data-explore pandas matplotlib jupyter
Après quelques secondes de recherche, conda vous propose une longue liste de librairies à installer. Il s’agit des trois librairies que nous avons demandées dans l’instruction de création, plus toutes les librairies dont pandas, matplotlib et jupyter ont besoin pour fonctionner…
C’est conda qui effectue le travail de recherche de dépendance et s’assure que tout est bien installé.
Tout en pas de la liste, conda attend une confirmation pour finaliser l’installation. Tapez « y«
L’installation commence, cela peut prendre quelques minutes, patience.
Une fois l’installation terminée, conda indique comment activer l’environnement afin de travailler avec :
conda activate data-explore
Vous voyez que le nom de l’environnement qui a été activé figure devant le chemin actuel. Nous sommes prêts à commencer…