Installer Anaconda.
Il est possible de développer en langage Python en installant l’exécutable python.exe et le petit écosystème autour de Python en se rendant sur le site de python.org. Mais il existe une solution plus adaptée à l’analyse de données. Cette solution (Open Source) c’est Anaconda.
Anaconda est une distribution de Python spécialement destinée au calcul scientifique, à l’analyse des données et à l’apprentissage automatique. L’objectif de ce projet Open-Source commencé en 2012 était de regrouper les librairies Python en relation avec ces domaines et de faciliter l’installation et le management de ces librairies. Il permet d’organiser ses projets et de les déployer facilement. Anaconda maintient son propre « repository » de librairies et il est possible pour tout développeur d’y charger ses créations s’il le souhaite, afin de le partager avec la communauté Python. Anaconda est totalement compatible avec PyPI, l’installateur de librairies standard de Python. Avec Anaconda, vous avez, de façon très simple, accès à toutes les librairies Open-Source de Python.
Télécharger la dernière distribution d’Anaconda.
Pour cela, rendez-vous sur le site d’anaconda (www.anaconda.com) et cliquez sur Get Started.
Vous devriez voir ce petit message. Cliquez sur Download Anaconda Installer
Puis chargez l’exécutable d’installation qui correspond à votre système d’exploitation. Anaconda existe pour Window, MacOS et Lunix.
Le chargement peut prendre un peu de temps en fonction du débit de votre connexion internet. L’exécutable fait entre 400 et 550 MB tout de même. Une fois le fichier chargé, lancez-le, et suivez les instructions d’installation standard comme indiqué ci-dessous:
N’ajoutez pas le chemin des exécutables Anaconda à votre variable PATH (ça n’a probablement pas d’importance sauf si vous n’utilisez pas d’autres programmes en python sur votre machine). Mais enregistrez Anaconda comme votre interpréteur Python par défaut, cela facilitera l’utilisation de certains outils par la suite.
Tester son installation
Sans entrer trop entrer dans les détails, nous allons tester que le système est fonctionnel. Pour cela, il faut lancer Anaconda Prompt, la CLI (Command Line Interface) d’Anaconda. Sous windows, tapez anaconda dans votre barre de recherche (idem sous MacOS) et cliquez sur Anaconda Prompt (Anaconda 3):
Une fenêtre de commande va s’ouvrir qui ressemble à cela :
Le prompt indique (base) puis le chemin actuel, probablement C:\Users\{votre nom d’utilisateur}>
Ceci indique que conda est dans son environnement de base, celui dans lequel nous ne travaillons jamais. Avant de créer un environnement de travail, nous allons vérifier que notre version est bien la plus récente. Pour cela, tapez la commande ci-dessous, puis Enter.
conda update -n base -c defaults conda
Si vous n’êtes pas familier avec la syntaxe de la CLI, je vous explique les différents éléments:
conda c’est l’instruction qui commande a anaconda de faire quelque chose. Ici, ce que nous demandons, c’est de mettre à jour: update. -n indique un argument, ici le nom de l’environnement que nous souhaitons mettre à jour, base. -c est un second argument qui indique a anaconda dans quel « channel » (j’y reviendrais plus tard) il doit chercher ce que nous voulons mettre à jour. ce « channel » ici est defaults, c’est-à-dire ceux qui se trouvent dans la configuration par défaut. Enfin, nous devons préciser ce que nous voulons mettre à jour, ici conda. Et oui, nous utilisons cette même commande que nous souhaitons mettre à jour. Après quelques secondes, anaconda devrait vous presenter des informations similaires à ceci:
Dans mon cas, il y a effectivement une mise à jour disponible. Si c’est le cas, acceptez la mise à jour, tapez « y » et Enter. Laissez l’installation se faire.
Félicitations ! Vous avez maintenant un environnement prêt pour commencer les choses sérieuses !