Nous y sommes… - Dans la data jusqu'au cou...

…

Dans la Data, et jusqu’au cou ! Des térabits s’accumulent un peu plus chaque jour. Captures, mesures, textes, audio, vidéo, l’Humanité n’a jamais généré et stocké autant de données brutes, de métadonnées, de données transformées.

Et c’est une bonne nouvelle !

Jamais auparavant nous n’avons disposé de tant de moyens nous permettant d’explorer ces données, de les comprendre et d’inférer des nouvelles connaissances à partir d’elles. L’autre bonne nouvelle, c’est qu’il n’a jamais été aussi facile d’accéder à des outils puissants et efficaces pour traiter les données. Un tout nouvel univers de possibilités de développement de notre compréhension du monde et de son fonctionnement est accessible à tous.

Oui, à tous, pour peu que nous décidions de le faire. Et c’est l’objectif de ce blog ! Vous donner un point de départ dans cette aventure vers la Data Science…

Alors, qu’est-ce qu’on attend ?

Je vous l’accorde, il est temps de s’y mettre. Découvrir tous ces jeux de données auxquels il est possible d’accéder. Apprendre à utiliser ces outils qui ne demandent qu’a être… Utilisés !

Je vais vous présenter, au fils des semaines, un certain nombre de ces concepts et outils de base. A commencer par Python, le langage de programmation le plus utilisé en Data Science, l’environnement de travail Anaconda, et son système génial de distribution des packages Python, Le notebook de Jupyter qui permet de chercher et prototyper vos visualisations, un IDE (Integrated Development Environment) qui ne manque pas de charme(!) et tant d’autres choses…

Ajoutons à cela quelques astuces pour développer en Python, ranger son code, le tester, écrire de la documentation (si, si, il faut!) et bien d’autres conseils pour vous faciliter la vie.