Exploration de données avec R

À propos

Hex logo that says "Data Science in a Box"

Ce document est conçu comme une introduction méthodologique et pratique à l’utilisation de R, un logiciel libre et un langage de programmation incontournable dans les domaines de l’analyse statistique et de la science des données. Il s’adresse à toute personne souhaitant acquérir une maîtrise des concepts nécessaires pour une utilisation autonome et efficace de cet environnement de travail.

Ce manuel a pour objectif de vous permettre de :

  • Acquérir une maîtrise des concepts fondamentaux : Présenter les bases de la syntaxe et des structures de données de R, tout en vous familiarisant avec l’environnement de développement intégré (IDE, en anglais) RStudio, un atout majeur pour faciliter le flux de travail d’analyse.

  • Développer des compétences en manipulation de données : Apprendre les techniques d’importation, de transformation et de nettoyage des jeux de données, compétences cruciales pour la préparation des données à l’analyse.

  • Maîtriser les principes de la visualisation de données : S’initier à la création de graphiques clairs et informatifs pour l’exploration et la communication des résultats.

  • S’initier à la programmation fonctionnelle : Explorer les principes de la programmation en R, notamment à travers l’utilisation de fonctions et de structures de contrôle, afin d’automatiser des tâches et de développer des scripts réutilisables.

Ce document s’appuie sur une synthèse rigoureuse de ressources pédagogiques de premier plan, dont la liste exhaustive ne peut être présentée ici. Toutefois, les références suivantes se distinguent par leur contribution significative à ce travail. Elles peuvent également servir de sources complémentaires pour approfondir vos connaissances :