Ce projet nécessite d’avoir assimilé l’ensemble des notions du sixième module du cours de science des données biologiques 2. Il correspond au dépôt GitHub https://github.com/BioDataScience-Course/B06Ia_fish_market. Il est distribué sous licence CC BY-NC-SA 4.0.
Ce projet est individuel et cadré. Il vous permet de compléter vos compétences en statistiques multivariées en développant les aptitudes suivantes :
- Pouvoir calculer des matrices de distances avec un indice de distance judicieusement choisi
- Être capable de réaliser des dendrogrammes (CAH) avec la méthode de liens la plus adéquate et les interpréter
- Pouvoir réaliser et interpréter une analyse par les k-moyennes
- Comparer les méthodes des k-moyennes et CAH afin de choisir celle qui convient le mieux à chaque analyse
Réalisez une exploration multivariée de données mesurées sur des poissons issus d'un marché matinal.
Complétez le fichier fish_notebook.qmd.
N'oubliez pas de réaliser un "Rendu" de vos documents en HTML à la fin pour vérifier que tout fonctionne bien (attention : si le document ne compile pas sans erreurs, vous n'aurez pas de points pour ce projet) et utilisez les tests à disposition dans l'onglet "Construire" -> bouton "Construire tout". Corrigez les erreurs éventuelles rencontrées à ce stade avant de clôturer votre travail. Vérifiez également que votre dernier commit a bien été pushé sur GitHub avant la deadline.
Dans le cadre de votre travail, vous pouvez utiliser l’intelligence artificielle. Il est toutefois impératif de préciser, dans la section « Matériel et méthodes » du projet, que l’IA a été utilisée, en indiquant le contexte et la manière dont elle a été employée. Voici un exemple de formulation :
La relecture (orthographe et syntaxe) a été réalisée à l’aide de Microsoft Copilot (basé sur GPT-5), consulté le 12 janvier 2026.
Attention, vous devez néanmoins employer le dialecte SciViews-R afin de garantir votre compréhension du cours de Science des données biologiques 2 lors de la production de code R dans votre projet.
Un chatbot SciViews est également disponible dans RStudio (Saturn Cloud), via l’addin Help. Il répond aux questions relatives au langage R, aux statistiques et à la science des données.
Les données employées proviennent du site Kaggle : https://www.kaggle.com/datasets/vipullrathod/fish-market/data. Il s'agit de mesures morphométriques sur sept espèces de poissons prélevés sur un marché.