Ces données proviennent directement des recherches menées par le chercheur David Gillan de l’université de Mons et ses collaborateurs:
Le document mis à votre disposition est un fichier Excel qui comprend deux feuilles :
- raw
- phylum_raw
-
Organisez votre projet en un ensemble de sous-dossiers : analysis, R, images,…
-
Créez un rapport d’analyse organisé en section : introduction, Matériels et méthodes,…
-
Importez les données du fichier shot_gun_dcg.xlsx présent dans le dossier data.
-
De quel type de tableau de données s’agit-il ?
meta <- read("data/shot_gun_dcg.xlsx")
#> New names:
#> * `` -> ...1
- Reproduisez ce graphique dans votre rapport
La fonction read()
importe la première feuille si vous ne spécifiez
pas la feuille que vous souhaitez. Cette fonction utilise en interne la
fonction read_excel()
pour importer les données au format xlsx.
- Importez également la seconde feuille du fichier
shot_gun_dcg.xlsx qui se nomme phylum_raw. Pour cela,
utilisez l’aide de la fonction
read_excel()
pour voir comment faire.
?readxl::read_excel
La fonction ci-dessous permet de prendre connaissance des formats
supportés par la fonction read()
data_types()
-
Produisez un graphique en barres afin de représenter les données de cette seconde feuille
-
Les données brutes de cette étude se trouvent dans le dossier raw (dans le dossier data), que-pensez vous de ce type d’encodage de données ? Détaillez votre réflexion
- Tentez de reproduire dans votre rapport, la figure 2 de l’article. (Fig. 2. Composition of the bacterial communities of 4 soil samples (Bacterial Phyla) as revealed by shotgun metagenomics and MG- RAST (% of sequences normalized by the number of sequences identified as Bacteria).)