Skip to content

Commit 36f77ba

Browse files
committed
Merge remote-tracking branch 'origin/master' into cwl
2 parents fd61d51 + d54eab5 commit 36f77ba

Some content is hidden

Large Commits have some content hidden by default. Use the searchbox below for content that may be hidden.

77 files changed

+7943
-31
lines changed

README.md

-5
Original file line numberDiff line numberDiff line change
@@ -1,8 +1,3 @@
11
Face aux masses de données disponibles, à la multitude d’outils existants et au caractère complexe des protocoles d’analyse de données scientifiques, reproduire une expérience est particulièrement difficile, comme en témoignent de nombreuses études récentes. [ReProVirtuFlow](https://www.madics.fr/actions/actions-en-cours/reprovirtuflow) est une action du [GDR MaDICS](https://www.madics.fr) qui vise à faire un état des lieux complet sur les approches existantes dans ce domaine en considérant en priorité comme éléments de solutions: (i) les workflows scientifiques (au sens large), (ii) la provenance des données, (iii) les machines virtuelles. Notre consortium regroupe des experts en bases de données, algorithmique, programmation, et environnements virtuels et des responsables de plateformes et centre de collecte de données scientifiques (biologie INSB et physique IN2P3).
22

33
Dans le cadre de notre action, nous lançons l'organisation d'une série de ReproHackathons visant à tester les capacités des systèmes de workflows disponibles à reproduire une expérience scientifique.
4-
5-
## Participants :
6-
7-
- Victoria Dominguez del Angel
8-
- Bérénice Batut

docs/_config.yml

+1-1
Original file line numberDiff line numberDiff line change
@@ -1 +1 @@
1-
theme: jekyll-theme-cayman
1+
theme: jekyll-theme-slate

docs/hackathon_1.md

+2-2
Original file line numberDiff line numberDiff line change
@@ -47,6 +47,6 @@ Le workflow peut se présenter comme cela:
4747
* [1] [Furney et al. (2013)](https://www.ncbi.nlm.nih.gov/pubmed/23861464)
4848
* [2] [Harbour et al. (2013)](https://www.ncbi.nlm.nih.gov/pubmed/23313955)
4949

50-
*La première édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr) et par le groupe Psay CompBio de l'Université Paris-Saclay*
50+
*La première édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr), par le groupe Psay CompBio de l'Université Paris-Saclay et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
5151

52-
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-paris-saclay.png)
52+
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![Paris-Saclay](https://ifb-elixirfr.github.io/ReproHackathon/logo-paris-saclay.png) ![IFB](https://ifb-elixirfr.github.io/ReproHackathon/logo-ifb.png)

docs/hackathon_1_programme.md

+5-2
Original file line numberDiff line numberDiff line change
@@ -2,9 +2,8 @@
22

33
## Lieu
44

5-
Le ReproHackathon se tiendra sur le campus CNRS de Gif-sur-Yvette, dans le bâtiment 34 en salle "Bibliothèque"
5+
Le ReproHackathon s'est tenu sur le campus CNRS de Gif-sur-Yvette, dans les bâtiments 34 et 21
66
([informations pratiques](http://www.france-bioinformatique.fr/fr/plan-daccès)).
7-
Vous pouvez également retrouver votre chemin en passant nous voir à nos bureaux au bâtiment 21.
87

98
## Jour 1, 1er Juin 2017
109

@@ -44,3 +43,7 @@ Analyse de données RNA-Seq issues de patients atteints de mélanome uvéal ([D
4443
15h30 Bilan du ReproHackathon
4544

4645
16h00 Fin du ReproHackathon
46+
47+
*La première édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr), par le groupe Psay CompBio de l'Université Paris-Saclay et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
48+
49+
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![Paris-Saclay](https://ifb-elixirfr.github.io/ReproHackathon/logo-paris-saclay.png) ![IFB](https://ifb-elixirfr.github.io/ReproHackathon/logo-ifb.png)

docs/hackathon_2.md

+27
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,27 @@
1+
# ReproHackathon-2, 9-10 juillet 2018
2+
3+
## Comparaison de programmes d'inférence phylogénétique
4+
5+
### Introduction
6+
7+
Dans cette deuxième édition du [reprohackathon](hackathon_2_programme.md), nous partirons de l'étude de Zhou et. al[1], dans laquelle les auteurs analysent de nombreux jeux de données phylogénomiques afin de comparer les principaux outils d'inférence phylogénétique :
8+
9+
- FastTree,
10+
- IQ-Tree,
11+
- PhyML,
12+
- RAxML.
13+
14+
Les jeux de données sont divers et chacun constitué de nombreux alignements de séquences de différents gènes, concernant entre 37 et 200 taxa. Ils sont disponibles publiquement sur [figshare](https://figshare.com/projects/Evaluating_fast_maximum_likelihood-based_phylogenetic_programs_using_empirical_phylogenomic_data_sets/22040).
15+
16+
### Objectif
17+
18+
Nous tenterons de réanalyser un sous ensemble du jeux de données que nous aurons choisi, afin de retrouver la tendance qui se dégage dans la [figure 2](https://academic.oup.com/view-large/figure/113627370/msx302f2.png).
19+
20+
Pour cela nous pourrons former des groupes qui travailleront sur des sous-parties du workflow général et pourront finalement combiner leurs résulats.
21+
22+
## Références
23+
* [1] [Zhou et al. (MBE, 2018)](https://www.ncbi.nlm.nih.gov/pubmed/29177474)
24+
25+
*Cette seconde édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr), le [GDR BIM](http://www.gdr-bim.cnrs.fr) et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
26+
27+
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![BIM](https://ifb-elixirfr.github.io/ReproHackathon/logo-gdrbim-web.jpg) ![IFB](https://ifb-elixirfr.github.io/ReproHackathon/logo-ifb.png)

docs/hackathon_2_programme.md

+40
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,40 @@
1+
# ReproHackathon-2
2+
3+
**9-10 juillet 2018**
4+
5+
La deuxième édition des [ReproHackathons](index.md) se tiendra au LBBE-PRABI, [Campus LyonTech-la Doua](https://www.univ-lyon1.fr/campus/plan-des-campus/) à Lyon.
6+
7+
## Cas d'usage
8+
9+
[Comparaison de programmes d'inférence phylogénétique](hackathon_2.md)
10+
11+
## Programme
12+
13+
### 9 juillet 2018
14+
15+
10h00 Accueil
16+
17+
* 10h30-11h30 : Présentation des use cases et du cloud de l'IFB
18+
* 11h30-12h30 : Démarrage du hackathon
19+
* 12h30-14h00 : *Pause déjeuner*
20+
* 14h00-17h30 : Phase 1 hackathon
21+
* 17h30-18h00 : Rapport d’avancement : tâches effectuées, difficultés rencontrées
22+
23+
### 10 juillet 2018
24+
25+
9h00 Accueil
26+
27+
* 9h00-12h00 : Phase 2 hackathon
28+
* 12h00–12h30 : Rapport d’avancement
29+
* 12h30-14h00 : *Pause déjeuner*
30+
* 14h00-16h00 : Phase finale hackathon
31+
* 16h00-16h30 : Rapport final d’avancement, conclusions
32+
33+
## Inscriptions
34+
35+
Les inscriptions se font via [ce formulaire](https://goo.gl/bhyVHW).
36+
37+
38+
*La seconde édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr), le [GDR BIM](http://www.gdr-bim.cnrs.fr) et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
39+
40+
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![BIM](https://ifb-elixirfr.github.io/ReproHackathon/logo-gdrbim-web.jpg) ![IFB](https://ifb-elixirfr.github.io/ReproHackathon/logo-ifb.png)

docs/index-en.md

+16-4
Original file line numberDiff line numberDiff line change
@@ -17,14 +17,26 @@ Participants are encouraged to form teams and select
1717

1818
## ReproHackathons, first edition
1919

20-
The first ReproHackathon will take place in [Gif-sur-Yvette](https://goo.gl/maps/ceg55oQTD6E2) the 1st and 2nd of June 2017.
20+
The first ReproHackathon took place in [Gif-sur-Yvette](https://goo.gl/maps/ceg55oQTD6E2) the 1st and 2nd of June 2017.
2121

2222
[Two use cases](Hackathon_1-en.md) have been selected:
2323
* RNA-Seq patient data analysis in the context of uveal melanoma ;
2424
* Phylogenetics data analysis and simulation.
2525

26-
Due to logistic constraints, **the number of participants is limited to 20**. When registering to the ReproHackathon event, you engage yourself to participate and contribute as a developer. A feedback event will be later on organized.
26+
## Steering Committee
2727

28-
*The first ReproHackathon is supported by [GDR MaDICS](https://www.madics.fr) and Psay CompBio of Université Paris-Saclay*
28+
* Sarah Cohen-Boulakia, Université Paris-Sud, Paris-Saclay, Orsay
29+
* Khalid Belhajjame, Université Paris-Dauphine, Paris
30+
* Christophe Blanchet, Institut Français de Bioinformatique, Gif-sur-Yvette
31+
* Alban Gaignard, CHU, Nantes
32+
* Konrad Hinsen, Centre de Biophysique Moléculaire, Orléans
33+
* Frédéric Lemoine, Institut Pasteur, Paris
34+
* Yvan Le Bras, Muséum National d'Histoire Naturelle, Concarneau
35+
* Fabien Mareuil, Institut Pasteur, Paris
36+
* Hervé Ménager, Institut Pasteur, Paris
37+
* Sandrine Perrin, Institut Français de Bioinformatique, Gif-sur-Yvette
38+
* Christophe Pradal, Cirad, Inria, Montpellier
2939

30-
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-paris-saclay.png)
40+
*The first ReproHackathon is supported by [GDR MaDICS](https://www.madics.fr), Psay CompBio of Université Paris-Saclay and the [French Institute of Bioinformatics](http://www.france-bioinformatique.fr).*
41+
42+
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![Paris-Saclay](https://ifb-elixirfr.github.io/ReproHackathon/logo-paris-saclay.png) ![IFB](https://ifb-elixirfr.github.io/ReproHackathon/logo-ifb.png)

docs/index.md

+7-16
Original file line numberDiff line numberDiff line change
@@ -13,34 +13,25 @@ Les participants pourront se regrouper en équipes et choisir :
1313
* un cas d’utilisation parmi ceux proposés,
1414
* un système de workflows pour implémenter le cas d’utilisation et tester s'ils retrouvent les résultats attendus.
1515

16-
## Première édition des ReproHackathons
16+
## Liste des ReproHackathons
1717

18-
La première édition des ReproHackathons se déroulera les 1-2 juin 2017 à Gif-sur-Yvette ([Informations pratiques et programme](hackathon_1_programme.md)).
19-
20-
### Cas d’utilisation
21-
22-
[Deux cas d’utilisation](hackathon_1.md) ont été sélectionnés
23-
* analyse de données RNA-Seq issues de patients atteints de mélanome uvéal
24-
* analyse et simulation de données phylogénétiques
25-
26-
### Inscription
27-
28-
Les inscriptions sont closes.
18+
* [Première édition](hackathon_1_programme.md), 1-2 juin 2017, IFB-core, Campus CNRS, Gif-sur-Yvette
19+
* [Deuxième édition](hackathon_2_programme.md), 9-10 juillet 2018, LBBE-PRABI, Campus LyonTech-la Doua, Lyon
2920

3021
## Comité d'organisation
3122

32-
* Christophe Blanchet, Institut Français de Bioinformatique, Gif-sur-Yvette
3323
* Sarah Cohen-Boulakia, Université Paris-Sud, Paris-Saclay, Orsay
3424
* Khalid Belhajjame, Université Paris-Dauphine, Paris
25+
* Christophe Blanchet, Institut Français de Bioinformatique, Gif-sur-Yvette
3526
* Alban Gaignard, CHU, Nantes
3627
* Konrad Hinsen, Centre de Biophysique Moléculaire, Orléans
3728
* Frédéric Lemoine, Institut Pasteur, Paris
3829
* Yvan Le Bras, Muséum National d'Histoire Naturelle, Concarneau
3930
* Fabien Mareuil, Institut Pasteur, Paris
4031
* Hervé Ménager, Institut Pasteur, Paris
41-
* Sandrine Perrin, Institut Français de Bioinformatique, Gif-sur-Yvette
4232
* Christophe Pradal, Cirad, Inria, Montpellier
33+
* Philippe Véber, Laboratoire de Biométrie et Biologie Evolutive, Lyon
4334

44-
*La première édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr) et par le groupe Psay CompBio de l'Université Paris-Saclay*
35+
*La série des ReproHackathons est (ou a été) soutenue par le [GDR MaDICS](https://www.madics.fr), le [GDR BIM](http://www.gdr-bim.cnrs.fr) , le groupe Psay CompBio de l'Université Paris-Saclay et l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
4536

46-
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-paris-saclay.png)
37+
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![BIM](https://ifb-elixirfr.github.io/ReproHackathon/logo-gdrbim-web.jpg) ![Paris-Saclay](https://ifb-elixirfr.github.io/ReproHackathon/logo-paris-saclay.png) ![IFB](https://ifb-elixirfr.github.io/ReproHackathon/logo-ifb.png)

docs/logo-gdrbim-web.jpg

18.1 KB
Loading

docs/logo-ifb.png

23.1 KB
Loading

docs/logo-madics.png

-57.7 KB
Loading

docs/pleniere2017.md

+56
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,56 @@
1+
# Journée MaDICS-ReproVirtuFlow 2017
2+
12 décembre 2017
3+
4+
Amphithéatre du bâtiment 21, Campus CNRS, Gif-sur-Yvette
5+
6+
[Plan d'accès](http://www.dr4.cnrs.fr/spip.php?article10)
7+
8+
## Contexte
9+
10+
L’objectif de cette journée est de présenter les activités de l’action ReproVirtuFlow, fondée et soutenue par le GDR MaDICS, qui s'intéresse à la problématique de reproductibilité computationnelle.
11+
12+
Face aux masses de données disponibles, à la multitude d’outils existants et à la complexité des analyse de données scientifiques, reproduire une expérience in-silico est une tâche particulièrement difficile. ReProVirtuFlow vise à faire un état des lieux (besoins et solutions) et à expérimenter les approches existantes, tirant partie de retours d’expérience multiples pour tendre vers la définition de bonnes pratiques. Notre consortium regroupe des experts en Base de Données, Développement Logiciel et Environnements Virtuels, ayant une longue expérience dans l’analyse de données à grande échelle. Il comporte aussi des responsables et utilisateurs de plateformes produisant et exploitant des données de diverses natures.
13+
14+
Les activités que nous avons menées durant les deux premières années de cette action nous ont permis de comprendre le paysage de la reproductibilité computationnelle en particulier lorsque les traitements de données sont effectués à l’aide de systèmes de workflows scientifiques.
15+
16+
La journée du 12 décembre 2017 présentera l’état de l’art que nous avons effectué des différents éléments de solutions disponibles à la communauté bioinformatique pour tendre vers une meilleure reproductibilité des analyses de données bioinformatiques.
17+
Elle comportera des retours d'expériences d’utilisateurs d’outils aidant à la reproductibilité computationnelle. En particulier, nous présenterons les résultats que nous avons obtenus au premier ReproHackathon organisé par notre groupe dans lequel plusieurs équipes ont cherché à reproduire les résultats d’une publication scientifique (voir le site du [premier ReproHackathon](https://ifb-elixirfr.github.io/ReproHackathon)).
18+
Notre journée comportera enfin des présentations sur les approches émergentes dans le domaine de la reproductibilité.
19+
20+
21+
## Programme
22+
23+
* 9h30 : Café de Bienvenue
24+
25+
* 10h00 : Sarah Cohen-Boulakia : Présentation de l’Action et Bilan.
26+
27+
* 10h30 : Retour sur le ReproHackathon
28+
* Frédéric Lemoine : Présentation du pipeline d’analyse et des données, tâches à effectuer par les participants et synthèse des résultats obtenus.
29+
* Christophe Blanchet : Le Cloud de l’IFB comme support du ReproHackathon, et les environnements virtuels mis à disposition.
30+
* Philippe Veber : Reproduction de l’analyse RNA-seq avec [bistro](https://github.com/IFB-ElixirFr/ReproHackathon/tree/master/reprohackathon1/bistro), une bibliothèque OCaml pour le développement de pipelines bioinformatiques.
31+
32+
* 12h00 : Repas
33+
34+
* 13h30 : Approches émergentes
35+
* Christophe Pradal : La reproductibilité des expériences en phénotypage haut-débit des plantes.
36+
* Konrad Hinsen : La reproductibilité des calculs numériques en HPC : problèmes et solutions existantes.
37+
* Alban Gaignard : Harmonisation de traces de provenance (ESWC workshop).
38+
39+
* 15h00 : Pause
40+
41+
* 15h30 : Discussion
42+
* S. Cohen-Boulakia, C. Blanchet : présentation des futures actions du groupe, appel à participation.
43+
44+
* 16h30 : Clôture de la journée
45+
46+
## Inscription
47+
48+
L’inscription est gratuite mais *obligatoire* et doit être effectuée avant le **8 décembre**.
49+
Pour vous inscrire il convient de vous inscrire d’abord au GDR MaDICS (merci de suivre les instructions sur le site).
50+
51+
[Formulaire d'inscription](https://www.madics.fr/event/1511189515-9975/?instance_id=770)
52+
53+
54+
*La journée ReproVirtuFlow 2017 est soutenue par le [GDR MaDICS](https://www.madics.fr), par le groupe Psay CompBio de l'Université Paris-Saclay et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
55+
56+
![MaDICS](https://ifb-elixirfr.github.io/ReproHackathon/logo-madics.png) ![Paris-Saclay](https://ifb-elixirfr.github.io/ReproHackathon/logo-paris-saclay.png) ![IFB](https://ifb-elixirfr.github.io/ReproHackathon/logo-ifb.png)

reprohackathon1/README.md

+117
Original file line numberDiff line numberDiff line change
@@ -9,6 +9,27 @@ Ce dossier contient les résultats du ReproHackathon1
99
* de l'avancement au fur et à mesure
1010
* un bilan des réalisations en fin de hackathon
1111

12+
## Participants/Groupes :
13+
14+
* [bistro](https://github.com/pveber/bistro) (OCaml library for distributed workflows)
15+
* Philippe Veber
16+
* galaxy
17+
* *Prénom Nom?*
18+
* nextflow
19+
* *Prénom Nom?*
20+
* snakemake1
21+
* *Prénom Nom?*
22+
* snakemake2
23+
* *Prénom Nom?*
24+
* jupyter
25+
* Loïc Paulevé
26+
* NodeJS
27+
- Guillaume Launay
28+
- Mélanie Garnier
29+
* *groupe ?*
30+
- Victoria Dominguez del Angel
31+
- Bérénice Batut
32+
1233

1334
## Liens utiles
1435

@@ -23,3 +44,99 @@ Ce dossier contient les résultats du ReproHackathon1
2344
* R/DEXSeq : ['flemoine/r-rnaseq'](https://hub.docker.com/r/flemoine/r-rnaseq/)
2445
* SAMTOOLS ['flemoine/samtools'](https://hub.docker.com/r/flemoine/samtools/)
2546
* [Exemple de workflow](https://github.com/fredericlemoine/rna-pipeline/tree/master/pmid_23313955)
47+
* [Données à traiter](http://appliances.france-bioinformatique.fr/reprohackathon/)
48+
49+
## Quelques commandes utiles?
50+
### Fix Docker net host
51+
```bash
52+
iptables -I FORWARD -p tcp --tcp-flags SYN,RST SYN -j TCPMSS --clamp-mss-to-pmtu
53+
```
54+
### Get public IP
55+
```PUBLIC_IP=$(curl http://169.254.169.254/latest/meta-data/public-ipv4)```
56+
57+
### Téléchargement fichiers
58+
```bash
59+
for sraid in SRR628582 SRR628583 SRR628584 SRR628585 SRR628586 SRR628587 SRR628588 SRR628589
60+
do
61+
wget http://appliances.france-bioinformatique.fr/reprohackathon/${sraid}.sra
62+
done
63+
```
64+
### Conversion en FASTQ
65+
```bash
66+
for sraid in SRR628582 SRR628583 SRR628584 SRR628585 SRR628586 SRR628587 SRR628588 SRR628589
67+
do
68+
fastq-dump --gzip --split-files ${sraid}.sra
69+
done
70+
```
71+
=> Pour gagner de la place, supprimer les SRA peut être…
72+
73+
### Téléchargement génomes
74+
```bash
75+
for chr in chr1 chr2 chr3 chr4 chr5 chr6 chr7 chr8 chr9 chr10 chr11 chr12 chr13 chr14 chr15 chr16 chr17 chr18 chr19 chr20 chr21 chr22 chrM chrX chrY
76+
do
77+
wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/${chr}.fa.gz
78+
done
79+
```
80+
### Création index STAR
81+
```bash
82+
mkdir ref
83+
gunzip -c *.fa.gz > ref.fa
84+
STAR --runThreadN 10 --runMode genomeGenerate --genomeDir ref/ --genomeFastaFiles ref.fa
85+
rm -f ref.fa
86+
```
87+
88+
* Fichiers en sortie
89+
```
90+
ref/
91+
├── chrLength.txt
92+
├── chrNameLength.txt
93+
├── chrName.txt
94+
├── chrStart.txt
95+
├── Genome
96+
├── genomeParameters.txt
97+
├── SA
98+
└── SAindex
99+
```
100+
101+
### Alignement
102+
```bash
103+
for sraid in SRR628582 SRR628583 SRR628584 SRR628585 SRR628586 SRR628587 SRR628588 SRR628589
104+
do
105+
STAR --outSAMstrandField intronMotif \
106+
--outFilterMismatchNmax 4 \
107+
--outFilterMultimapNmax 10 \
108+
--genomeDir ref \
109+
--readFilesIn <(gunzip -c ${sraid}_1.fastq.gz) <(gunzip -c ${sraid}_2.fastq.gz) \
110+
--runThreadN 10 \
111+
--outSAMunmapped None \
112+
--outSAMtype BAM SortedByCoordinate \
113+
--outStd BAM_SortedByCoordinate \
114+
--genomeLoad NoSharedMemory \
115+
--limitBAMsortRAM 3000000000 > ${sraid}.bam
116+
done
117+
```
118+
119+
Si besoin les bam sont également disponibles ici:
120+
```bash
121+
for sraid in SRR628582 SRR628583 SRR628584 SRR628585 SRR628586 SRR628587 SRR628588 SRR628589
122+
do
123+
wget http://appliances.france-bioinformatique.fr/reprohackathon/${sraid}.bam
124+
done
125+
```
126+
127+
### Comptages
128+
129+
Pour DEXseq, il est demandé si la librarie est spécifique à un brin. Pour avoir cette information, on peut inférer cette information
130+
131+
1. Mapper un échantillon des reads sur le génome de référence
132+
2. Inférer les statistiques du type de librairies avec `infer_experiment.py` de [RSeQC](http://rseqc.sourceforge.net/) à partir du reads pré-mappés et les annotations des gènes (fichier GTF)
133+
134+
Tableau de correspondance:
135+
136+
Sequencing type | **Infer Experiment** | **TopHat** | **HISAT2** | **htseq-count** | **featureCounts**
137+
--- | --- | --- | --- | --- | ---
138+
Paired-End (PE) | "1++,1--,2+-,2-+" | "FR Second Strand" | "Second Strand F/FR" | "yes" | "1"
139+
PE | "1+-,1-+,2++,2--" | "FR First Strand" | "First Strand R/RF" | "reverse" | "2"
140+
Single-End (SE) | "++,--" | "FR Second Strand" | "Second Strand F/FR" | "yes" | "1"
141+
SE | "+-,-+" | "FR First Strand" | "First Strand R/RF" | "reverse" | "2"
142+
SE,PE | undecided | "FR Unstranded" | default | "no" | "0"

reprohackathon1/bistro/.merlin

+3
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,3 @@
1+
PKG bistro.bioinfo
2+
PKG bistro.utils
3+
PKG core

0 commit comments

Comments
 (0)