You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Face aux masses de données disponibles, à la multitude d’outils existants et au caractère complexe des protocoles d’analyse de données scientifiques, reproduire une expérience est particulièrement difficile, comme en témoignent de nombreuses études récentes. [ReProVirtuFlow](https://www.madics.fr/actions/actions-en-cours/reprovirtuflow) est une action du [GDR MaDICS](https://www.madics.fr) qui vise à faire un état des lieux complet sur les approches existantes dans ce domaine en considérant en priorité comme éléments de solutions: (i) les workflows scientifiques (au sens large), (ii) la provenance des données, (iii) les machines virtuelles. Notre consortium regroupe des experts en bases de données, algorithmique, programmation, et environnements virtuels et des responsables de plateformes et centre de collecte de données scientifiques (biologie INSB et physique IN2P3).
2
2
3
3
Dans le cadre de notre action, nous lançons l'organisation d'une série de ReproHackathons visant à tester les capacités des systèmes de workflows disponibles à reproduire une expérience scientifique.
Copy file name to clipboardExpand all lines: docs/hackathon_1.md
+2-2
Original file line number
Diff line number
Diff line change
@@ -47,6 +47,6 @@ Le workflow peut se présenter comme cela:
47
47
*[1][Furney et al. (2013)](https://www.ncbi.nlm.nih.gov/pubmed/23861464)
48
48
*[2][Harbour et al. (2013)](https://www.ncbi.nlm.nih.gov/pubmed/23313955)
49
49
50
-
*La première édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr) et par le groupe Psay CompBio de l'Université Paris-Saclay*
50
+
*La première édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr), par le groupe Psay CompBio de l'Université Paris-Saclay et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
Vous pouvez également retrouver votre chemin en passant nous voir à nos bureaux au bâtiment 21.
8
7
9
8
## Jour 1, 1er Juin 2017
10
9
@@ -44,3 +43,7 @@ Analyse de données RNA-Seq issues de patients atteints de mélanome uvéal ([D
44
43
15h30 Bilan du ReproHackathon
45
44
46
45
16h00 Fin du ReproHackathon
46
+
47
+
*La première édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr), par le groupe Psay CompBio de l'Université Paris-Saclay et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
## Comparaison de programmes d'inférence phylogénétique
4
+
5
+
### Introduction
6
+
7
+
Dans cette deuxième édition du [reprohackathon](hackathon_2_programme.md), nous partirons de l'étude de Zhou et. al[1], dans laquelle les auteurs analysent de nombreux jeux de données phylogénomiques afin de comparer les principaux outils d'inférence phylogénétique :
8
+
9
+
- FastTree,
10
+
- IQ-Tree,
11
+
- PhyML,
12
+
- RAxML.
13
+
14
+
Les jeux de données sont divers et chacun constitué de nombreux alignements de séquences de différents gènes, concernant entre 37 et 200 taxa. Ils sont disponibles publiquement sur [figshare](https://figshare.com/projects/Evaluating_fast_maximum_likelihood-based_phylogenetic_programs_using_empirical_phylogenomic_data_sets/22040).
15
+
16
+
### Objectif
17
+
18
+
Nous tenterons de réanalyser un sous ensemble du jeux de données que nous aurons choisi, afin de retrouver la tendance qui se dégage dans la [figure 2](https://academic.oup.com/view-large/figure/113627370/msx302f2.png).
19
+
20
+
Pour cela nous pourrons former des groupes qui travailleront sur des sous-parties du workflow général et pourront finalement combiner leurs résulats.
21
+
22
+
## Références
23
+
*[1][Zhou et al. (MBE, 2018)](https://www.ncbi.nlm.nih.gov/pubmed/29177474)
24
+
25
+
*Cette seconde édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr), le [GDR BIM](http://www.gdr-bim.cnrs.fr) et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
La deuxième édition des [ReproHackathons](index.md) se tiendra au LBBE-PRABI, [Campus LyonTech-la Doua](https://www.univ-lyon1.fr/campus/plan-des-campus/) à Lyon.
6
+
7
+
## Cas d'usage
8
+
9
+
[Comparaison de programmes d'inférence phylogénétique](hackathon_2.md)
10
+
11
+
## Programme
12
+
13
+
### 9 juillet 2018
14
+
15
+
10h00 Accueil
16
+
17
+
* 10h30-11h30 : Présentation des use cases et du cloud de l'IFB
18
+
* 11h30-12h30 : Démarrage du hackathon
19
+
* 12h30-14h00 : *Pause déjeuner*
20
+
* 14h00-17h30 : Phase 1 hackathon
21
+
* 17h30-18h00 : Rapport d’avancement : tâches effectuées, difficultés rencontrées
22
+
23
+
### 10 juillet 2018
24
+
25
+
9h00 Accueil
26
+
27
+
* 9h00-12h00 : Phase 2 hackathon
28
+
* 12h00–12h30 : Rapport d’avancement
29
+
* 12h30-14h00 : *Pause déjeuner*
30
+
* 14h00-16h00 : Phase finale hackathon
31
+
* 16h00-16h30 : Rapport final d’avancement, conclusions
32
+
33
+
## Inscriptions
34
+
35
+
Les inscriptions se font via [ce formulaire](https://goo.gl/bhyVHW).
36
+
37
+
38
+
*La seconde édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr), le [GDR BIM](http://www.gdr-bim.cnrs.fr) et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
Copy file name to clipboardExpand all lines: docs/index-en.md
+16-4
Original file line number
Diff line number
Diff line change
@@ -17,14 +17,26 @@ Participants are encouraged to form teams and select
17
17
18
18
## ReproHackathons, first edition
19
19
20
-
The first ReproHackathon will take place in [Gif-sur-Yvette](https://goo.gl/maps/ceg55oQTD6E2) the 1st and 2nd of June 2017.
20
+
The first ReproHackathon took place in [Gif-sur-Yvette](https://goo.gl/maps/ceg55oQTD6E2) the 1st and 2nd of June 2017.
21
21
22
22
[Two use cases](Hackathon_1-en.md) have been selected:
23
23
* RNA-Seq patient data analysis in the context of uveal melanoma ;
24
24
* Phylogenetics data analysis and simulation.
25
25
26
-
Due to logistic constraints, **the number of participants is limited to 20**. When registering to the ReproHackathon event, you engage yourself to participate and contribute as a developer. A feedback event will be later on organized.
26
+
## Steering Committee
27
27
28
-
*The first ReproHackathon is supported by [GDR MaDICS](https://www.madics.fr) and Psay CompBio of Université Paris-Saclay*
28
+
* Sarah Cohen-Boulakia, Université Paris-Sud, Paris-Saclay, Orsay
29
+
* Khalid Belhajjame, Université Paris-Dauphine, Paris
30
+
* Christophe Blanchet, Institut Français de Bioinformatique, Gif-sur-Yvette
31
+
* Alban Gaignard, CHU, Nantes
32
+
* Konrad Hinsen, Centre de Biophysique Moléculaire, Orléans
33
+
* Frédéric Lemoine, Institut Pasteur, Paris
34
+
* Yvan Le Bras, Muséum National d'Histoire Naturelle, Concarneau
35
+
* Fabien Mareuil, Institut Pasteur, Paris
36
+
* Hervé Ménager, Institut Pasteur, Paris
37
+
* Sandrine Perrin, Institut Français de Bioinformatique, Gif-sur-Yvette
*The first ReproHackathon is supported by [GDR MaDICS](https://www.madics.fr), Psay CompBio of Université Paris-Saclay and the [French Institute of Bioinformatics](http://www.france-bioinformatique.fr).*
Copy file name to clipboardExpand all lines: docs/index.md
+7-16
Original file line number
Diff line number
Diff line change
@@ -13,34 +13,25 @@ Les participants pourront se regrouper en équipes et choisir :
13
13
* un cas d’utilisation parmi ceux proposés,
14
14
* un système de workflows pour implémenter le cas d’utilisation et tester s'ils retrouvent les résultats attendus.
15
15
16
-
## Première édition des ReproHackathons
16
+
## Liste des ReproHackathons
17
17
18
-
La première édition des ReproHackathons se déroulera les 1-2 juin 2017 à Gif-sur-Yvette ([Informations pratiques et programme](hackathon_1_programme.md)).
19
-
20
-
### Cas d’utilisation
21
-
22
-
[Deux cas d’utilisation](hackathon_1.md) ont été sélectionnés
23
-
* analyse de données RNA-Seq issues de patients atteints de mélanome uvéal
24
-
* analyse et simulation de données phylogénétiques
25
-
26
-
### Inscription
27
-
28
-
Les inscriptions sont closes.
18
+
*[Première édition](hackathon_1_programme.md), 1-2 juin 2017, IFB-core, Campus CNRS, Gif-sur-Yvette
19
+
*[Deuxième édition](hackathon_2_programme.md), 9-10 juillet 2018, LBBE-PRABI, Campus LyonTech-la Doua, Lyon
29
20
30
21
## Comité d'organisation
31
22
32
-
* Christophe Blanchet, Institut Français de Bioinformatique, Gif-sur-Yvette
33
23
* Sarah Cohen-Boulakia, Université Paris-Sud, Paris-Saclay, Orsay
34
24
* Khalid Belhajjame, Université Paris-Dauphine, Paris
25
+
* Christophe Blanchet, Institut Français de Bioinformatique, Gif-sur-Yvette
35
26
* Alban Gaignard, CHU, Nantes
36
27
* Konrad Hinsen, Centre de Biophysique Moléculaire, Orléans
37
28
* Frédéric Lemoine, Institut Pasteur, Paris
38
29
* Yvan Le Bras, Muséum National d'Histoire Naturelle, Concarneau
39
30
* Fabien Mareuil, Institut Pasteur, Paris
40
31
* Hervé Ménager, Institut Pasteur, Paris
41
-
* Sandrine Perrin, Institut Français de Bioinformatique, Gif-sur-Yvette
42
32
* Christophe Pradal, Cirad, Inria, Montpellier
33
+
* Philippe Véber, Laboratoire de Biométrie et Biologie Evolutive, Lyon
43
34
44
-
*La première édition des ReproHackathons est soutenue par le [GDR MaDICS](https://www.madics.fr) et par le groupe Psay CompBio de l'Université Paris-Saclay*
35
+
*La série des ReproHackathons est (ou a été) soutenue par le [GDR MaDICS](https://www.madics.fr), le [GDR BIM](http://www.gdr-bim.cnrs.fr) , le groupe Psay CompBio de l'Université Paris-Saclay et l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
L’objectif de cette journée est de présenter les activités de l’action ReproVirtuFlow, fondée et soutenue par le GDR MaDICS, qui s'intéresse à la problématique de reproductibilité computationnelle.
11
+
12
+
Face aux masses de données disponibles, à la multitude d’outils existants et à la complexité des analyse de données scientifiques, reproduire une expérience in-silico est une tâche particulièrement difficile. ReProVirtuFlow vise à faire un état des lieux (besoins et solutions) et à expérimenter les approches existantes, tirant partie de retours d’expérience multiples pour tendre vers la définition de bonnes pratiques. Notre consortium regroupe des experts en Base de Données, Développement Logiciel et Environnements Virtuels, ayant une longue expérience dans l’analyse de données à grande échelle. Il comporte aussi des responsables et utilisateurs de plateformes produisant et exploitant des données de diverses natures.
13
+
14
+
Les activités que nous avons menées durant les deux premières années de cette action nous ont permis de comprendre le paysage de la reproductibilité computationnelle en particulier lorsque les traitements de données sont effectués à l’aide de systèmes de workflows scientifiques.
15
+
16
+
La journée du 12 décembre 2017 présentera l’état de l’art que nous avons effectué des différents éléments de solutions disponibles à la communauté bioinformatique pour tendre vers une meilleure reproductibilité des analyses de données bioinformatiques.
17
+
Elle comportera des retours d'expériences d’utilisateurs d’outils aidant à la reproductibilité computationnelle. En particulier, nous présenterons les résultats que nous avons obtenus au premier ReproHackathon organisé par notre groupe dans lequel plusieurs équipes ont cherché à reproduire les résultats d’une publication scientifique (voir le site du [premier ReproHackathon](https://ifb-elixirfr.github.io/ReproHackathon)).
18
+
Notre journée comportera enfin des présentations sur les approches émergentes dans le domaine de la reproductibilité.
19
+
20
+
21
+
## Programme
22
+
23
+
* 9h30 : Café de Bienvenue
24
+
25
+
* 10h00 : Sarah Cohen-Boulakia : Présentation de l’Action et Bilan.
26
+
27
+
* 10h30 : Retour sur le ReproHackathon
28
+
* Frédéric Lemoine : Présentation du pipeline d’analyse et des données, tâches à effectuer par les participants et synthèse des résultats obtenus.
29
+
* Christophe Blanchet : Le Cloud de l’IFB comme support du ReproHackathon, et les environnements virtuels mis à disposition.
30
+
* Philippe Veber : Reproduction de l’analyse RNA-seq avec [bistro](https://github.com/IFB-ElixirFr/ReproHackathon/tree/master/reprohackathon1/bistro), une bibliothèque OCaml pour le développement de pipelines bioinformatiques.
31
+
32
+
* 12h00 : Repas
33
+
34
+
* 13h30 : Approches émergentes
35
+
* Christophe Pradal : La reproductibilité des expériences en phénotypage haut-débit des plantes.
36
+
* Konrad Hinsen : La reproductibilité des calculs numériques en HPC : problèmes et solutions existantes.
37
+
* Alban Gaignard : Harmonisation de traces de provenance (ESWC workshop).
38
+
39
+
* 15h00 : Pause
40
+
41
+
* 15h30 : Discussion
42
+
* S. Cohen-Boulakia, C. Blanchet : présentation des futures actions du groupe, appel à participation.
43
+
44
+
* 16h30 : Clôture de la journée
45
+
46
+
## Inscription
47
+
48
+
L’inscription est gratuite mais *obligatoire* et doit être effectuée avant le **8 décembre**.
49
+
Pour vous inscrire il convient de vous inscrire d’abord au GDR MaDICS (merci de suivre les instructions sur le site).
*La journée ReproVirtuFlow 2017 est soutenue par le [GDR MaDICS](https://www.madics.fr), par le groupe Psay CompBio de l'Université Paris-Saclay et par l'[Institut Français de Bioinformatique](http://www.france-bioinformatique.fr).*
Pour DEXseq, il est demandé si la librarie est spécifique à un brin. Pour avoir cette information, on peut inférer cette information
130
+
131
+
1. Mapper un échantillon des reads sur le génome de référence
132
+
2. Inférer les statistiques du type de librairies avec `infer_experiment.py` de [RSeQC](http://rseqc.sourceforge.net/) à partir du reads pré-mappés et les annotations des gènes (fichier GTF)
0 commit comments