fix demux_just_fwd params

antgonza · antgonza · commit dea4fd948206 · 2025-09-05T07:45:53.000-06:00
diff --git a/src/sequence_processing_pipeline/Commands.py b/src/sequence_processing_pipeline/Commands.py
@@ -206,15 +206,15 @@ def cli():
 @click.option('--output', type=click.Path(exists=True), required=True)
 @click.option('--task', type=int, required=True)
 @click.option('--maxtask', type=int, required=True)
-def demux_just_fwd(id_map_fp, fp_fp, out_d, task, maxtask):
-    with open(id_map_fp, 'r') as f:
+def demux_just_fwd(id_map, infile, output, task, maxtask):
+    with open(id_map, 'r') as f:
         id_map = f.readlines()
         id_map = [line.strip().split('\t') for line in id_map]
 
     # fp needs to be an open file handle.
     # ensure task and maxtask are proper ints when coming from cmd-line.
-    with open(fp_fp, 'r') as fp:
-        demux_just_fwd_processing(id_map, fp, out_d, int(task), int(maxtask))
+    with open(infile, 'r') as fp:
+        demux_just_fwd_processing(id_map, fp, output, int(task), int(maxtask))
 
 
 def demux_just_fwd_processing(id_map, fp, out_d, task, maxtask):
diff --git a/src/sequence_processing_pipeline/Pipeline.py b/src/sequence_processing_pipeline/Pipeline.py
@@ -445,8 +445,6 @@ def _configure_profile(self):
                              f"{self.assay_type}) was not found. Please notify"
                              " an administrator")
 
-        print(f'Profile selected: {selected_profile}')
-
         self.config_profile = selected_profile
 
     def _directory_check(self, directory_path, create=False):
diff --git a/tests/test_PacBioWorflow.py b/tests/test_PacBioWorflow.py
@@ -9,13 +9,14 @@
 from unittest import main
 from os import makedirs
 from os.path import dirname, abspath, join, exists
-from metapool.sample_sheet import (PROTOCOL_NAME_PACBIO_SMRT)
-from qp_klp.Assays import ASSAY_NAME_METAGENOMIC
+from shutil import copyfile
 from shutil import rmtree
 from pathlib import Path
-from qiita_client.testing import PluginTestCase
-from sequence_processing_pipeline.PipelineError import PipelineError
 import pandas as pd
+from metapool.sample_sheet import (PROTOCOL_NAME_PACBIO_SMRT)
+from sequence_processing_pipeline.PipelineError import PipelineError
+from qp_klp.Assays import ASSAY_NAME_METAGENOMIC
+from qiita_client.testing import PluginTestCase
 
 
 class WorkflowFactoryTests(PluginTestCase):
@@ -49,23 +50,22 @@ def _inject_data(self, wf):
         makedirs(convert_dir, exist_ok=True)
         makedirs(reports_dir, exist_ok=True)
         Path(f'{convert_dir}/job_completed').touch()
-        # tellread_dir = f'{self.output_dir}/TellReadJob'
-        # nuqc_dir = f'{self.output_dir}/NuQCJob'
-        # fastqc_dir = f'{self.output_dir}/FastQCJob/logs/'
-        # multiqc_dir = f'{self.output_dir}/MultiQCJob/logs/'
-        # genprep_dir = (f'{self.output_dir}/GenPrepFileJob/'
-        #                '211021_A00000_0000_SAMPLE/')
-        # makedirs(nuqc_dir, exist_ok=True)
-        # makedirs(fastqc_dir, exist_ok=True)
-        # makedirs(multiqc_dir, exist_ok=True)
-        # makedirs(genprep_dir, exist_ok=True)
-        # # now let's create the required project folders
-        # for project in wf.pipeline.get_project_info():
-        #     sp = project['project_name']
-        #     makedirs(f'{convert_dir}/{sp}', exist_ok=True)
-        #     makedirs(f'{nuqc_dir}/filtered_sequences/{sp}', exist_ok=True)
-        #     makedirs(f'{genprep_dir}/{sp}/filtered_sequences/',
-        #              exist_ok=True)
+        nuqc_dir = f'{self.output_dir}/NuQCJob'
+        fastqc_dir = f'{self.output_dir}/FastQCJob/logs/'
+        multiqc_dir = f'{self.output_dir}/MultiQCJob/logs/'
+        genprep_dir = (f'{self.output_dir}/GenPrepFileJob/'
+                       '211021_A00000_0000_SAMPLE/')
+        makedirs(nuqc_dir, exist_ok=True)
+        makedirs(fastqc_dir, exist_ok=True)
+        makedirs(multiqc_dir, exist_ok=True)
+        makedirs(genprep_dir, exist_ok=True)
+        # now let's create the required project folders
+        for project in wf.pipeline.get_project_info():
+            sp = project['project_name']
+            makedirs(f'{convert_dir}/{sp}', exist_ok=True)
+            makedirs(f'{nuqc_dir}/filtered_sequences/{sp}', exist_ok=True)
+            makedirs(f'{genprep_dir}/{sp}/filtered_sequences/',
+                     exist_ok=True)
 
         # # then loop over samples and stage all fastq.gz files
         dstats = []
@@ -74,28 +74,25 @@ def _inject_data(self, wf):
             sp = sample["Sample_Project"]
             dstats.append({'SampleID': sn, '# Reads': 2})
             dname = f'{convert_dir}/{sp}'
-            makedirs(dname, exist_ok=True)
             Path(f'{dname}/{sn}_R1.fastq.gz').touch()
             with open(f'{dname}/{sn}_R1.counts.txt', 'w') as f:
                 f.write("2")
 
-        #     # NuQCJob
-        #     dname = f'{nuqc_dir}/filtered_sequences/{sp}'
-        #     copyfile(self.gz_source, f'{dname}/{rp}_L001_R1_001.fastq.gz')
-        #     copyfile(self.gz_source, f'{dname}/{rp}_L001_R2_001.fastq.gz')
+            # NuQCJob
+            dname = f'{nuqc_dir}/filtered_sequences/{sp}'
+            copyfile(self.gz_source, f'{dname}/{sn}_R1.fastq.gz')
 
-        #     # GenPrepFileJob
-        #     gprep_base = f'{genprep_dir}/{sp}/filtered_sequences/{rp}'
-        #     Path(f'{gprep_base}_L001_R1_001.fastq.gz').touch()
-        #     Path(f'{gprep_base}_L001_R2_001.fastq.gz').touch()
+            # GenPrepFileJob
+            gprep_base = f'{genprep_dir}/{sp}/filtered_sequences/{sn}'
+            Path(f'{gprep_base}_R1.fastq.gz').touch()
 
         pd.DataFrame(dstats).set_index('SampleID').to_csv(
             f'{reports_dir}/Demultiplex_Stats.csv')
 
-        # # generating the "*.completed" files
-        # for i in range(len(samples)*3):
-        #     Path(f'{fastqc_dir}/FastQCJob_{i}.completed').touch()
-        #     Path(f'{multiqc_dir}/MultiQCJob_{i}.completed').touch()
+        # generating the "*.completed" files
+        for i in range(len(samples)*3):
+            Path(f'{fastqc_dir}/FastQCJob_{i}.completed').touch()
+            Path(f'{multiqc_dir}/MultiQCJob_{i}.completed').touch()
 
     def test_pacbio_metagenomic_workflow_creation(self):
         kwargs = {"uif_path": "tests/data/sample-sheets/metagenomic/"
@@ -118,7 +115,9 @@ def test_pacbio_metagenomic_workflow_creation(self):
         self.assertEqual(wf.assay_type, ASSAY_NAME_METAGENOMIC)
 
         self._inject_data(wf)
-        # ConvertJob/ConvertJob.sh
+
+        # we can add some checks/tests of the initial scripts (mainly Convert)
+        # but not doing now as is not required
 
         # Metagenomic is a valid data type in the default qiita test
         # database but job-id: 78901 doesn't exist; however, if we get