GitHub - BM-Boris/rodin: python toolkit for the analysis of metabolomics data

Rodin: Metabolomics Data Analysis Toolkit

Rodin is a Python library specifically designed for the comprehensive processing and analysis of metabolomics data. It is a class-methods based toolkit, facilitating a range of tasks from basic data manipulation to advanced statistical evaluations, visualization, and metabolic pathway analysis.

Features

Efficient Data Handling: Streamlined manipulation and transformation of metabolomics data.
Robust Statistical Analysis: Includes ANOVA, t-tests, and more.
Machine Learning Methods: Random Forest, Logistic and Linear regressions.
Advanced Dimensionality Reduction: Techniques like PCA, t-SNE, UMAP.
Interactive Data Visualization: Tools for effective data visualization.
Pathway Analysis: Features for metabolic pathway analysis.

Installation

We recommend installing Rodin in a separate Conda environment for effective dependency management.

Prerequisites

Python (3.10 or higher)
Conda (Anaconda or Miniconda)

Setting Up a Conda Environment

Create and activate a new Conda environment:

conda create -n rodin_env python=3.11
conda activate rodin_env

Install Rodin

Install Rodin directly from GitHub:

pip install git+https://github.com/BM-Boris/rodin.git

Basic Example

Here's a basic example demonstrating the usage of Rodin for data analysis. Comprehensive Jupyter notebook guides can be found in the 'guides' folder

import rodin

# Assume 'features.csv' and 'class_labels.csv' are your datasets
features_path = 'path/to/features.csv'
classes_path = 'path/to/class_labels.csv'

# Creating an instance of Rodin_Class
rodin_instance = rodin.create_object_csv(features_path, classes_path)

# Transform the data (imputation, normalization, and log-transformation steps)
rodin_instance.transform()

# Run t-test comparing two groups based on 'age'
rodin_instance.ttest('age')

# Run two-way anova test comparing groups based on 'age' and 'region'
rodin_instance.twoway_anova(['age','region'])

# Run multiple logistic regressions and linear regressions to get pvalues for each feature
rodin_instance.sf_lg('sex')
rodin_instance.sf_lr('age')

#Run a random forest classifier and regressor to obtain the metrics of the trained model using k-fold validation, with assigned feature importance scores to each variable
rodin_instance.rf_class('region')
rodin_instance.rf_regress('age')

#Slice the whole object using the pattern from pandas
rodin_instance = rodin_instance[rodin_instance.features[rodin_instance.features['imp(rf) age']>0]]

# Perform PCA with 2 principal components (umap and t-sne are available as well)
rodin_instance.run_pca(n_components=2)

# Plotting the PCA results
# 'region' column in the 'samples' DataFrame is used for coloring the points
rodin_instance.plot(dr_name='pca', hue='region', title='PCA Plot')

# Pathway analysis 
rodin_instance.analyze_pathways(pvals='p_value', stats='statistic')
# Replace 'p_value' and 'statistic' with the actual column names in your 'features' DataFrame(rodin_instance.features)

Contact

For questions, suggestions, or feedback, please contact [email protected]

Name		Name	Last commit message	Last commit date
Latest commit History 62 Commits
guides		guides
rodin		rodin
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Rodin: Metabolomics Data Analysis Toolkit

Features

Installation

Prerequisites

Setting Up a Conda Environment

Install Rodin

Basic Example

Contact

About

Releases

Packages

Languages

License

BM-Boris/rodin

Folders and files

Latest commit

History

Repository files navigation

Rodin: Metabolomics Data Analysis Toolkit

Features

Installation

Prerequisites

Setting Up a Conda Environment

Install Rodin

Basic Example

Contact

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages