Build software better, together

great-expectations / great_expectations

Always know what to expect from your data.

Updated Jul 1, 2024
Python

GermanPaul12 / My-Chess-Com-Games-Analyzed-and-presented-on-Streamlit

My Streamlit Web App in which I show the findings of analyzing all my chess.com games 😮 Analyze your own games by just providing the username 😍

api chess exploratory-data-analysis jupyter-notebook pandas streamlit

Updated Jul 1, 2024
Python

burhanahmed1 / Data-Analysis-with-Python

Star

Data-Acquisition and Basic Insights, Data Wrangling, Exploratory Data Analysis (EDA), and Training Prediction Models(Machine Learning) on two datasets.

python data-science numpy scikit-learn exploratory-data-analysis eda pandas seaborn data-analysis data-wrangling prediction-model scikitlearn-machine-learning machine-learning-models data-aquisition practice-programming dataanalytics data-insights datascience-machinelearning matlpotlib

Updated Jun 30, 2024
Jupyter Notebook

MelihGulum / Exploratory-Data-Analysis-EDA

Star

Exploratory Dataset Analysis (EDA) will be uploaded to this repository. Libraries such as Pandas, Matplotlib, Seaborn and Plotly will be used for data analysis.

exploratory-data-analysis plotly seaborn movielens-data-analysis matplotlib titanic movielens pandas-tutorial netflix-dataset

Updated Jun 30, 2024
Jupyter Notebook

ar-sayeem / Feature-Engineering

Star

Utilizing Exploratory Data Analysis (EDA) and feature engineering in Python to enhance data quality and uncover valuable insights.

python exploratory-data-analysis jupyter-notebook

Updated Jun 30, 2024
Jupyter Notebook

Hashezm / Tumor-Cell-Analysis-Project

Star

This project analyzes tumor cell data from 550 patients using Python. It involves data cleaning, exploratory analysis, feature engineering, and machine learning to classify tumors as malignant or benign. Techniques include PCA, logistic regression, and k-fold cross-validation to ensure model accuracy and reliability.

python machine-learning exploratory-data-analysis logistic-regression standardization feature-engineering data-cleaning principal-component-analysis classification-model k-fold-cross-validation correlation-heatmap

Updated Jun 30, 2024
Jupyter Notebook

saksham-jain177 / Data-Analysis

Star

Data Analysis on various Datasets

python api data-science data exploratory-data-analysis youtube-api data-visualization python3 dataset web-scraping data-analysis datasets data-cleaning datamodeling

Updated Jun 30, 2024
Jupyter Notebook

mayurasandakalum / breast-cancer-detection

Star

Code for classifying breast cancer tumors using machine learning. Includes preprocessing, visualizations, and models like Logistic Regression, Decision Tree, and Random Forest. Evaluated with accuracy, precision, recall, and F1-score. Clone, install dependencies, and run the Jupyter notebook for full analysis.

machine-learning random-forest svm exploratory-data-analysis jupyter-notebook ml accuracy recall logistic-regression data-preprocessing visualizations decision-tree precision model-evaluation f1-score breast-cancer-classification

Updated Jun 30, 2024
Jupyter Notebook

VaishDeshpande234 / Predictive-Maintenance

Star

The goal of this project is to predict the Remaining Useful Life (RUL) of aircraft engines based on sensor data. Predictive maintenance helps identify the point at which an engine is likely to fail, allowing for timely maintenance to prevent failures and optimize maintenance schedules.

random-forest exploratory-data-analysis visualisation feature-engineering lstm-neural-networks model-evaluation gradient-boosting machine-learning-models data-loading-and-cleaning

Updated Jun 30, 2024
Jupyter Notebook

SkredX / Market-analysis-and-optimization-using-Clustering

Star

The project uses data preprocessing steps, such as handling missing values, encoding categorical variables, and standardizing features. It applies the K-Means clustering algorithm and visualizes the results using various libraries like Matplotlib, Seaborn, and Plotly.

exploratory-data-analysis data-visualization data-preprocessing k-means-clustering standard-scaler

Updated Jun 30, 2024
Jupyter Notebook

MariahFerns / HypothesisTesting-CustomerAcquisition

Star

EDA and hypothesis testing for customer acquisition through marketing campaigns.

exploratory-data-analysis hypothesis-testing

Updated Jun 30, 2024
Jupyter Notebook

thebugged / eda-app

Star

a web application for analyzing data and viewing meaningful insights.

python data-science exploratory-data-analysis eda pandas data-visualization data-analysis openpyxl streamlit pygwalker

Updated Jun 30, 2024
Python

shashankarya9999 / Data-Science-Projects

Star

This repository contains a collection of data science projects which I did during the IBM Data Science Professional certification programme. Each project demonstrates different aspects of data science, data analysis, data visualization and machine learning.

data-science data machine-learning numpy scikit-learn exploratory-data-analysis pandas data-visualization data-analytics supervised-learning matplotlib data-collection data-wrangling unsupervised-learning predictive-analytics

Updated Jun 30, 2024
Jupyter Notebook

itzKshitijaC / Twitter-Sentiment-Analysis-

Star

NLP based Twitter data sentiment analysis project

nlp machine-learning exploratory-data-analysis naive-bayes-classifier nlp-machine-learning dataanalysis dataanalytics

Updated Jun 29, 2024
Jupyter Notebook

jpriyankaa / Time-Series-

Star

This project involves time series analysis, examining Tesla Inc.'s (TSLA) stock performance from 2010 to 2024. Time series analysis, which studies data points collected at specific time intervals, was used to identify trends, seasonal patterns & fluctuations in Tesla’s stock prices, insights were derived from visualizations & resampling techniques.

data-science time-series exploratory-data-analysis data-analysis resampling stock-data time-series-analysis timeseries-forecasting

Updated Jun 29, 2024
Jupyter Notebook

jahnvisikligar / Data-Science_projects

Star

The repo focuses on my works in data science

Updated Jun 29, 2024
Jupyter Notebook

Desbordante / desbordante-core

Star

Desbordante is a high-performance data profiler that is capable of discovering many different patterns in data using various algorithms. It also allows to run data cleaning scenarios using these algorithms. Desbordante has a console version and an easy-to-use web application.