Remote Sensing Dataset Construction

Vision Language Dataset Construction Library

Dataset

Purpose of the repository construct codebase for feeding Foundation Model(FM) that we are going to build.

Instruction tuning and pretraining datasets will be shared soon via the Google Drive API. This will include access for those who typically seek datasets provided through Chinese domains like Pan.baidu.

Inspired by the MM-LLM Pretraining paper by Apple (https://arxiv.org/abs/2403.09611), I have integrated several filter options into our pretraining process. These enhancements are expected to significantly improve the performance of our pretraining model.

RS-Assistant

Visual Grounding Datasets

Dataset Type	Dataset Name	Status	Number of Samples
Visual Grounding	DIOR-RSVG	done	17.4k

Captioning Datasets

Dataset Type	Dataset Name	Status	Number of Samples
Captioning Dataset	RSICD	done	10.9k
Captioning Dataset	LAION5B	done	10.9k
Captioning Dataset	UCM Captions	done	2.1k
Captioning Dataset	CapERA	done	1.4k
Captioning Dataset	RSITMD	done	4.7k

VQA Datasets

Dataset Type	Dataset Name	Status	Number of Samples
VQA Dataset	FloodNet	done	1.4k
VQA Dataset	RSVQAxBEN	done	590k
VQA Dataset	RSVQA HR	done	10.6k

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
figures		figures
scripts		scripts
.gitignore		.gitignore
README.md		README.md
built_instruction_tuning_json.py		built_instruction_tuning_json.py
built_pretrain_json.py		built_pretrain_json.py
bulk_copy_files.py		bulk_copy_files.py
log.json		log.json
prompt.txt		prompt.txt
push_dataset_hub.py		push_dataset_hub.py
report.json		report.json
test_dataset.py		test_dataset.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Remote Sensing Dataset Construction

Vision Language Dataset Construction Library

RS-Assistant

Visual Grounding Datasets

Captioning Datasets

VQA Datasets

About

Releases

Packages

Contributors 2

Languages

enkaranfiles/remote-sensing-dataset-construction

Folders and files

Latest commit

History

Repository files navigation

Remote Sensing Dataset Construction

Vision Language Dataset Construction Library

RS-Assistant

Visual Grounding Datasets

Captioning Datasets

VQA Datasets

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages