colab_notebooks

Summary

analysis
animation
audio
generative
meeting
motion
object_detection
searchsystem
semantic_segmentation
vision3d
nlp
japanesenlp
app
tools
utilities
pix2pix
ocr
inpainting
instructionpix

Analysis
- ptlflow
  - opticalflowを代表とした画像内の動きを推論できるAIモデルのNotebook
- face detection
Animation
- anime_rad_nerf
  - 顔の映像と音声を合成する.アニメ映像でできるように改変
- RAD_NeRF
  - 顔の映像と音声を合成する。3Dの推論を入れてるので精度が高い
- Thin Plate Spline Motion
  - 顔の映像を元映像の動きと同期させて話せるようになっている。
- MakeItTalk
  - 顔の映像と口元、目の当たりの動きをリンクさせて動かせるようなモデルになっている。Realistic visionも用いて生成した絵を動かすまでのパイプラインも紹介
Audio
- audiolm
  - 音楽を生成できるやつ
- DeforumStableDiffusion
  - 音楽生成が可能（BGMより）、動画との組み合わせも可能
- Denoise
  - 雑音除去の性能が高いやつ
- riffusion
  - 音楽生成が可能（BGMより）、fine-tuningコードあり
- valle
  - 誰かの声真似ができる
- audio extraction
  - whisperとpyannoteを使って音声合成のためのデータセット作成を簡易化したノートブック
Generative
- img2prompt
  - 画像からその画像の意味を抽出可能
- stable diffusion v2 finetune
  - stable diffusion v2のdreambooth finetuningのやつ
- stable diffusion image inpaint
  - stable diffusionのinpaintingのdreambooth finetuningのやつ
- stable diffusion v1.5 inpaint
- stable diffusion v2 inpaint
- stable diffusion for webui
- openjourney
  - openjorney, nijijourneyの使い方、controlnetと組み合わせようとしたがgoogle colab freeのため失敗
  - huggingface site
Meeting
- meeting recognition
  - whisper + pyannoteで話者識別、書き起こし、音声類似度判定で、誰が喋ったかまで可能
Motion
- alphapose3d
  - 3d 姿勢推定ライブラリの実行
- motiondiffusion
  - textからアクションを生成可能(ToDo: unityで使えるように連携記事)
- motion diffusion unity
  - text2unityのためのipynb
ObjectDetection
- visionTransformer
  - vision transformerで物体検出、自分用にfine-tuningする手順
- cutler
  - 教師なしでマスク検出が可能、detectron2には大きく依存だが、ここのdetectionをfine-tuningすれば自分用にカスタマイズ可能かも
SearchSystem
- finetuner
SemeanticSegmentation
- unetdeeplab
  - unet + deeplabv3でsemantic segmentationを自分用でfinetuningする手順
- mmsegtutorial PSPNet
  - PSPNetで車載カメラデータセットをcityscapesのpretrainedでfinetuningする手順
- mmsegtutorial Deeplabv3
  - Deeplabv3で車載カメラデータセット、convert datasetの実験もつけてる
- unetseg
  - Unetを使ってsimpleなモデルで学習をおこなったケース
Vision3d
- ECON
- get3d
- ICON
- latentNerf
- NerfStudio
- visionNerf
- text2mesh
  - neural renderingを用いたtext2meshのデモ、ベースのmeshモデルによって精度は大きく変化するみたい。 -> remeshが走らない（なぜかメモリが足らない、、）
- live3d-v2
  - Neural renderingを用いて3Dモデルのモーションやモデル生成が可能、MDMと組み合わせて面白いことができそう。
- rgbd23d
  - midasで深度推定から3D point cloudを生成（全くうまくいかない）、そのほかにmmdetection3dのためのpoint cloud converterも実装されてる。
Pix2Pix
- ControlNet
- Pix2PixZero HuggingFace
App
- gradioapp samples
- gradioapp image+chat
Tools
- instructpix2pix dataset creation
utilities
- mask2bbox
  - ref
- pytorch lightning
  - efficient netを使った分類と値推定のNNの構築をpytorch lightningを使用して行ったデモ
Video
- Tune a video
NLP
- GPT2 Finetuning
JapaneseNLP
- GPT2 Finetuning for Japanese
Inpainting
- deepfillv2 demo
- latent-diffusion inpainting
OCR
- OCR finetuning
Pix2Pix for stable diffusion
- Controlnet
InstructionPix
- attend and excite
LLM
- peft with huggingface
chatgpt
- chatgpt with chatwaifu
  - this is working in progress. maybe I cannot run on colab...
Text2Speech
- vits finetuning
objectdetection3d
- mmdetection3d
  - mmdetection3dを用いた3d object detection、主にRGB+Point cloud or Point cloudの推定を行なっている。

Tips

Collaboration with github and colaboratory

ToDo:

mask interaction system
- GLIGEM Demo
- LaMa
3D avatar creation
- Rodin diffusion
Stable diffusion paper
- awesome diffusion papers
Finetuning with blip

Name		Name	Last commit message	Last commit date
Latest commit History 262 Commits
LLM		LLM
analysis		analysis
animation		animation
app		app
application		application
apps		apps
audio		audio
caption		caption
chatgpt		chatgpt
computervision		computervision
computervison		computervison
depth		depth
diffusers		diffusers
diffusion		diffusion
dococr		dococr
docs		docs
dreambooth		dreambooth
fashion		fashion
generative		generative
gpt		gpt
groundino		groundino
image2caption		image2caption
imagecaption		imagecaption
inpainting		inpainting
instructionpix		instructionpix
japanesenlp		japanesenlp
llm		llm
llmtools		llmtools
meeting		meeting
motion		motion
multimodal		multimodal
multimodality		multimodality
music		music
nlp		nlp
object_detection		object_detection
objectdetection		objectdetection
objectdetection3d		objectdetection3d
ocr		ocr
pix2pix		pix2pix
rust		rust
searchsystem		searchsystem
segmentation		segmentation
semantic_segmentation		semantic_segmentation
sgrepo		sgrepo
speedup		speedup
sports		sports
superresolution		superresolution
text2speech		text2speech
threed		threed
tools		tools
tts		tts
utilities		utilities
video		video
videodiffusion		videodiffusion
videogen		videogen
vision3d		vision3d
vlm		vlm
zeroshot		zeroshot
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

colab_notebooks

Summary

Contents

Tips

ToDo:

About

Releases

Packages

Languages

softmurata/colab_notebooks

Folders and files

Latest commit

History

Repository files navigation

colab_notebooks

Summary

Contents

Tips

ToDo:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages