Detection of letters from the American Sign Alphabet

Este repositório contém o código e os recursos necessários ao projeto de Visão Computacional com detecção de linguagem de sinais.

Descrição

O objetivo deste projeto é desenvolver um sistema de detecção e reconhecimento de linguagem de sinais em tempo real utilizando técnicas de visão computacional. Três modelos foram treinados utilizando datasets disponíveis no Kaggle:

O código detection_v3.py representa a versão mais avançada do modelo de detecção, treinado com o terceiro dataset. O detection_v1.py e detection_v2.py são versões de teste, uma com ROI padrão mas que abrange o fundo e outra que faz uso da movimentação do dedo indicador, nesses dois códigos foram usados os outros dois modelos treinado. No primeiro modelo, que é usado o segundo dataset, os dados de teste são tão poucos que a acurácia final despenca, já no segundo modelo, tentei uma abordagem diferente, usar um terceiro dataset inteiro só para testes, que nesse caso é o primeiro dataset, ainda usei data augmentation para ter resultados melhores, infelizmente, não obtive sucesso.

Recomendo usar o terceiro modelo, pois apresenta melhor acurácia apesar da dificuldade da precisão da deteção.

Notebooks Jupyter

Três modelos foram treinados e estão disponiveis no Vision.ipynb. Por motivos de segurança, as credenciais do Kaggle não foram fornecidas diretamente no repositório.

Estrutura do Projeto

detection_v3.py: Código principal para detecção de linguagem de sinais.
index.html: Página HTML para a interface do usuário.
templates/: Pasta contendo o arquivo HTML usados pelo Flask.

Pré-requisitos

Python 3.x
Bibliotecas Python: Flask, OpenCV, TensorFlow, NumPy, Matplotlib

Instale as bibliotecas necessárias utilizando:

pip install opencv-python tensorflow numpy flask matplotlib

Execução

Baixe o modelo treinado de detecção de linguagem de sinais
Coloque o modelo na mesma pasta que o arquivo detection_v3.py.
Execute o aplicativo usando o comando: python detection_v3.py
Abra o navegador que o código irá disponibilizar e acesse para visualizar o aplicação.

Recomendações e Observações

Dado o problema na questão do dataset, o melhor modelo que é o terceiro, mesmo usando Data Augmentation, ficar muito difícil de detectar por conta que o sinal precisa ser igual ou muito paraceido ao que é o dataset. Em trabalhos futuros, recomenda-se um sistema de coleta volutário de sinais afim de ter um grande dataset com uma variedade de dados e tonalidades diferentes, pode ser feito usando IA Generativa também. Devido a limitações de upload de arquivo do Github, o segundo modelo não pode ser upado, o tamanho dele excede o permitido pela plataforma, aqueles que quiserem o segundo modelo para o teste, façam um merge em alguma coisa do código que irei enviar o segundo modelo.

Sobre os testes, pela dificuldade na precisão, o que se notou é que tendo um fundo branco e de boa luminosidade, a detecção melhora, qualquer outro cenário é péssimo para o modelo.

Imagens de Testes feitos

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Detection of letters from the American Sign Alphabet

Descrição

Notebooks Jupyter

Estrutura do Projeto

Pré-requisitos

Execução

Recomendações e Observações

Imagens de Testes feitos

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
Imagens_Testes		Imagens_Testes
Models		Models
templates		templates
README.md		README.md
Vision.ipynb		Vision.ipynb
detection_v1.py		detection_v1.py
detection_v2.py		detection_v2.py
detection_v3.py		detection_v3.py
index.html		index.html

getHibou/ASL_Detection

Folders and files

Latest commit

History

Repository files navigation

Detection of letters from the American Sign Alphabet

Descrição

Notebooks Jupyter

Estrutura do Projeto

Pré-requisitos

Execução

Recomendações e Observações

Imagens de Testes feitos

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages