Vocalis - Advanced Audio Processing

Vocalis is a powerful audio processing package featuring:

Ultra-fast Whisper V3 Turbo Transcription
Advanced Speaker Diarization
Audio Analysis Tools
Security Monitoring
FastAPI Integration

Features

Audio Processing

Transcription using Whisper V3 Turbo
Speaker diarization with pyannote.audio and sherpa-onnx
Speaker name identification
Conversation summarization
Topic extraction

Security Monitoring

Detect potential security incidents in audio
Specialized bar security monitoring
Threat level assessment
Incident reporting

API and UI

FastAPI integration for all functionality
Gradio UI for interactive usage
Command-line interface

Installation

Basic Installation

pip install vocalis

With GPU Support

pip install vocalis[gpu]

Development Installation

pip install vocalis[dev]

Usage

Command Line Interface

Vocalis provides a command-line interface for common tasks:

# Run the FastAPI server
python -m vocalis api --port 8000

# Run the Gradio UI
python -m vocalis ui

# Run security monitoring on a file
python -m vocalis security --input audio.flac --threat-level 2

# Run bar-specific security monitoring on a directory
python -m vocalis security --input ./examples/bar --bar

API Usage

Start the API server:

python -m vocalis api

Then use the API endpoints:

POST /api/transcribe - Transcribe and diarize audio
POST /api/security/analyze - Analyze audio for security concerns
POST /api/analyze - Analyze audio characteristics
GET /api/models - Get available models

Python API

from vocalis.core.audio_pipeline import AudioProcessingPipeline

# Initialize pipeline
pipeline = AudioProcessingPipeline()

# Process audio
result = pipeline.process_audio(
    audio_path="audio.flac",
    task="transcribe",
    num_speakers=2
)

# Access results
print(result["text"])
for segment in result["merged_segments"]:
    print(f"{segment['speaker']}: {segment['text']}")

Security Monitoring

from vocalis.security.security_monitor import SecurityMonitor

# Initialize security monitor
monitor = SecurityMonitor(output_dir="security_incidents", min_threat_level=2)

# Process audio file
incident = monitor.process_audio_file("audio.flac")

if incident:
    print(f"Security incident detected: {incident.incident_type}")
    print(f"Threat level: {incident.threat_level}/5")
    print(f"Summary: {incident.summary}")

Credits

This project builds upon several amazing technologies:

License

Apache License 2.0

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
.tw_cache		.tw_cache
bar_analysis		bar_analysis
benchmarks		benchmarks
compare_fidelity		compare_fidelity
docs		docs
scripts		scripts
security_incidents		security_incidents
speech_test_results		speech_test_results
tests		tests
utils		utils
vocalis		vocalis
.claude_consciousness.m8		.claude_consciousness.m8
.gitignore		.gitignore
.windsurfrules		.windsurfrules
CLAUDE.md		CLAUDE.md
DASHBOARD_IMPROVEMENTS.md		DASHBOARD_IMPROVEMENTS.md
Hermes-3-Llama-3.1-8B.Q4_K_M.md		Hermes-3-Llama-3.1-8B.Q4_K_M.md
LICENSE.txt		LICENSE.txt
MARINE_INTEGRATION_SUMMARY.md		MARINE_INTEGRATION_SUMMARY.md
MARINE_SENSE_INTEGRATION.md		MARINE_SENSE_INTEGRATION.md
MARINE_VAD_LOCALIZATION.md		MARINE_VAD_LOCALIZATION.md
Project Reorganization Complete: Intro.md		Project Reorganization Complete: Intro.md
README.md		README.md
TRISHA_LAB_README.md		TRISHA_LAB_README.md
analyze_bar_audio.py		analyze_bar_audio.py
app.py		app.py
app.py.bak		app.py.bak
app_api.py		app_api.py
app_fix.py		app_fix.py
app_marine_consciousness.py		app_marine_consciousness.py
app_vocalis.py		app_vocalis.py
audio_diagnostics.py		audio_diagnostics.py
audio_pipeline.py		audio_pipeline.py
bar_security_monitor.py		bar_security_monitor.py
check_gpu.py		check_gpu.py
check_models.py		check_models.py
common_data.py		common_data.py
demo_marine_features.py		demo_marine_features.py
demo_trishas_lab.py		demo_trishas_lab.py
denoise_audio.py		denoise_audio.py
diar.py		diar.py
download_models.py		download_models.py
dynamic_bar_audio.py		dynamic_bar_audio.py
launch_unified.sh		launch_unified.sh
ll.py		ll.py
marine_integration_demo.py		marine_integration_demo.py
model.py		model.py
normalize_bar_audio.py		normalize_bar_audio.py
requirements.txt		requirements.txt
security_monitor.py		security_monitor.py
setup.py		setup.py
speech_detection_diagnostic.py		speech_detection_diagnostic.py
start_consciousness.sh		start_consciousness.sh
test_audio_lab.py		test_audio_lab.py
unified_vocalis_app.py		unified_vocalis_app.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Vocalis - Advanced Audio Processing

Features

Audio Processing

Security Monitoring

API and UI

Installation

Basic Installation

With GPU Support

Development Installation

Usage

Command Line Interface

API Usage

Python API

Security Monitoring

Credits

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 3

Uh oh!

Languages

License

8bit-wraith/Turbo-Whisper-Workspace

Folders and files

Latest commit

History

Repository files navigation

Vocalis - Advanced Audio Processing

Features

Audio Processing

Security Monitoring

API and UI

Installation

Basic Installation

With GPU Support

Development Installation

Usage

Command Line Interface

API Usage

Python API

Security Monitoring

Credits

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 3

Uh oh!

Languages

Packages