"让知识动起来,让科普更性感。"
这是一个专为科普内容创作者打造的智能化、自动化视频生产工具。只需输入一个公众号链接或一段文字,它就能通过 LLM 的深度理解,自动完成脚本撰写、运镜设计、画面生成、配音对齐及后期合成,最终产出具有“电影感”的短视频。
这是我的第一个 GitHub 开源项目,也是一次深度实践 "Vibe Code" (人机协作编程) 的产物。在这里,创意是唯一的上限,代码只是实现愿景的工具。
- 🧠 导演级脚本生成:基于 DeepSeek 大模型,不仅生成文案,更会自动规划 35mm 镜头、f/2.8 光圈、丁达尔光效等专业电影参数。
- 🎬 可灵 (Kling) API 深度集成:
- 图生视频:文章插图自动转化为视频首帧,实现插图的动态延伸。
- 智能回退:自动识别无效图像像素并回退至文生视频,保障 100% 生成成功率。
- 🎨 本地与云端双模式:支持调用顶尖视频大模型 API,也支持纯本地图片特效合成(兼容低成本运行)。
- 📧 自动化交付体系:生成结束后,视频将作为邮件附件直接发送至您的邮箱,正文附带完整脚本大纲。
- 🖥️ 现代化 GUI:采用 PySide6 构建的卡片式桌面交互界面,实时展示生成进度与 Vibe 风格的控制台日志。
- 大语言模型:DeepSeek (V3/R1) / 阿里云通义千问兼容接口
- 视频大模型:快手可灵 Kling (text2video / image2video)
- 语音合成:Microsoft Edge-TTS
- 后期合成:MoviePy & PIL (处理 EXIF 旋转与比例拉伸)
- 界面方案:PySide6 (Qt for Python)
本项目 90% 以上的代码是通过与 AI 助手的深度对话生成的。它验证了在 AI 时代,即使是编程新人,只要具备产品思维和逻辑链条,也能在短短几天内构建出具备商用潜力的复杂系统。
- 接入更多视频模型接口(如 Sora, Luma, Pika)
- 支持自定义背景音乐风格 BGM 自动匹配
- 增加多角色配音(对话式科普脚本)
- 增加 4K 超高清画质增强插件
由于这是我的第一个项目,难免会有不完美的地方。我非常渴望听到您的声音!
- 遇到 Bug? 请直接提 Issue。
- 有新想法? 无论是运镜参数还是 UI 建议,欢迎随时 PR 或留言。
- 觉得好用? 别忘了点一个 Star ⭐ 给予鼓励!
创作者:zy15801543188
联系邮箱:543114167@qq.com
开源协议:MIT
- 克隆项目:
git clone https://github.com/zy15801543188/AI_-.git - 安装依赖:
pip install -r requirements.txt - 配置密钥:将
.env.example重命名为.env并填写您的 API Key。 - 运行主程序:
python main.py