AI-Media2Doc:AI 视频图文创作助手 一键将视频和音频转化为小红书/公众号/知识笔记/思维导图等各种风格的文档
产品概述
AI-Media2Doc是一款AI 视频图文创作助手,能够在无需登录注册、纯前端运行的前提下,将任意视频或音频内容,一键将视频和音频转化为小红书/公众号/知识笔记/思维导图等各种风格的文档。用户可在浏览器端直接处理音视频文件,并导出生成的思维导图到第三方平台进行进一步编辑和调整,无需任何付费或账号绑定。
核心功能
多风格文档输出
支持小红书风格的社交图文笔记。
输出适合公众号传播的深度文章。
生成结构化的知识笔记,便于学习与复盘。
自动构建思维导图,理清内容脉络。
本地化、开源、零依赖
MIT 协议开源,可自由部署到本地环境。
纯前端处理方案(基于 ffmpeg wasm),无须安装 ffmpeg。
所有任务记录保存在本地,不上传至第三方云平台,保证隐私安全。
AI 二次对话
针对视频内容发起智能对话,可细化补充或深入提问,优化总结质量。
技术亮点
前端音视频处理
利用 WebAssembly 版本的 ffmpeg 在浏览器中完成音视频的解码、编码与剪辑,摆脱后端依赖和服务器压力。
思维导图导出
生成的思维导图支持导出为兼容多种在线免费平台的格式,用户可在喜爱的工具中继续调整和完善。
未来规划
增加智能截帧功能,实现图文并茂的内容呈现。
集成 fast-whisper 本地大模型,提升语音识别精度并进一步降低成本。
优化前端界面设计,打造更优雅的用户体验。
支持 Docker 一键部署,简化运维流程。
应用场景
知识工作者:将长视频课程快速转化为清晰笔记,便于复习整理。
自媒体运营:一键生成符合平台调性的文案,省时高效。
团队协作:多人共同编辑思维导图,提升内容创作效率。
学习者:将听课或演讲录音转换为结构化文档,更快获取精华。
使用指南
打开网页,将视频或音频文件拖拽至上传区域。
选择输出文档风格(小红书/公众号/知识笔记/思维导图)。
等待 AI 处理完成后,点击下载或导出到第三方平台。
以上功能均已在浏览器端实现,零门槛体验,自由定制,让信息处理更高效、更安全。
如何使用/项目地址
GitHub:https://github.com/hanshuaikang/AI-Media2Doc