AI-Media2Doc:AI 视频图文创作助手 一键将视频和音频转化为小红书/公众号/知识笔记/思维导图等各种风格的文档

产品概述

AI-Media2Doc是一款AI 视频图文创作助手,能够在无需登录注册、纯前端运行的前提下,将任意视频或音频内容,一键将视频和音频转化为小红书/公众号/知识笔记/思维导图等各种风格的文档。用户可在浏览器端直接处理音视频文件,并导出生成的思维导图到第三方平台进行进一步编辑和调整,无需任何付费或账号绑定。

核心功能

多风格文档输出

支持小红书风格的社交图文笔记。

输出适合公众号传播的深度文章。

生成结构化的知识笔记,便于学习与复盘。

自动构建思维导图,理清内容脉络。

本地化、开源、零依赖

MIT 协议开源,可自由部署到本地环境。

纯前端处理方案(基于 ffmpeg wasm),无须安装 ffmpeg。

所有任务记录保存在本地,不上传至第三方云平台,保证隐私安全。

AI 二次对话

针对视频内容发起智能对话,可细化补充或深入提问,优化总结质量。

技术亮点

前端音视频处理

利用 WebAssembly 版本的 ffmpeg 在浏览器中完成音视频的解码、编码与剪辑,摆脱后端依赖和服务器压力。

思维导图导出

生成的思维导图支持导出为兼容多种在线免费平台的格式,用户可在喜爱的工具中继续调整和完善。

未来规划

增加智能截帧功能,实现图文并茂的内容呈现。

集成 fast-whisper 本地大模型,提升语音识别精度并进一步降低成本。

优化前端界面设计,打造更优雅的用户体验。

支持 Docker 一键部署,简化运维流程。

应用场景

知识工作者:将长视频课程快速转化为清晰笔记,便于复习整理。

自媒体运营:一键生成符合平台调性的文案,省时高效。

团队协作:多人共同编辑思维导图,提升内容创作效率。

学习者:将听课或演讲录音转换为结构化文档,更快获取精华。

使用指南

打开网页,将视频或音频文件拖拽至上传区域。

选择输出文档风格(小红书/公众号/知识笔记/思维导图)。

等待 AI 处理完成后,点击下载或导出到第三方平台。

以上功能均已在浏览器端实现,零门槛体验,自由定制,让信息处理更高效、更安全。

如何使用/项目地址

GitHub:https://github.com/hanshuaikang/AI-Media2Doc

获取资源:打开微信搜索“PangExuezhang”(胖鹅学长)添加微信获取

为您推荐