AI-Media2Doc
一鍵將音視頻轉(zhuǎn)化為小紅書/公眾號(hào)/知識(shí)筆記/思維導(dǎo)圖/視頻字幕等各種風(fēng)格的文檔。
標(biāo)簽:項(xiàng)目框架AI-Media2DocAI-Media2Doc 是一個(gè)開源項(xiàng)目,旨在將視頻和音頻內(nèi)容一鍵轉(zhuǎn)化為多種風(fēng)格的文檔,如小紅書、公眾號(hào)、知識(shí)筆記、思維導(dǎo)圖等。該項(xiàng)目由開源社區(qū)維護(hù),采用 MIT 協(xié)議授權(quán),支持本地部署,無需登錄注冊(cè),且所有任務(wù)記錄保存在本地。用戶可以通過 GitHub 地址(https://github.com/hanshuaikang/AI-Media2Doc )獲取項(xiàng)目源碼并進(jìn)行部署和使用。
AI-Media2Doc開源項(xiàng)目官網(wǎng)入口網(wǎng)址:https://github.com/hanshuaikang/AI-Media2Doc

AI 視頻圖文創(chuàng)作助手是一款 Web 工具, 基于 AI 大模型, 一鍵將視頻和音頻轉(zhuǎn)化為各種風(fēng)格的文檔, 無需登錄注冊(cè), 前后端本地部署,以極低的成本體驗(yàn) AI 視頻/音頻轉(zhuǎn)風(fēng)格文檔服務(wù)。
核心功能
- 完全開源:MIT 協(xié)議授權(quán),支持本地部署。
- 隱私保護(hù):無需登錄注冊(cè),任務(wù)記錄保存在本地
- 前端處理:采用 ffmpeg wasm 技術(shù),無需本地安裝 ffmpeg
- 多種風(fēng)格支持:支持小紅書/公眾號(hào)/知識(shí)筆記/思維導(dǎo)圖/內(nèi)容總結(jié)等多種文檔風(fēng)格支持。
- AI 對(duì)話:支持針對(duì)視頻內(nèi)容進(jìn)行 AI 二次問答。
- 支持字幕導(dǎo)出: 結(jié)果一鍵導(dǎo)出為字幕文件。
- 智能截圖: 基于字幕信息智能截圖并插入文章, 無需視覺大模型, 實(shí)現(xiàn)真正的圖文并茂。
- 支持自定義 Prompt:支持在前端自定義配置 prompt。
- 一鍵部署:支持 Docker 一鍵部署。
- 支持設(shè)置訪問密碼: 后端設(shè)置訪問密碼之后, 前端用戶需要填寫該密碼才可以正常使用。
AI-Media2Doc 的核心功能包括音視頻處理、多種輸出格式支持、AI 對(duì)話、字幕導(dǎo)出、智能截圖插入、自定義 Prompt 等。項(xiàng)目支持前端 ffmpeg wasm 處理,無需本地安裝 ffmpeg,也支持 Docker 一鍵部署。此外,該項(xiàng)目還支持生成思維導(dǎo)圖,并可導(dǎo)出到第三方平臺(tái)進(jìn)行編輯和調(diào)整。
AI-Media2Doc 的目標(biāo)是降低 AI 應(yīng)用門檻,為自媒體博主、企業(yè)文員和學(xué)生提供高效的多媒體內(nèi)容處理工具,幫助用戶快速將音視頻內(nèi)容轉(zhuǎn)化為高質(zhì)量文檔。該項(xiàng)目在多個(gè)技術(shù)社區(qū)和開源平臺(tái)(如 GitHub、Python 潮流周刊等)上被提及和推薦。