awesome-llm-apps 是一個開源項目集合,旨在展示如何利用先進語言模型(如 RAG 和 AI 代理)構建實用應用程序。
Gemini CLI 是一個開源的 AI 代理工具,由 Google 開發,旨在將 Gemini 模型的強大功能直接集成到開發者的終端中 。
小智 AI 聊天機器人是一款基于開源硬件和開源軟件的智能對話設備,旨在幫助用戶入門 AI 硬件開發和 AI 模型應用。
WeKnora是一款基于大語言模型的文檔理解與語義檢索框架,專為結構復雜、內容異構的文檔場景而打造。
Coze Studio 是由字節跳動開發并開源的一站式 AI Agent 開發工具,旨在為開發者提供從開發到部署的全方位支持,幫助他們快速構建和調試智能體、應用和工作流 。
PoloAPI 是一個專注于大模型 API 聚合服務的平臺,旨在幫助開發者和企業快速接入和使用多種 AI 模型,如 Claude、OpenAI、Gemini 等。
EmotiVoice是一個強大的開源TTS引擎,完全免費,支持中英文雙語,包含2000多種不同的音色,以及特色的情感合成功能,支持合成包含快樂、興奮、悲傷、憤怒等廣泛情感的語音。
MotionAgent是一個能將用戶創造的劇本生成視頻的深度學習模型工具。用戶通過我們提供的工具組合,進行劇本創作、劇照生成、圖片/視頻生成、背景音樂譜寫等工作。
DreamTalk是一個基于擴散模型的音頻驅動表達性頭部生成框架,核心功能是將靜態人物照片轉化為逼真、富有表現力的說話視頻。
AniPortrait 是騰訊游戲智跡團隊開發的一款創新的音頻驅動肖像動畫生成框架,能夠通過音頻和參考肖像圖像生成高質量的動態視頻。
IDM-VTON是一款基于深度學習和擴散模型的虛擬試衣技術,旨在通過高保真度的圖像生成實現逼真的虛擬試穿效果。
Diffutoon 是一種基于擴散模型的高分辨率可編輯卡通著色技術,其核心功能是將真實視頻轉換為動漫風格,同時保持內容的一致性和高質量。
MindSearch是一款由上海人工智能實驗室聯合研發的開源AI搜索引擎框架,旨在通過模仿人類的思維過程,高效地處理復雜信息搜集與整合任務。
Midscene.js 是一個基于人工智能(AI)技術的自動化 SDK,旨在簡化用戶界面(UI)自動化測試流程,提高測試效率和準確性。
易于上手的多平臺聊天機器人及開發框架。松耦合 / 異步 / 多消息平臺部署 / 易用的插件系統 / 完善的大語言模型(LLM)接入
FireRedTTS是一款由小紅書技術團隊開發的基于大語言模型(LLM)的語音合成系統,旨在為用戶提供高效、多樣化的語音生成服務。
RAGFlow是一款基于深度文檔理解技術的開源RAG(檢索增強生成)引擎,旨在為企業和個人提供高效、準確的文本處理和問答功能。
OpenRouter 是一個統一的 API 接口平臺,旨在為用戶提供訪問和使用多種 AI 模型的便捷途徑。
友鏈申請免責聲明廣告合作關于本站