DeepFlow
DeepFlow 是由云杉網(wǎng)絡(luò)(Yunshan Networks)研發(fā)的 全棧可觀測(cè)性平臺(tái),面向云原生、分布式系統(tǒng)以及 AI 應(yīng)用,提供從底層網(wǎng)絡(luò)到業(yè)務(wù)層的統(tǒng)一監(jiān)控、追蹤和性能剖析能力。
標(biāo)簽:項(xiàng)目框架DeepFlowDeepFlow是一款由云杉網(wǎng)絡(luò)(DeepFlow?IO)開源發(fā)布的全棧可觀測(cè)性平臺(tái),專注于云原生、容器化以及 AI 應(yīng)用的深度監(jiān)控與分析。平臺(tái)核心基于 eBPF 零插樁技術(shù),實(shí)現(xiàn)對(duì)主機(jī)、容器、Kubernetes 集群以及微服務(wù)之間調(diào)用鏈的自動(dòng)化、無(wú)侵入式數(shù)據(jù)采集,能夠?qū)崟r(shí)捕獲指標(biāo)、日志、追蹤鏈路和性能剖析信息。
- DeepFlow官網(wǎng)入口網(wǎng)址:http://deepflow.io/
- DeepFlow開源項(xiàng)目地址:https://github.com/deepflowio/deepflow
- DeepFlow中文介紹:鏈接

平臺(tái)的主要特性包括:
- 零插樁采集:通過 eBPF 自動(dòng)收集網(wǎng)絡(luò)、系統(tǒng)調(diào)用、文件 I/O 等底層數(shù)據(jù),無(wú)需在業(yè)務(wù)代碼中植入 SDK。
全棧關(guān)聯(lián):采用智能標(biāo)簽(Tag)技術(shù),將基礎(chǔ)設(shè)施層、容器層、服務(wù)層以及業(yè)務(wù)層的拓?fù)潢P(guān)系統(tǒng)一映射,實(shí)現(xiàn)“一鍵全鏈路”可視化。 - 多協(xié)議支持:原生解析 HTTP、gRPC、MySQL、Redis、Kafka 等常見協(xié)議,并通過 Wasm 擴(kuò)展支持私有協(xié)議。
- 高性能存儲(chǔ):自研高效時(shí)序存儲(chǔ)相較傳統(tǒng) ClickHouse 提升約 10 倍的寫入與查詢效率,滿足大規(guī)模數(shù)據(jù)的實(shí)時(shí)分析需求。
- 可觀測(cè)性即服務(wù):提供統(tǒng)一的儀表盤、告警規(guī)則編輯器以及自動(dòng)化的異常檢測(cè)模型,幫助運(yùn)維團(tuán)隊(duì)快速定位故障根因。
在部署方式上,DeepFlow 支持 Helm Chart 一鍵安裝,適配 Kubernetes、OpenShift 以及裸機(jī)環(huán)境;同時(shí)提供 Docker 鏡像(deepflowce/deepflow?agent、deepflowce/deepflow?server)和二進(jìn)制發(fā)行包,便于在不同的生產(chǎn)環(huán)境中快速落地。
DeepFlow 還面向聯(lián)邦學(xué)習(xí)場(chǎng)景推出了專門的監(jiān)控方案,利用 eBPF 捕獲分布式 AI 訓(xùn)練過程中的資源使用、網(wǎng)絡(luò)帶寬和模型參數(shù)同步情況,為大規(guī)模分布式 AI 提供統(tǒng)一的可觀測(cè)性視圖,進(jìn)一步降低了 AI 研發(fā)與運(yùn)維的技術(shù)門檻。
DeepFlow 通過“零插樁 + 全棧關(guān)聯(lián) + 高性能存儲(chǔ)”三大技術(shù)路線,為企業(yè)提供從底層硬件到業(yè)務(wù)層面的統(tǒng)一監(jiān)控解決方案,幫助用戶實(shí)現(xiàn)對(duì)云原生和 AI 工作負(fù)載的全方位可觀測(cè)、快速定位和自動(dòng)化運(yùn)維。



