挑战
传统监控系统是被动的,需要持续的人工监控:
- 在大型网络中手动发现和配置摄像头耗时费力
- 缺乏自动化威胁检测能力(入侵者、火灾、徘徊)
- 无法对多个地点的摄像头进行集中管理
- 缺乏跨平台访问能力(桌面、移动和网页)
我们的解决方案
我们构建了一个企业级监控平台,结合了自动化摄像头发现、RTSP/HLS 流媒体和 GPU 加速的 AI 分析。
架构
- 桌面应用:基于 Python CLI/web UI 实现网络摄像头发现 (SSDP, ONVIF, mDNS)
- 网页前端:React + Vite,Supabase 后端,Radix UI,Three.js 可视化
- 移动应用:基于 React Native/Expo 开发,适用于 iOS/Android
- 流媒体 API:FastAPI,集成 MediaMTX 用于 RTSP/HLS 转换
- AI 平台:YOLO11 + TensorRT + ByteTrack 用于实时目标检测
- 编排器:FastAPI 服务,用于动态流媒体服务器管理
摄像头发现
- 多协议扫描 (SSDP, ONVIF WS-Discovery, mDNS/Bonjour)
- 支持 CIDR 的 IP 范围扫描
- 制造商/型号识别
- RTSP 流验证和确认
AI 检测能力
- 人员和车辆检测 (YOLO11 经 TensorRT 优化)
- 车牌识别,采用 OCR (EasyOCR)
- 火灾和烟雾检测
- 行为分析:入侵、徘徊、人数统计、夜间闯入
- 单个 RTX 4000 Ada GPU 上支持 10-12 个并发流
关键特性
- 自动化发现 - 无需手动配置即可在任何网络中发现摄像头
- 实时 AI - 亚秒级检测,通过 WebSocket 传输警报
- 多平台 - 桌面、网页和移动客户端
- 流媒体编排 - MediaMTX 容器自动扩缩并进行健康监控
- 质量控制 - 可调节分辨率(低至超高)和帧率 (1-60)
成果
技术栈
caseStudyDetail.more 案例研究
探索更多我们的技术实施案例
基于 VPN 的 RTSP 流媒体,具备自动扩展的转发、HLS 传输和录制
一个监控平台需要通过 VPN 隧道安全地接收来自远程位置的 RTSP 摄像机流,将其转发用于基于网页的查看和 AI 处理,根据需求自动扩展转发基础设施,并录制流以供存档——所有这些都要在不可预测的网络条件下保持低延迟和可靠连接。
具有双编排器和零丢包的自动扩缩容 RTSP 流媒体架构
一个监控平台需要动态扩缩容其视频流媒体基础设施,以处理从 10 到 200 多个 IP 摄像头,以及数百名并发观看者和 AI 处理工作者,同时保证在扩缩容操作期间零丢包,并保持永不改变的稳定流 URL。
常见问题
MicrocosmWorks 构建了一个分布式处理架构,该架构在 load balancer 后端使用 GPU 加速的推理节点,每个节点根据分辨率和帧率要求处理可配置数量的摄像头馈送。该平台根据实时需求动态分配处理资源,并使用帧采样策略,在高峰使用期间保持检测精度同时减少计算负载。
MicrocosmWorks 集成了多个专门的计算机视觉模型,包括人员和车辆检测、车牌识别、面部识别(可配置退出区域)、遗留物检测和人群密度估算。每个模型都作为一个独立的微服务运行,可以按摄像头启用或禁用,从而允许设施经理只部署与每个区域相关的检测类型。
MicrocosmWorks 开发了一个分层管理控制台,管理员可以在其中定义组织、站点、区域和单个摄像头,警报路由规则会根据严重性、一天中的时间和检测类型升级事件。该平台支持 ONVIF 兼容摄像头并与现有 VMS 系统集成,因此企业可以在不更换硬件的情况下,在其现有摄像头基础设施上叠加 AI 分析。
MicrocosmWorks 实施了分层存储架构,其中,原始录像存储在经济高效的对象存储上,并具有可配置的保留期,而 AI 生成的元数据和事件片段则在快速查询数据库中进行索引,以便快速搜索和检索。这种方法将存储成本降低了 60-70%,相比于保留所有摄像头的全分辨率录像,同时保持对安全相关事件的即时访问。
MicrocosmWorks 构建定制的AI监控平台,费率为每小时25-50美元。尽管初始开发投入高于盒装产品许可,但随着规模的扩大,总拥有成本通常会更低,因为您可以避免商业平台收取的每摄像头许可费。定制平台还允许您拥有AI模型和数据,与专有系统集成,并添加针对您行业的特定检测功能。
