挑战
团队正在使用多种 AI 工具,缺乏集中管理和成本控制:
- 每个团队成员都独立订阅了不同的 AI 提供商服务
- 组织内没有统一的对话历史记录或知识共享
- 无法了解 AI 使用成本或每个用户的消耗
- 消费级工具无法满足企业安全和 GDPR 合规性要求
- 比较模型输出需要在多个界面之间切换
我们的解决方案
我们构建了一个生产级的多模型 AI 聊天平台,具备积分计费、基于角色的访问控制和 GDPR 合规性。
架构
- 前端:React 18 + TypeScript + Vite,使用 Tailwind CSS
- 后端:Node.js/Express,使用 TypeScript 和 Prisma ORM
- 数据库:PostgreSQL (60多个表),使用 Redis 缓存
- 认证:AWS Cognito,使用基于 JWT 的 RBAC
- 计费:LemonSqueezy,具有积分消费跟踪功能
- 队列:BullMQ,用于后台作业处理
- 基础设施:AWS (ECS/Fargate, RDS, ElastiCache, S3, KMS, SES)
AI 集成
- OpenAI GPT 模型
- Anthropic Claude 模型
- Google Gemini 模型
- xAI Grok 模型
- Perplexity 用于网络搜索
- Suno 用于 AI 音乐生成
主要功能
- 多模型聊天 - 在每次对话中切换 AI 提供商
- 分屏比较 - 并排比较模型输出
- 工作流自动化 - LangGraph 支持的逐步 AI 工作流
- GPT 市场 - 发现、创建和共享自定义 GPTs
- 工件 - 对话中的沙盒化代码/HTML 预览
- 积分系统 - 按使用付费,具备自动充值和管理员授权功能
- GDPR 合规性 - 自动化删除、数据导出、AES-256-GCM 加密
- 内容审核 - 标记系统,自动分类处理不当内容
- 群聊 - 单次对话中包含多个 AI 参与者
- 网络搜索 - Perplexity 集成,用于提供有依据的、最新的回复
成果
技术栈
常见问题
MicrocosmWorks 设计了一个智能路由层,该层根据任务类型、复杂性和 token 需求评估传入的提示,然后将其分派给最合适的模型,无论是 GPT-4、Claude、Llama,还是一个专门的微调模型。这种方法优化了响应质量和成本,因为更简单的查询可以由更快、更便宜的模型处理,而复杂的推理任务则由能力更强的模型处理。
MicrocosmWorks 实施了一个统一的积分系统,该系统将不同 AI 提供商的各异的按 token 成本抽象化为一种企业客户可批量购买的内部货币。每次模型交互都会根据其实际 API 成本加上一个可配置的利润率扣除相应比例的积分,为管理员提供一个单一的仪表板来跟踪使用情况、设置部门级预算并生成费用分摊报告。
是的,MicrocosmWorks 构建了一个集中式治理层,无论底层 LLM 处理的是哪个查询,都能强制执行一致的数据处理策略。所有对话都经过静态加密,基于角色的访问控制决定哪些团队可以访问哪些模型,可配置的保留策略会根据您的合规性要求自动清除对话历史。
MicrocosmWorks 优化了路由层,使每次请求的开销增加不到 50 毫秒,与 LLM 典型的 1-10 秒响应时间相比,这可以忽略不计。该平台使用连接池、与每个提供商的预认证会话以及异步流式传输,以便一旦所选模型开始生成,令牌就会立即显示在用户界面中。
MicrocosmWorks 以每小时 $30-$50 的开发费率构建企业级多模型聊天平台,这仅为大型咨询公司对类似 AI 基础设施项目收费的一小部分。项目的总范围取决于模型集成数量、认证和 SSO 要求,以及您是否需要对话分支、提示库或微调管道等功能。
