סביבת עבודה AI מאוחדת מבוססת-קרדיטים המשתרעת על פני Web App עם Split Mode ו-GrouPT, סביבת עבודה שיתופית של Projects עם מסמכים/גיליונות אלקטרוניים/ארטיפקטים, לוח מחוונים למנהל (Admin Dashboard) לניהול שוק ובקרת עלויות, ושכבת RAG כפולה (FAISS מקומי בתוספת מיקרו-שירות מרוחק מגובה ב-Milvus) — כולם מניעים חמישה ספקי AI תחת קורת גג אחת.

תכננו את ארכיטקטורת הפלטפורמה בעלת חמשת המשטחים – Web App, סביבת עבודה Projects, לוח מחוונים למנהל (Admin Dashboard), מיקרו-שירות RAG ושירות FAISS מקומי.
בנינו את שכבת הצ'אט המאוחדת מרובת הספקים עם תגובות SSE בסטרימינג על פני OpenAI, Claude, Gemini, Grok ו-Perplexity משרשור שיחה יחיד.
סיפקנו את מערכת היכולות – חיפוש אינטרנט מבוסס Perplexity עם ציטוטים, סשנים של מחקר מעמיק, יצירת תמונות המוזרקות עם קונטקסט RAG, העלאת קבצים + אינדוקס RAG, וסוכן הפתרונות של Nexum Five.
יישמנו את Split Mode ו-GrouPT – השוואה דו-חלונית צד-ל-צד ודיונים מובנים מרובי AI עם מצבי דיבייט, סיעור מוחות וניתוח.
השקנו את מערכת הארטיפקטים עם תצוגה מקדימה חיה של HTML/JSX/TSX, היסטוריית גרסאות, קישור שיחות, תכונות חברתיות ושוק קהילתי.
הנדסנו את מנוע זרימת העבודה (Solutions) עם ביצוע אוטומטי מרובה שלבים, פסי התקדמות, קישורים ניתנים לשיתוף וביצוע כאורח ללא אימות.
בנינו את סביבת העבודה השיתופית Projects המשלבת את עורך המסמכים TipTap, עורך הגיליונות האלקטרוניים Fortune Sheet, ועורך קוד ארטיפקטים – כולם מבוססי RAG מול קבצי פרויקט.
תכננו את ארכיטקטורת RAG עם אחסון כפול – FAISS מקומי עבור ידע לשיחה ול-GPT עם אינדקסים מגובים בדיסק, ומיקרו-שירות מרוחק מגובה ב-Milvus עבור עומסי עבודה בקנה מידה של פרויקט.
יישמנו אחזור היברידי המשלב דמיון וקטורי, התאמת מילות מפתח BM25, וניקוד עדכניות עם חיפוש מוגבל ל-IndexTag להתאמה אישית.
השקנו את לוח המחוונים למנהל (Admin Dashboard) עם ניהול משתמשים, ניהול שוק, ניתוח עלויות לכל ספק/מודל/משתמש, התאמות קרדיט ידניות, תצורת תמחור, ויומן ביקורת מלא. שילבנו אימות AWS Cognito עם RBAC בחמש רמות ומערכת החיוב מבוססת-הקרדיטים ב-LemonSqueezy.
מאחד חמישה ספקי AI מובילים מאחורי ממשק יחיד מבוסס-קרדיטים, מוסיף סביבות עבודה שיתופיות לפרויקטים עם RAG מבוסס, ומציג תכונות מרובות AI כמו השוואת Split Mode ודיוני קבוצה GrouPT שאף ספק יחיד אינו מציע באופן טבעי.
בואו נדון כיצד נוכל להגשים את החזון שלך עם אותה רמת מומחיות ומסירות.
MicrocosmWorks implemented a normalized credit system in NexumFive where each AI provider's token costs are mapped to a universal credit value maintained in the admin pricing configuration. When a user switches between OpenAI, Claude, Gemini, Grok, or Perplexity mid-conversation, the backend calculates credit consumption based on the per-model cost multiplier. The admin dashboard provides per-provider and per-model cost analytics for accurate margin tracking.
MicrocosmWorks designed the dual RAG system so local FAISS handles per-conversation and per-GPT knowledge with disk-backed indices for fast single-user retrieval, while the remote Milvus-backed microservice handles project-scale workloads requiring cross-document search across large file collections. Hybrid retrieval combines vector similarity, BM25 keyword matching, and recency scoring, with IndexTag-scoped search ensuring personalization within each user's data.
GrouPT is MicrocosmWorks' implementation of structured multi-AI discussions where multiple AI models participate in a conversation with defined roles. Users configure debate, brainstorm, or analysis modes, and the system orchestrates sequential responses from selected models (OpenAI, Claude, Gemini, Grok, Perplexity) via streaming SSE. Each model receives the full conversation context plus its role instructions, enabling comparative analysis of model strengths on the same prompt.
MicrocosmWorks built the Projects workspace combining TipTap for document editing, Fortune Sheet for spreadsheets, and an artifact code editor. All project files are automatically indexed into the Milvus RAG layer via a BullMQ embedding pipeline that processes documents on save. When users query the AI within a project context, retrieval is scoped to that project's indexed files, grounding responses in the team's actual documents and data.
MicrocosmWorks shipped a full marketplace system in NexumFive with community-published GPTs (custom AI personas with specialized instructions and knowledge), Workflows (multi-step automated processes with autopilot execution), and Artifacts (reusable HTML/JSX components with live preview). Users build custom GPTs through a no-code builder that configures system prompts, attached knowledge files indexed via FAISS, available tools, and model preferences.