פלטפורמת צ'אט AI ארגונית מרובת מודלים עם חיוב מבוסס-זיכויים
ארגון נזקק לפלטפורמה מאוחדת עבור צוותים כדי לגשת למודלים מרובים של AI (GPT, Claude, Gemini, Grok, Perplexity) עם אבטחה ברמה ארגונית, מעקב שימוש וניהול עלויות.
דון בפרויקט שלך
האתגר
צוותים השתמשו בכלי AI מרובים ללא ריכוזיות או בקרת עלויות:
- לכל חבר צוות היו מינויים נפרדים לספקי AI שונים
- ללא היסטוריית שיחות מאוחדת או שיתוף ידע ברחבי הארגון
- ללא נראות לעלויות השימוש ב-AI או לצריכה פר-משתמש
- דרישות אבטחה ארגונית ועמידה ב-GDPR לא יכלו להיענות באמצעות כלי צרכנים
- השוואת פלטי מודלים דרשה מעבר בין ממשקים מרובים
הפתרון שלנו
בנינו פלטפורמת צ'אט AI מרובת מודלים ברמת ייצור עם חיוב מבוסס-זיכויים, בקרת גישה מבוססת-תפקידים ועמידה ב-GDPR.
ארכיטקטורה
- צד לקוח (Frontend): React 18 + TypeScript + Vite עם Tailwind CSS
- צד שרת (Backend): Node.js/Express עם TypeScript ו-Prisma ORM
- מסד נתונים: PostgreSQL (60+ טבלאות) עם זיכרון מטמון של Redis
- אימות: AWS Cognito עם RBAC מבוסס JWT
- חיוב: LemonSqueezy עם מעקב צריכה מבוסס-זיכויים
- תור: BullMQ לעיבוד משימות רקע
- תשתית: AWS (ECS/Fargate, RDS, ElastiCache, S3, KMS, SES)
אינטגרציות AI
- מודלי GPT של OpenAI
- מודלי Claude של Anthropic
- מודלי Gemini של Google
- מודלי Grok של xAI
- Perplexity לחיפוש באינטרנט
- Suno ליצירת מוזיקת AI
תכונות מפתח
- צ'אט מרובה מודלים - מעבר בין ספקי AI לכל שיחה
- השוואה במסך מפוצל - השוואת פלטי מודלים זה לצד זה
- אוטומציית זרימת עבודה - זרימות עבודה של AI צעד-אחר-צעד המופעלות על ידי LangGraph
- שוק GPT - גלה, צור ושתף GPTs מותאמים אישית
- ארטיפקטים (Artifacts) - תצוגה מקדימה של קוד/HTML מבודד (sandboxed) בתוך שיחות
- מערכת זיכויים - תשלום לפי שימוש עם מילוי אוטומטי ומענקי אדמין
- עמידה ב-GDPR - מחיקה אוטומטית, ייצוא נתונים, הצפנת AES-256-GCM
- ניטור תוכן - מערכת סימון עם טיפול אוטומטי בתוכן בלתי הולם
- צ'אט קבוצתי - מספר משתתפי AI בשיחה אחת
- חיפוש באינטרנט - אינטגרציית Perplexity לתשובות מבוססות ומעודכנות
תוצאות
מחסנית טכנולוגית
caseStudyDetail.more מקרי בוחן
גלה עוד מהיישומים הטכניים שלנו
עיבוד חשבוניות מבוסס AI עם OCR ושילוב QuickBooks
עסק בגודל בינוני שעיבד מאות חשבוניות ספק בחודש נזקק לביטול הזנת נתונים ידנית על ידי חילוץ אוטומטי של נתוני חשבוניות באמצעות AI/OCR וסנכרונם ישירות ל-QuickBooks לצורך הנהלת חשבונות ומעקב תשלומים.
הזרקת פרסומות בצד הלקוח (CSAI) עם ניתוח סמני SCTE-35 ושילוב נגן מרובה פלטפורמות
פלטפורמת הזרמת וידאו נזקקה ליישם הזרקת פרסומות בצד הלקוח (CSAI) על פני יישומי אינטרנט, מובייל וטלוויזיות חכמות — המאפשרת חוויות פרסום מותאמות אישית ברמת המכשיר עם תמיכה מלאה באינטראקציה עם פרסומות (שכבות-על ניתנות ללחיצה, באנרים נלווים, כפתורי דילוג) שאותן הזרקה בצד השרת אינה יכולה לספק.
שאלות נפוצות
MicrocosmWorks פיתחה שכבת ניתוב חכמה המנתחת בקשות נכנסות בהתבסס על סוג המשימה, מורכבותה ודרישות הטוקנים, ולאחר מכן שולחת אותן למודל המתאים ביותר – בין אם זה GPT-4, Claude, Llama, או מודל מותאם אישית (fine-tuned) מיוחד. גישה זו מייעלת הן את איכות התגובה והן את העלות, מכיוון ששאילתות פשוטות יותר יכולות להיות מטופלות על ידי מודלים מהירים וזולים יותר, בעוד שמשימות חשיבה מורכבות מופנות למודלים בעלי יכולת גבוהה יותר.
MicrocosmWorks הטמיעה מערכת זיכויים מאוחדת המפשטת את העלויות המשתנות לפי אסימון של ספקי AI שונים למטבע פנימי יחיד שלקוחות ארגוניים רוכשים בכמויות גדולות. כל אינטראקציה עם מודל מפחיתה זיכויים בפרופורציה לעלות ה-API בפועל שלה בתוספת מרווח רווח הניתן להגדרה, ומעניקה למנהלים לוח מחוונים יחיד למעקב אחר שימוש, הגדרת תקציבים ברמת מחלקה ויצירת דוחות chargeback.
כן, MicrocosmWorks בנתה שכבת ממשל מרכזית שאוכפת מדיניות עקבית לטיפול בנתונים ללא קשר לאיזה LLM בסיסי מעבד את השאילתה. כל השיחות מוצפנות במנוחה (at rest), בקרות גישה מבוססות תפקידים קובעות אילו צוותים יכולים לגשת לאילו מודלים, ומדיניות שמירה ניתנת להגדרה מטהרת אוטומטית את היסטוריית השיחות בהתאם לדרישות התאימות שלכם.
MicrocosmWorks ייעלה את שכבת הניתוב כדי להוסיף פחות מ-50 מילישניות של תקורה לבקשה, וזה זניח בהשוואה לזמני תגובה טיפוסיים של LLM הנעים בין 1-10 שניות. הפלטפורמה משתמשת באיגום חיבורים, סשנים מאומתים מראש עם כל ספק, ו-async streaming כך שהטוקנים מתחילים להופיע בממשק המשתמש ברגע שהמודל הנבחר מתחיל לייצר אותם.
MicrocosmWorks בונה פלטפורמות צ'אט ארגוניות מרובות מודלים בשיעורי פיתוח של $30-$50 לשעה, שזהו חלק קטן ממה שגובות חברות ייעוץ גדולות עבור פרויקטים דומים של תשתית AI. ההיקף הכולל תלוי במספר האינטגרציות של המודלים, דרישות אימות ו-SSO, והאם אתה זקוק לתכונות כמו הסתעפות שיחות, ספריות פרומפטים, או צינורות Fine-tuning.
מוכן לשנות את העסק שלך?
בואו נדון כיצד נוכל ליישם פתרונות דומים לאתגרים שלך.