منصة دردشة AI متعددة النماذج للمؤسسات مع نظام فواتير يعتمد على الرصيد
احتاجت مؤسسة إلى منصة موحدة للفرق للوصول إلى نماذج AI متعددة (GPT, Claude, Gemini, Grok, Perplexity) مع أمان بمستوى المؤسسات، وتتبع الاستخدام، وإدارة التكاليف.
ناقش مشروعك
التحدي
كانت الفرق تستخدم أدوات AI متعددة بدون مركزية أو تحكم في التكاليف:
- كان لكل عضو في الفريق اشتراكات منفصلة لمزودي AI مختلفين
- عدم وجود سجل محادثات موحد أو مشاركة للمعرفة عبر المؤسسة
- عدم وجود رؤية لتكاليف استخدام AI أو الاستهلاك لكل مستخدم
- لم يكن بالإمكان تلبية متطلبات أمان المؤسسة وامتثال GDPR باستخدام أدوات المستهلك
- تطلب مقارنة مخرجات النماذج التبديل بين واجهات متعددة
حلنا
لقد قمنا ببناء منصة دردشة AI متعددة النماذج جاهزة للإنتاج مع نظام فواتير يعتمد على الرصيد، وتحكم في الوصول يستند إلى الأدوار، وامتثال GDPR.
البنية
- الواجهة الأمامية: React 18 + TypeScript + Vite مع Tailwind CSS
- الواجهة الخلفية: Node.js/Express مع TypeScript و Prisma ORM
- قاعدة البيانات: PostgreSQL (أكثر من 60 جدولاً) مع التخزين المؤقت Redis
- المصادقة: AWS Cognito مع RBAC يستند إلى JWT
- الفواتير: LemonSqueezy مع تتبع الاستهلاك القائم على الرصيد
- قائمة الانتظار: BullMQ لمعالجة المهام في الخلفية
- البنية التحتية: AWS (ECS/Fargate, RDS, ElastiCache, S3, KMS, SES)
تكاملات AI
- نماذج OpenAI GPT
- نماذج Anthropic Claude
- نماذج Google Gemini
- نماذج xAI Grok
- Perplexity للبحث على الويب
- Suno لتوليد الموسيقى بواسطة AI
الميزات الرئيسية
- دردشة متعددة النماذج - التبديل بين مزودي AI لكل محادثة
- مقارنة بتقسيم الشاشة - مقارنة مخرجات النماذج جنبًا إلى جنب
- أتمتة سير العمل - سير عمل AI خطوة بخطوة مدعوم بـ LangGraph
- سوق GPT - اكتشاف وإنشاء ومشاركة GPTs مخصصة
- المخرجات (Artifacts) - معاينة التعليمات البرمجية/HTML في بيئة معزولة ضمن المحادثات
- نظام الرصيد - الدفع حسب الاستخدام مع إعادة تعبئة تلقائية ومنح إدارية
- امتثال GDPR - حذف تلقائي، تصدير البيانات، تشفير AES-256-GCM
- الإشراف على المحتوى - نظام وسم مع فرز تلقائي للمحتوى غير اللائق
- الدردشة الجماعية - مشاركون متعددون من AI في محادثة واحدة
- البحث على الويب - تكامل Perplexity للحصول على استجابات مستندة ومحدثة
النتائج
المكدس التقني
caseStudyDetail.more دراسات الحالة
استكشف المزيد من تطبيقاتنا التقنية
معالجة الفواتير المدعومة بـ AI باستخدام OCR ودمج QuickBooks
كانت شركة متوسطة الحجم تعالج مئات فواتير الموردين شهريًا بحاجة إلى التخلص من إدخال البيانات يدويًا عن طريق استخلاص بيانات الفاتورة تلقائيًا باستخدام AI/OCR ومزامنتها مباشرةً مع QuickBooks للمسك الدفتري وتتبع المدفوعات.
إدراج الإعلانات من جانب العميل (CSAI) مع تحليل علامات SCTE-35 وتكامل مشغلات متعددة المنصات
احتاجت منصة بث الفيديو إلى تطبيق إدراج الإعلانات من جانب العميل (CSAI) عبر تطبيقات الويب والجوال والتلفزيون الذكي المتصل – مما يتيح تجارب إعلانية مخصصة على مستوى الجهاز مع دعم كامل لتفاعل الإعلانات (تراكبات قابلة للنقر، إعلانات مصاحبة، أزرار تخطي) التي لا يمكن لتضمين الإعلانات من جانب الخادم توفيرها.
الأسئلة الشائعة
قامت MicrocosmWorks بتصميم طبقة توجيه ذكية تقوم بتقييم المطالبات الواردة بناءً على نوع المهمة، والتعقيد، ومتطلبات الـ token، ثم توجيهها إلى النموذج الأنسب سواء كان ذلك GPT-4، أو Claude، أو Llama، أو نموذجًا متخصصًا معدلاً بدقة (fine-tuned). يعمل هذا النهج على تحسين جودة الاستجابة والتكلفة معًا، حيث يمكن التعامل مع الاستعلامات الأبسط بواسطة نماذج أسرع وأقل تكلفة بينما يتم توجيه مهام الاستدلال المعقدة إلى النماذج الأكثر قدرة.
نفذت MicrocosmWorks نظام رصيد موحدًا يقوم بتجريد التكاليف المتغيرة لكل token لمزودي AI المختلفين إلى عملة داخلية واحدة يشتريها عملاء المؤسسات بكميات كبيرة. يخصم كل تفاعل مع النموذج أرصدة متناسبة مع تكلفة API الفعلية بالإضافة إلى هامش قابل للتكوين، مما يمنح المسؤولين لوحة تحكم واحدة لتتبع الاستخدام، وتعيين ميزانيات على مستوى الأقسام، وتوليد تقارير chargeback.
نعم، قامت MicrocosmWorks ببناء طبقة حوكمة مركزية تفرض سياسات متسقة للتعامل مع البيانات بغض النظر عن LLM الأساسي الذي يعالج الاستعلام. جميع المحادثات مشفرة في وضع السكون، وتحدد ضوابط الوصول المستندة إلى الأدوار الفرق التي يمكنها الوصول إلى أي من النماذج، وتقوم سياسات الاحتفاظ القابلة للتكوين تلقائيًا بمسح سجل المحادثات وفقًا لمتطلبات الامتثال الخاصة بك.
قامت MicrocosmWorks بتحسين طبقة التوجيه لإضافة أقل من 50 milliseconds من النفقات العامة لكل طلب، وهو أمر لا يُذكر مقارنةً بأوقات استجابة LLM النموذجية التي تتراوح من 1 إلى 10 seconds. تستخدم المنصة connection pooling، وجلسات مصادق عليها مسبقًا مع كل مزود، وتدفقًا غير متزامن (async streaming) بحيث تبدأ الـ tokens بالظهور في واجهة المستخدم (user interface) بمجرد أن يبدأ النموذج المختار في توليدها.
تبني MicrocosmWorks منصات دردشة متعددة النماذج للمؤسسات بمعدلات تطوير تتراوح من 30 إلى 50 دولارًا في الساعة، وهو جزء بسيط مما تتقاضاه الشركات الاستشارية الكبرى لمشاريع البنية التحتية لـ AI المماثلة. يعتمد النطاق الكلي على عدد عمليات دمج النماذج، ومتطلبات المصادقة و SSO، وما إذا كنت بحاجة إلى ميزات مثل conversation branching، أو prompt libraries، أو fine-tuning pipelines.
مستعد لتحويل عملك؟
دعنا نناقش كيف يمكننا تطبيق حلول مشابهة لتحدياتك.