MicrocosmWorksابتكار وتصميم الكون الرقمي
من نحناتصل بنا
MicrocosmWorksابتكار وتصميم الكون الرقمي

نقدم حلول تقنية المعلومات المهمة. نحن شغوفون بالتقنية والأمان ومساعدة الشركات على النمو من خلال بنية تحتية موثوقة ومبتكرة لتقنية المعلومات.

[email protected]
+91 7011868196
New Delhi, India

مركز نمو AI

مركز AIابتكار الشركات الناشئةمسرّع المؤسسات

الحلول

جميع الحلولتطبيقات الصحة واللياقةمنصة فيديو AIتطوير وكلاء AI

الموارد

رؤىأدلة القطاعاتمخططات حالات الاستخدامأنماط المعماريةدراسات الحالة

الشركة

من نحناتصل بناأعمالنا

الخدمات

الاستشارات الرقميةالبنية التحتية السحابيةتطوير SaaSتطوير AIتقنية الفيديو
تطوير ERPتخصيص Zohoتطوير Odooتكامل Salesforceتطوير CRM مخصص
تكامل QuickBooksحلول IoTتطوير بلوكتشين
استشارات الأمن السيبرانيالدعم التقني - L3

© 2026 MicrocosmWorks. جميع الحقوق محفوظة.

سياسة الخصوصيةشروط الخدمة
العودة إلى دراسات الحالة
GPU Infrastructureنُشر في June 18, 2026 · تم التحديث May 25, 2026

نمط التحجيم المتذبذب (تشغيل-إيقاف) لأعباء عمل AI ومعالجة الفيديو

احتاجت منصة لمعالجة الفيديو مدعومة بـ AI إلى التعامل مع أعباء عمل متغيرة للغاية — من صفر مهمة خلال ساعات عدم الذروة إلى مئات مهام معالجة الفيديو واستنتاج AI المتزامنة خلال أوقات الذروة — دون دفع تكاليف موارد GPU والحوسبة الخاملة.

ناقش مشروعك
on-off-pattern-ai-video-processing.webp
GPU Infrastructure
Domain
10
Technologies
5
Key Results
Delivered
Status

التحدي

تتسم أعباء عمل AI ومعالجة الفيديو بطبيعتها بأنها متقطعة ومكلفة:

  • تُعد مثيلات GPU باهظة التكلفة سواء كانت تعالج المهام أو كانت خاملة
  • يتطلب ترميز الفيديو، والنسخ، واستنتاج AI ملفات تعريف موارد مختلفة
  • كانت نسبة الذروة إلى الانحدار 50:1 — أكثر من 200 مهمة خلال الذروة، وشبه صفرية خلال الليل
  • كان التحجيم التلقائي التقليدي بطيئًا جدًا (وقت بدء تشغيل بارد من 5-10 دقائق) لطلبات المستخدمين الحساسة للوقت
  • البنية التحتية الثابتة المخصصة للذروة كانت تعني إهدارًا بنسبة تزيد عن 80% خلال ساعات عدم الذروة

حلنا

لقد طبقنا نمط تحجيم متذبذب (تشغيل-إيقاف) — وهو بنية هجينة يتم فيها توفير موارد الحوسبة في الوقت المناسب لأعباء العمل النشطة ويتم إيقاف تخصيصها بالكامل عند عدم النشاط، مع تجمعات دافئة (warm pools) للمهام الحساسة للوقت وتجمعات باردة (cold pools) لمهام الدُفعات.

البنية

  • قائمة انتظار المهام (Job Queue): قائمة انتظار مهام مدعومة بقاعدة بيانات مع تصنيف حسب الأولوية
  • المنسق (Orchestrator): خدمة تدير دورة حياة الموارد وتوجيه المهام
  • عُمّال GPU (AI): حاويات GPU سحابية للاستنتاج (اكتشاف الكائنات، النسخ، اكتشاف المتحدث)
  • عُمّال CPU (الفيديو): أجهزة افتراضية سحابية (Cloud VMs) لترميز الفيديو وعرضه
  • تجمع دافئ (Warm Pool): مثيلات مهيأة مسبقًا للمهام الحساسة لوقت الاستجابة (وقت بدء تشغيل أقل من 30 ثانية)
  • تجمع بارد (Cold Pool): مثيلات عند الطلب لمعالجة الدفعات/الكميات الكبيرة (وقت بدء تشغيل مقبول من 2-5 دقائق)

تطبيق نمط التحجيم المتذبذب (تشغيل-إيقاف)

حالات دورة حياة الموارد

تنتقل الموارد عبر دورة حياة محددة: من حالة عدم التخصيص الكامل (تكلفة صفرية)، مرورًا بالتوفير والتسخين (تحميل النماذج، فحوصات السلامة)، إلى حالات الجاهزية والمعالجة، ثم عبر فترة تهدئة قبل العودة إلى حالة عدم التخصيص.

استراتيجية التجمع الدافئ (Warm Pool)

للمعالجة الحساسة لوقت الاستجابة (بواسطة المستخدم، تتوقع النتائج في دقائق):

  • الحفاظ على حد أدنى من التجمع الدافئ للمثيلات خلال ساعات العمل
  • تحميل نماذج AI مسبقًا عند بدء تشغيل الحاوية
  • توجيه المهام الواردة إلى المثيلات الدافئة أولاً
  • توسيع نطاق المثيلات الدافئة الإضافية عندما يتجاوز عمق قائمة الانتظار الحد المعين
  • مؤقت تهدئة قابل للتكوين يحافظ على المثيلات نشطة بين المهام المتفرقة

استراتيجية التجمع البارد (Cold Pool)

لمعالجة الدُفعات (مهام مجمّعة ليلية، إعادة ترميز غير عاجلة):

  • صفر مثيل قيد التشغيل افتراضيًا
  • تقوم قائمة انتظار المهام بتشغيل عملية التوفير عند إرسال مهام الدفعات
  • مثيلات مُحسّنة للكميات الكبيرة للأداء العالي على حساب وقت الاستجابة
  • إنهاء المثيل فور اكتمال الدفعة
  • استخدام مثيلات spot/preemptible لتحقيق وفورات كبيرة في التكاليف

تصنيف المهام وتوجيهها

يتم تصنيف المهام تلقائيًا حسب الأولوية والنوع، ثم توجيهها إلى التجمع المناسب:

  • مهام AI ذات الأولوية العالية التي يبدأها المستخدم تُوجّه إلى تجمعات GPU الدافئة
  • المهام الحرجة في الوقت الفعلي تُوجّه إلى مثيلات مخصصة دائمًا في الخدمة
  • مهام الترميز ذات الأولوية المتوسطة تُوجّه إلى تجمعات CPU الدافئة أو الباردة
  • مهام الدفعات ذات الأولوية المنخفضة تُوجّه إلى مثيلات spot/preemptible الباردة

منطق المنسق (Orchestrator Logic)

محفزات التحجيم للأعلى (Scale-Up)

  • يتجاوز عمق قائمة الانتظار الحد القابل للتكوين
  • يتجاوز متوسط وقت الانتظار اتفاقية مستوى الخدمة (SLA) لمستوى الأولوية
  • زيادة مجدولة قبل ساعات الذروة المعروفة
  • تشغيل يدوي عبر واجهة برمجة تطبيقات الإدارة (admin API) لارتفاعات حركة المرور المتوقعة

محفزات التحجيم للأسفل (Scale-Down)

  • لم تتم معالجة أي مهام طوال مدة نافذة التهدئة
  • خفض مجدول بعد ساعات الذروة
  • اكتملت جميع المهام الموجودة في قائمة الانتظار دون تقديم مهام جديدة
  • تم الوصول إلى عتبة التكلفة للفترة الفوترة

الصحة والاستعادة

  • فحوصات صحية منتظمة على جميع المثيلات النشطة
  • استبدال المثيلات غير الصحية تلقائيًا
  • إعادة المهام الفاشلة إلى قائمة الانتظار مع عداد محاولات إعادة وتوجيهها إلى مثيل مختلف
  • قائمة انتظار الرسائل الميتة (Dead Letter Queue) للمهام التي تتجاوز الحد الأقصى لإعادة المحاولة

تأثير التكلفة

حقق نمط التحجيم المتذبذب (تشغيل-إيقاف) تخفيضًا في التكلفة بنسبة 70% تقريبًا مقارنة بالبنية التحتية الثابتة دائمًا في الخدمة، وذلك من خلال إلغاء الحوسبة الخاملة خلال ساعات عدم الذروة، وتحديد حجم الموارد المناسب لكل نوع مهمة، والاستفادة من مثيلات spot لأعباء عمل الدفعات.

الميزات الرئيسية

  1. تكلفة خمول صفرية — يتم إلغاء تخصيص الموارد بالكامل عندما لا تعالج المهام
  2. تجمعات دافئة (Warm Pools) — مثيلات مهيأة مسبقًا لأعباء العمل الحساسة لوقت الاستجابة
  3. تجمعات باردة (Cold Pools) — توفير عند الطلب لمهام الدفعات بأقل تكلفة
  4. تصنيف المهام — توجيه تلقائي بناءً على الأولوية والنوع ومتطلبات وقت الاستجابة
  5. نوافذ التهدئة (Cooldown Windows) — مهلة خمول قابلة للتكوين تمنع التحجيم للأسفل المبكر بين الدفعات
  6. دعم Spot/Preemptible — توجيه مهام الدفعات إلى مثيلات مخفضة التكلفة لتحقيق وفورات كبيرة
  7. الصحة والاستعادة — الاستبدال التلقائي للمثيلات غير الصحية مع إعادة المهام إلى قائمة الانتظار
  8. التحجيم المجدول — توقع أنماط حركة المرور المعروفة باستخدام قواعد التوفير القائمة على الوقت

النتائج

تخفيض التكلفة: توفير بحوالي 70% مقارنة بالبنية التحتية الثابتة دائمًا في الخدمة
وقت الاستجابة (Latency): أقل من 30 ثانية من حالة "بارد" إلى "جاهز" لمثيلات التجمع الدافئ
الموثوقية: حافظت الاستعادة التلقائية وإعادة المهام إلى قائمة الانتظار على معدل إنجاز المهام بنسبة تزيد عن 99.5%

المكدس التقني

Node.jsMongoDBRunPod APICloud VM APIsDockerFastAPIFFmpegRedisJob QueueCron Scheduling

caseStudyDetail.more دراسات الحالة

استكشف المزيد من تطبيقاتنا التقنية

GPU Infrastructure

الاستفادة من RunPod لاستدلال الذكاء الاصطناعي القابل للتوسع والفعال من حيث التكلفة

احتاجت منصة لتحليل الفيديو مدعومة بـ AI إلى قدرة حوسبة عالية الأداء على GPU لاكتشاف الكائنات والاستدلال في الوقت الفعلي عبر تدفقات فيديو متزامنة متعددة — دون التكلفة الباهظة لخوادم GPU المخصصة التي تعمل على مدار الساعة طوال أيام الأسبوع.

اقرأ دراسة الحالة
AI Accounting

معالجة الفواتير المدعومة بـ AI باستخدام OCR ودمج QuickBooks

كانت شركة متوسطة الحجم تعالج مئات فواتير الموردين شهريًا بحاجة إلى التخلص من إدخال البيانات يدويًا عن طريق استخلاص بيانات الفاتورة تلقائيًا باستخدام AI/OCR ومزامنتها مباشرةً مع QuickBooks للمسك الدفتري وتتبع المدفوعات.

اقرأ دراسة الحالة

مستعد لتحويل عملك؟

دعنا نناقش كيف يمكننا تطبيق حلول مشابهة لتحدياتك.

تواصل معناcaseStudyDetail.viewAllCaseStudies
المرونة: مستويات مختلفة من GPU/CPU لأنواع المهام المختلفة أدت إلى تحسين التكلفة لكل مهمة
التحجيم: تم التعامل مع أكثر من 200 مهمة متزامنة خلال الذروة مع عدم وجود بنية تحتية مسبقة التوفير خلال ساعات عدم الذروة
Video Encoding

إدراج الإعلانات من جانب العميل (CSAI) مع تحليل علامات SCTE-35 وتكامل مشغلات متعددة المنصات

احتاجت منصة بث الفيديو إلى تطبيق إدراج الإعلانات من جانب العميل (CSAI) عبر تطبيقات الويب والجوال والتلفزيون الذكي المتصل – مما يتيح تجارب إعلانية مخصصة على مستوى الجهاز مع دعم كامل لتفاعل الإعلانات (تراكبات قابلة للنقر، إعلانات مصاحبة، أزرار تخطي) التي لا يمكن لتضمين الإعلانات من جانب الخادم توفيرها.

اقرأ دراسة الحالة

الأسئلة الشائعة

طوّرت MicrocosmWorks نمط التحجيم المتوقف-التشغيل (on-off scaling pattern) لأعباء العمل التي تتميز بفترات معالجة مكثفة لوحدات معالجة الرسوميات (GPU-intensive processing) يمكن التنبؤ بها، تليها فترات خمول طويلة، حيث يهدر التحجيم التلقائي التقليدي (traditional auto-scaling) المال في الحفاظ على الحد الأدنى من السعة خلال فترات الخمول. بدلاً من إبقاء الحالات الساخنة (warm instances) قيد التشغيل، يقوم النمط بتوفير البنية التحتية لوحدات معالجة الرسوميات (GPU infrastructure) عند الطلب عند وصول مهمة معالجة، وينفذ عبء العمل، وينهي البنية التحتية بالكامل عند الانتهاء، مما يحقق تكلفة شبه صفرية خلال فترات الخمول.

قللت MicrocosmWorks أوقات البدء البارد (cold start times) إلى أقل من 60 ثانية عن طريق البناء المسبق لصور الحاويات المُحسّنة (optimized container images) التي تحتوي على جميع أوزان نماذج AI والتبعيات المضمنة فيها، والمخزنة في سجل (registry) قريب جغرافيًا من منطقة الحوسبة. تستخدم طبقة التنسيق (orchestration layer) التوفير التنبؤي (predictive provisioning) لأعباء العمل المجدولة، حيث تبدأ البنية التحتية قبل 2-3 دقائق من الطلب المتوقع، وبالنسبة لأعباء العمل غير المتوقعة، يقوم النظام بوضع المهام في قائمة انتظار (queues jobs) وإرسال إشعارات ببدء المعالجة (processing-started notifications) حتى يعرف المستخدمون أن طلبهم قيد المعالجة.

وثّقت MicrocosmWorks تخفيضات في التكلفة بنسبة 70-90% للعملاء الذين تعمل أعباء عمل معالجة الفيديو بتقنية AI لديهم لمدة 2-6 ساعات يوميًا مقارنة بالحفاظ على حالات وحدات معالجة الرسوميات (GPU instances) تعمل على مدار الساعة طوال أيام الأسبوع (24/7). تأتي هذه الوفورات من الدفع مقابل وقت المعالجة الفعلي فقط بالإضافة إلى بضع دقائق من تكلفة التشغيل والإيقاف (startup and teardown overhead)، والنمط فعال بشكل خاص لسير العمل مثل معالجة الفيديو الليلية المجمعة (nightly batch video processing)، أو تحويل الشفرة عند الطلب (on-demand transcoding)، أو تحليل AI الذي يتم تشغيله بواسطة الأحداث (event-triggered AI analysis) حيث يكون الاستخدام متقطعًا بطبيعته.

نعم، نفذت MicrocosmWorks بنية مروحة توسعية (fan-out architecture) ضمن نمط المتوقف-التشغيل (on-off pattern) التي توفر العديد من عمال وحدات معالجة الرسوميات (GPU workers) بالتوازي عند وصول مهام مجمعة كبيرة، وتوزع ملفات الفيديو عبر العمال باستخدام قائمة انتظار المهام (job queue)، وتنهي جميع العمال بمجرد اكتمال الدفعة. يتتبع النظام التقدم لكل فيديو ويتعامل مع حالات فشل الفيديو الفردية بمنطق إعادة المحاولة (retry logic) دون حظر بقية الدفعة، ويوحد النتائج في موقع إخراج واحد للاستهلاك اللاحق.

تنفذ MicrocosmWorks معماريات التحجيم المتوقف-التشغيل (on-off scaling architectures) بمعدلات تطوير تتراوح من 25 إلى 45 دولارًا في الساعة (25-45$/hr)، مع تنفيذ جاهز للإنتاج يشمل تنسيق المهام (job orchestration)، وتوفير البنية التحتية (infrastructure provisioning)، والمراقبة (monitoring)، والتعامل مع الأعطال (failure handling) والذي يتم تسليمه عادةً في غضون 3-5 أسابيع. عادةً ما يعوض الاستثمار في التطوير تكلفته في غضون 1-2 شهر من خلال وفورات تكلفة وحدات معالجة الرسوميات (GPU) وحدها، خاصة للمؤسسات التي تشغل حاليًا حالات وحدات معالجة الرسوميات (GPU instances) دائمة التشغيل (always-on) التي تظل خاملة لأكثر من 50% من اليوم.