MicrocosmWorksDijital Kozmosu Yenilikçi ve Mimari Olarak Tasarlamak
Hakkındaİletişim
MicrocosmWorksDijital Kozmosu Yenilikçi ve Mimari Olarak İnşa Etmek

Önemli BT çözümleri sunuyoruz. Teknoloji, güvenlik ve işletmelerin güvenilir, yenilikçi BT altyapısı ile büyümesine yardımcı olmaktan tutkuluyuz.

[email protected]
+91 7011868196
New Delhi, India

AI Büyüme Merkezi

AI MerkeziStartup İnovasyonuKurumsal Hızlandırıcı

Çözümler

Tüm ÇözümlerSağlık ve Fitness UygulamalarıAI Video PlatformuAI Ajan Geliştirme

Kaynaklar

ÖngörülerSektör RehberleriKullanım Durumu ŞablonlarıMimari KalıplarVaka Çalışmaları

Şirket

HakkımızdaİletişimÇalışmalarımız

Hizmetler

Dijital DanışmanlıkBulut AltyapısıSaaS GeliştirmeYapay Zeka GeliştirmeVideo Teknolojisi
ERP GeliştirmeZoho ÖzelleştirmeOdoo GeliştirmeSalesforce EntegrasyonuÖzel CRM Geliştirme
QuickBooks EntegrasyonuIoT ÇözümleriBlokzincir Geliştirme
Siber Güvenlik DanışmanlığıIT Desteği - L3

© 2026 MicrocosmWorks. Tüm hakları saklıdır.

Gizlilik PolitikasıHizmet Şartları
Vaka Çalışmalarına Dön
Video AnnotationYayınlandı June 18, 2026 · Güncellendi May 25, 2026

ML ve İçerik Oluşturma için Programatik Video Açıklama Çerçevesi

ML araştırmacıları ve video içerik oluşturucuları, eğitim verisi hazırlığından eğitim amaçlı yer paylaşımlarına kadar, büyük ölçekte açıklama eklenmiş videolar üretebilen esnek, kod odaklı bir video açıklama aracına ihtiyaç duyuyordu.

Projenizi Tartışın
programmatic-video-annotation-framework.webp
Video Annotation
Domain
8
Technologies
4
Key Results
Delivered
Status

Zorluk

Mevcut video açıklama araçları, ya programatik bir API'si olmayan yoğun GUI'li araçlardı ya da zayıf görselleştirmeye sahip komut satırı araçlarıydı:

  • ML ekipleri, büyük ölçekte eğitim verileri için bounding box'lara, polygon'lara ve label'lara ihtiyaç duyuyordu
  • Eğitimciler, öğretici videolar için animasyonlu yer paylaşımlarına (arrows, spotlights, text) ihtiyaç duyuyordu
  • Geleneksel açıklama araçları, keyframe interpolation'ı veya easing animation'ları işleyemiyordu
  • Hiçbir masaüstü-yerel çözümü, OpenCV işlemeyi profesyonel video çıktısıyla birleştiremiyordu

Çözümümüz

Type-safe bir açıklama sistemi, keyframe interpolation ve bir Tauri masaüstü editörü ile React/Remotion tabanlı bir video açıklama çerçevesi geliştirdik.

Mimari

  • Video Motoru: Programatik kare kare rendering için Remotion 4.0
  • Frontend: Vite ile React 18 + TypeScript
  • Masaüstü Uygulaması: OpenCV.js ve ONNX Runtime ile Tauri 2
  • Dışa Aktırma: Yüksek kaliteli video çıktısı için FFmpeg

Açıklama Türleri

  1. Bounding Boxes - Etiketli ve güven skorlu dikdörtgen bölgeler
  2. Circles - Yapılandırılabilir yarıçapa sahip nokta açıklamaları
  3. Polygons - Düzensiz şekiller için karmaşık bölge ana hatları
  4. Text Labels - Konumlandırmalı stilize metin yer paylaşımları
  5. Arrows - Akış veya dikkat için yön göstergeleri
  6. Freehand Paths - Özel çizilmiş açıklamalar
  7. Spotlights - Arka planı kısılmış vurgulu bölgeler

Animasyon Sistemi

  • Keyframe Interpolation - Açıklama durumları arasında akıcı geçişler
  • Easing Functions - Spring, ease-in-out, bounce ve özel eğriler
  • Scene Composition - Giriş, açıklama katmanları, birleşik zaman çizelgesi, çıkış
  • Fade Effects - Yapılandırılabilir süre ile fade-in/out

Temel Özellikler

  1. Type-Safe API - Tüm açıklama primitifleri için kapsamlı TypeScript tipleri
  2. Scene System - Sahne yapı taşlarından karmaşık videolar oluşturun
  3. Keyframe Animation - Herhangi bir açıklama özelliğini zaman içinde canlandırın
  4. Masaüstü Editörü - Gerçek zamanlı önizlemeye sahip Tauri tabanlı GUI
  5. Batch Export - FFmpeg aracılığıyla açıklama eklenmiş videoları render edin
  6. OpenCV Integration - Masaüstü uygulamasında bilgisayar görüşü işleme

Sonuçlar

Otomasyon: Programatik API, binlerce videonun toplu olarak açıklanmasını sağladı
Kalite: Remotion, herhangi bir çözünürlükte piksel-perfect açıklamalar render etti
Esneklik: Aynı araç, ML eğitim verisi hazırlığına ve eğitim içeriğine hizmet etti

Teknoloji Yığını

ReactTypeScriptRemotion 4.0ViteTauri 2OpenCV.jsONNX RuntimeFFmpeg

caseStudyDetail.more Vaka Çalışmaları

Daha fazla teknik uygulamamızı keşfedin

Video Annotation

Yapay Zeka Destekli Uzun Metrajlı Film Üretim Hattı

Basit bir metin istemini 15-90 dakikalık bir filme dönüştüren uçtan uca bir AI hattı kurarak uzun metrajlı film üretimini demokratikleştirmeyi amaçlayan iddialı bir içerik oluşturma projesi.

Vaka Çalışmasını Oku
AI Accounting

AI Destekli Fatura İşleme (OCR ve QuickBooks Entegrasyonu ile)

Ayda yüzlerce satıcı faturasını işleyen orta ölçekli bir işletme, fatura verilerini AI/OCR kullanarak otomatik olarak çıkarıp muhasebe ve ödeme takibi için doğrudan QuickBooks'a senkronize ederek manuel veri girişini ortadan kaldırmak istedi.

Vaka Çalışmasını Oku

Sıkça Sorulan Sorular

MicrocosmWorks, insan tıklamaları yerine kod tabanlı kurallar kullanarak büyük ölçekte açıklama oluşturması gereken ekipler için bu çerçeveyi oluşturdu. Önceden eğitilmiş dedektörleri, zamansal mantığı ve uzamsal kuralları uygulayan Python betikleri olarak açıklama işlem hatları yazmayı destekler; bu sayede eğitim verilerini otomatik olarak oluşturur ve ardından COCO, Pascal VOC veya YOLO formatlarında dışa aktarır.

Evet, MicrocosmWorks; kare aralıklarını, ana kare interpolasyonunu ve başlangıç/bitiş zaman damgalı olay tabanlı etiketleri destekleyen bir zamansal açıklama modeli uyguladı. Açıklamacılar, eylem etiketlemeyi otomatikleştirmek için 'poz tahmini, 3 ardışık kareden fazla bir süre boyunca her iki ayağın da yerden kesildiğini algıladığında koşuyor olarak etiketle' gibi zamansal kurallar tanımlayabilir.

MicrocosmWorks, programatik açıklamalar ile insan tarafından incelenen bir altın küme arasındaki uyum puanlarını hesaplayan, yapılandırılabilir bir IoU veya zamansal örtüşme eşiğinin altına düşen açıklamaları işaretleyen bir doğrulama işlem hattı oluşturdu. Çerçeve ayrıca, düşük güvenilirlikli açıklamaları insan incelemecilere yönlendiren aktif öğrenme iş akışlarını da destekler.

MicrocosmWorks, çerçeveyi FFmpeg ve OpenCV üzerine kurdu; MP4, MKV, AVI ve MOV dahil tüm ana kapsayıcı formatlarını H.264'ten ProRes'e kadar kodeklerle destekler. Çerçeve, videoları kendi doğal çözünürlüklerinde işler ancak büyük veri kümelerinde işlem hacmini hızlandırmak için açıklama geçişi için yapılandırılabilir ölçek küçültmeyi destekler.

MicrocosmWorks, ML altyapı projelerini 25-45 $/saat oranlarında sunar; kural motorunu, format dışa aktarıcılarını ve kalite doğrulama işlem hattını içeren programatik bir video açıklama çerçevesi genellikle 300-500 geliştirme saati gerektirir. Çerçeve, dakikası 5-15 $ arasında değişebilen manuel açıklama maliyetlerini azaltarak kendini hızla amorti eder.

İşletmenizi Dönüştürmeye Hazır mısınız?

Zorluklarınıza benzer çözümler uygulamamızın yollarını konuşalım.

İletişime GeçincaseStudyDetail.viewAllCaseStudies
Masaüstü Performansı: Tauri, web UI kolaylığıyla yerel hızda işleme sağladı
Video Encoding

İstemci Tarafında Reklam Ekleme (CSAI), SCTE-35 İşaretleyici Ayrıştırma ve Çok Platformlu Oynatıcı Entegrasyonu ile

Bir video akış platformu, sunucu tarafı reklam eklemenin sağlayamadığı tam reklam etkileşimi desteğiyle (tıklanabilir katmanlar, yardımcı banner'lar, atlama düğmeleri) kişiselleştirilmiş, cihaz düzeyinde reklam deneyimleri sunarak web, mobil ve akıllı TV uygulamaları genelinde Client-Side Ad Insertion (CSAI) uygulamasına ihtiyaç duyuyordu.

Vaka Çalışmasını Oku