MicrocosmWorks๋””์ง€ํ„ธ ์ฝ”์Šค๋ชจ์Šค ํ˜์‹  ๋ฐ ์„ค๊ณ„
์†Œ๊ฐœ์—ฐ๋ฝ์ฒ˜
MicrocosmWorks๋””์ง€ํ„ธ ์ฝ”์Šค๋ชจ์Šค๋ฅผ ํ˜์‹ ํ•˜๊ณ  ์„ค๊ณ„ํ•ฉ๋‹ˆ๋‹ค

์ค‘์š”ํ•œ IT ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์ˆ , ๋ณด์•ˆ์— ์—ด์ •์ ์ด๋ฉฐ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ํ˜์‹ ์ ์ธ IT ์ธํ”„๋ผ๋ฅผ ํ†ตํ•ด ๋น„์ฆˆ๋‹ˆ์Šค ์„ฑ์žฅ์„ ๋•์Šต๋‹ˆ๋‹ค.

[email protected]
+91 7011868196
New Delhi, India

AI ์„ฑ์žฅ ํ—ˆ๋ธŒ

AI ํ—ˆ๋ธŒ์Šคํƒ€ํŠธ์—… ํ˜์‹ ๊ธฐ์—… ๊ฐ€์†๊ธฐ

์†”๋ฃจ์…˜

๋ชจ๋“  ์†”๋ฃจ์…˜์›ฐ๋‹ˆ์Šค ๋ฐ ํ”ผํŠธ๋‹ˆ์Šค ์•ฑAI ๋น„๋””์˜ค ํ”Œ๋žซํผAI ์—์ด์ „ํŠธ ๊ฐœ๋ฐœ

์ž์›

ํ†ต์ฐฐ๋ ฅ์‚ฐ์—… ๊ฐ€์ด๋“œ์‚ฌ์šฉ ์‚ฌ๋ก€ ์ฒญ์‚ฌ์ง„์•„ํ‚คํ…์ฒ˜ ํŒจํ„ด์‚ฌ๋ก€ ์—ฐ๊ตฌ

ํšŒ์‚ฌ

ํšŒ์‚ฌ ์†Œ๊ฐœ์—ฐ๋ฝ์ฒ˜์šฐ๋ฆฌ์˜ ์ž‘์—…

์„œ๋น„์Šค

๋””์ง€ํ„ธ ์ปจ์„คํŒ…ํด๋ผ์šฐ๋“œ ์ธํ”„๋ผSaaS ๊ฐœ๋ฐœAI ๊ฐœ๋ฐœ๋น„๋””์˜ค ๊ธฐ์ˆ 
ERP ๊ฐœ๋ฐœZoho ๋งž์ถคํ™”Odoo ๊ฐœ๋ฐœSalesforce ํ†ตํ•ฉ๋งž์ถคํ˜• CRM ๊ฐœ๋ฐœ
QuickBooks ํ†ตํ•ฉIoT ์†”๋ฃจ์…˜๋ธ”๋ก์ฒด์ธ ๊ฐœ๋ฐœ
์‚ฌ์ด๋ฒ„ ๋ณด์•ˆ ์ปจ์„คํŒ…IT ์ง€์› - L3

ยฉ 2026 MicrocosmWorks. ๋ชจ๋“  ๊ถŒ๋ฆฌ ๋ณด์œ .

๊ฐœ์ธ์ •๋ณด ์ฒ˜๋ฆฌ๋ฐฉ์นจ์„œ๋น„์Šค ์•ฝ๊ด€
์‚ฌ๋ก€ ์—ฐ๊ตฌ ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ
Vector Databases๊ฒŒ์‹œ์ผ June 22, 2026 ยท ์ˆ˜์ •์ผ June 22, 2026

EC2 ๋ฐ S3 ๊ธฐ๋ฐ˜ ์˜๊ตฌ ์Šคํ† ๋ฆฌ์ง€๋ฅผ ํ™œ์šฉํ•œ Kubernetes ์ƒ Milvus ์˜คํ† ์Šค์ผ€์ผ๋ง

๊ธ‰์ฆํ•˜๋Š” ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ(๊ฒ€์ƒ‰, ์ถ”์ฒœ ๋ฐ RAG์šฉ ์ž„๋ฒ ๋”ฉ)๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” AI ํ”Œ๋žซํผ์€ ์ฟผ๋ฆฌ ๋กœ๋“œ ๋ฐ ๋ฐ์ดํ„ฐ ๋ณผ๋ฅจ์— ๋”ฐ๋ผ Milvus ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๊ฐ€ ์ž๋™์œผ๋กœ ํ™•์žฅ๋˜๊ธฐ๋ฅผ ์›ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” Pod๊ฐ€ ๋‹ค์‹œ ์‹œ์ž‘๋˜๊ฑฐ๋‚˜ ๋…ธ๋“œ๊ฐ€ ๊ต์ฒด๋˜์–ด๋„ ์†์‹ค๋˜์ง€ ์•Š๋Š” ๋‚ด๊ตฌ์„ฑ ์žˆ๊ณ  ๋น„์šฉ ํšจ์œจ์ ์ธ ์Šคํ† ๋ฆฌ์ง€๋ฅผ ํ•„์š”๋กœ ํ–ˆ์Šต๋‹ˆ๋‹ค.

ํ”„๋กœ์ ํŠธ ์ƒ๋‹ดํ•˜๊ธฐ
milvus-autoscaling-kubernetes-s3.webp
Vector Databases
Domain
11
Technologies
6
Key Results
Delivered
Status

๊ณผ์ œ

ํ”„๋กœ๋•์…˜ ํ™˜๊ฒฝ์—์„œ Milvus๋ฅผ ๋Œ€๊ทœ๋ชจ๋กœ ์šด์˜ํ•˜๋Š” ๊ฒƒ์€ ๋ช‡ ๊ฐ€์ง€ ์ธํ”„๋ผ ๊ณผ์ œ๋ฅผ ์•ˆ๊ณ  ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค:

  • ๊ณ ์ • ์šฉ๋Ÿ‰ โ€” ์ •์  Milvus ๋ฐฐํฌ๋Š” ํ”ผํฌ ์‹œ๊ฐ„ ๋™์•ˆ 10๋ฐฐ์— ๋‹ฌํ•˜๋Š” ์ฟผ๋ฆฌ ๋กœ๋“œ ๊ธ‰์ฆ์„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์—†์—ˆ์Šต๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ ์†์‹ค ์œ„ํ—˜ โ€” ์ž„์‹œ ์Šคํ† ๋ฆฌ์ง€์—์„œ Pod๊ฐ€ ๋‹ค์‹œ ์‹œ์ž‘๋˜๋ฉด ๋Œ€๊ทœ๋ชจ ์ปฌ๋ ‰์…˜์—์„œ ์ธ๋ฑ์Šค ์žฌ๊ตฌ์ถ•์— ๋ช‡ ์‹œ๊ฐ„์ด ์†Œ์š”๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • ๋น„์šฉ ๋น„ํšจ์œจ์„ฑ โ€” ํ”ผํฌ ๋กœ๋“œ๋ฅผ ์œ„ํ•œ ๊ณผ๋„ํ•œ ํ”„๋กœ๋น„์ €๋‹์€ ์œ ํœด ์ปดํ“จํŒ… ๋น„์šฉ์„ 70% ์‹œ๊ฐ„ ๋™์•ˆ ์ง€๋ถˆํ•ด์•ผ ํ•จ์„ ์˜๋ฏธํ–ˆ์Šต๋‹ˆ๋‹ค.
  • ์Šคํ† ๋ฆฌ์ง€ ๋น„์šฉ โ€” ์ธ์Šคํ„ด์Šค์— ์—ฐ๊ฒฐ๋œ ๋ธ”๋ก ์Šคํ† ๋ฆฌ์ง€ ๋ณผ๋ฅจ์€ ์ˆ˜ ํ…Œ๋ผ๋ฐ”์ดํŠธ ๊ทœ๋ชจ์˜ ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•ด ๋น„์šฉ์ด ๋งŽ์ด ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค.
  • ์ธ๋ฑ์Šค ์žฌ๊ตฌ์ถ• โ€” ๋…ธ๋“œ ๊ต์ฒด ํ›„ ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ์˜ ๋ฒกํ„ฐ๋ฅผ ์žฌ์ธ๋ฑ์‹ฑํ•˜๋Š” ๋ฐ ๋ช‡ ์‹œ๊ฐ„์˜ ๋‹ค์šดํƒ€์ž„์ด ์†Œ์š”๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • ๋‹ค์ค‘ AZ ๋‚ด๊ตฌ์„ฑ โ€” ๋‹จ์ผ AZ ์Šคํ† ๋ฆฌ์ง€๋Š” ๊ฐ€์šฉ ์˜์—ญ ์žฅ์• ์—์„œ ์‚ด์•„๋‚จ์„ ์ˆ˜ ์—†์—ˆ์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ์˜ ์†”๋ฃจ์…˜

์ฟผ๋ฆฌ ๋…ธ๋“œ๋ฅผ ์œ„ํ•œ Horizontal Pod Autoscaling, ์ปดํ“จํŒ…์„ ์œ„ํ•œ Cluster Autoscaler, ๊ทธ๋ฆฌ๊ณ  ์˜๊ตฌ ์Šคํ† ๋ฆฌ์ง€ ๋ฐฑ์—”๋“œ๋กœ Amazon S3๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ Kubernetes (EKS)์— Milvus๋ฅผ ๋ฐฐํฌํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ฐ์ดํ„ฐ ์†์‹ค ์œ„ํ—˜์„ ์—†์• ๊ณ  ์Šคํ† ๋ฆฌ์ง€ ๋น„์šฉ์„ ์•ฝ 80% ์ ˆ๊ฐํ–ˆ์Šต๋‹ˆ๋‹ค.

์•„ํ‚คํ…์ฒ˜

  • ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜: Amazon EKS (Elastic Kubernetes Service)
  • ์ปดํ“จํŒ…: Cluster Autoscaler๊ฐ€ ๊ด€๋ฆฌํ•˜๋Š” EC2 ์ธ์Šคํ„ด์Šค (ํ˜ผํ•ฉ ์ธ์Šคํ„ด์Šค ์œ ํ˜•)
  • ๋ฒกํ„ฐ DB: ๋ถ„์‚ฐ ๋ชจ๋“œ๋กœ Helm ์ฐจํŠธ๋ฅผ ํ†ตํ•ด ๋ฐฐํฌ๋œ Milvus
  • ๊ฐ์ฒด ์Šคํ† ๋ฆฌ์ง€: ์„ธ๊ทธ๋จผํŠธ ํŒŒ์ผ, ์ธ๋ฑ์Šค ํŒŒ์ผ, ๋นˆ๋กœ๊ทธ ์˜๊ตฌ ์ €์žฅ์„ ์œ„ํ•œ Amazon S3
  • ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ: Milvus ์กฐ์ • ๋ฐ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ์œ„ํ•œ etcd ํด๋Ÿฌ์Šคํ„ฐ
  • ๋ฉ”์‹œ์ง€ ํ: Milvus ๋กœ๊ทธ ํŒŒ์ดํ”„๋ผ์ธ์„ ์œ„ํ•œ ๋ฉ”์‹œ์ง€ ์ŠคํŠธ๋ฆฌ๋ฐ
  • ๋ชจ๋‹ˆํ„ฐ๋ง: Milvus ๋ฉ”ํŠธ๋ฆญ ๋ฐ ์˜คํ† ์Šค์ผ€์ผ๋ง ์‹ ํ˜ธ๋ฅผ ์œ„ํ•œ Prometheus + Grafana

Kubernetes ์ƒ Milvus ๋ถ„์‚ฐ ์•„ํ‚คํ…์ฒ˜

์ปดํฌ๋„ŒํŠธ ๋ฐฐํฌ

Milvus๋Š” ์ „์šฉ ๋…ธ๋“œ ์œ ํ˜•์„ ๊ฐ€์ง„ ๋ถ„์‚ฐ ๋ชจ๋“œ๋กœ ์‹คํ–‰๋˜๋ฉฐ, ๊ฐ ๋…ธ๋“œ๋Š” ๋…๋ฆฝ์ ์ธ ์Šค์ผ€์ผ๋ง์ด ๊ฐ€๋Šฅํ•œ Kubernetes ์›Œํฌ๋กœ๋“œ๋กœ ๋ฐฐํฌ๋ฉ๋‹ˆ๋‹ค:

  • ํ”„๋ก์‹œ ๋…ธ๋“œ โ€” ํด๋ผ์ด์–ธํŠธ ์—ฐ๊ฒฐ ๋ฐ ์š”์ฒญ ๋ผ์šฐํŒ… ์ฒ˜๋ฆฌ
  • ์ฟผ๋ฆฌ ๋…ธ๋“œ โ€” ๋ฒกํ„ฐ ๊ฒ€์ƒ‰ ์‹คํ–‰ ๋ฐ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ๋ฉ”๋ชจ๋ฆฌ๋กœ ๋กœ๋“œ
  • ๋ฐ์ดํ„ฐ ๋…ธ๋“œ โ€” ์“ฐ๊ธฐ ๊ฒฝ๋กœ ์ฒ˜๋ฆฌ ๋ฐ ์„ธ๊ทธ๋จผํŠธ๋ฅผ S3๋กœ ํ”Œ๋Ÿฌ์‹œ
  • ์ธ๋ฑ์Šค ๋…ธ๋“œ โ€” ๋ฒกํ„ฐ ์ธ๋ฑ์Šค ๊ตฌ์ถ• ๋ฐ S3์— ์“ฐ๊ธฐ
  • ์ฝ”๋””๋„ค์ดํ„ฐ โ€” ํด๋Ÿฌ์Šคํ„ฐ ์กฐ์ • ๋ฐ ํƒ€์ž„์Šคํƒฌํ”„ ํ• ๋‹น
  • etcd โ€” ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ ์ €์žฅ ๋ฐ ์„œ๋น„์Šค ๋””์Šค์ปค๋ฒ„๋ฆฌ
  • ๋ฉ”์‹œ์ง€ ํ โ€” ๋กœ๊ทธ ์ŠคํŠธ๋ฆฌ๋ฐ ๋ฐ ์„ ํ–‰ ์“ฐ๊ธฐ ๋กœ๊ทธ

Horizontal Pod Autoscaling (HPA)

์ฟผ๋ฆฌ ๋…ธ๋“œ ์˜คํ† ์Šค์ผ€์ผ๋ง

์ฟผ๋ฆฌ ๋…ธ๋“œ๋Š” ์ฃผ์š” ์Šค์ผ€์ผ๋ง ๋Œ€์ƒ์ž…๋‹ˆ๋‹ค. ์ด๋“ค์€ ๋ฒกํ„ฐ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ๋ฉ”๋ชจ๋ฆฌ๋กœ ๋กœ๋“œํ•˜๊ณ  ๊ฒ€์ƒ‰์„ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์Šค์ผ€์ผ๋ง์€ CPU ํ™œ์šฉ๋ฅ , ๋ฉ”๋ชจ๋ฆฌ ํ™œ์šฉ๋ฅ , ์ฟผ๋ฆฌ ํ ๊นŠ์ด, P99 ์ฟผ๋ฆฌ ์ง€์—ฐ ์‹œ๊ฐ„ ๋“ฑ ์—ฌ๋Ÿฌ ๋ฉ”ํŠธ๋ฆญ์— ์˜ํ•ด ๊ตฌ๋™๋ฉ๋‹ˆ๋‹ค. HPA๋Š” ์ ์ ˆํ•œ ์ตœ์†Œ/์ตœ๋Œ€ ๋ณต์ œ๋ณธ, ์ŠคํŒŒ์ดํฌ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ๋น ๋ฅธ ์Šค์ผ€์ผ์—…, ํ”Œ๋ž˜ํ•‘์„ ํ”ผํ•˜๊ธฐ ์œ„ํ•œ ์ ์ง„์ ์ธ ์Šค์ผ€์ผ๋‹ค์šด์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.

์ธ๋ฑ์Šค ๋…ธ๋“œ ์˜คํ† ์Šค์ผ€์ผ๋ง

์ธ๋ฑ์Šค ๋…ธ๋“œ๋Š” ๋ณด๋ฅ˜ ์ค‘์ธ ์ธ๋ฑ์Šค ๋นŒ๋“œ ์ž‘์—…์— ๋”ฐ๋ผ ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค. ๋นŒ๋“œ ํ์— ๋ณด๋ฅ˜ ์ค‘์ธ ํ•ญ๋ชฉ์ด ์žˆ์„ ๋•Œ ์Šค์ผ€์ผ์—…ํ•˜๊ณ  ์œ ํœด ์ƒํƒœ์ผ ๋•Œ ์Šค์ผ€์ผ๋‹ค์šดํ•ฉ๋‹ˆ๋‹ค.

EC2 Cluster Autoscaler

์ธ์Šคํ„ด์Šค ์ „๋žต

  • ๋…ธ๋“œ ๊ทธ๋ฃน: ๋น„์šฉ ์ตœ์ ํ™”๋ฅผ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์ธ์Šคํ„ด์Šค ์œ ํ˜•์„ ๊ฐ€์ง„ ์—ฌ๋Ÿฌ ๋…ธ๋“œ ๊ทธ๋ฃน
  • ์ฟผ๋ฆฌ ์›Œํฌ๋กœ๋“œ: ์ธ๋ฉ”๋ชจ๋ฆฌ ๋ฒกํ„ฐ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์œ„ํ•œ ๋ฉ”๋ชจ๋ฆฌ ์ตœ์ ํ™” ์ธ์Šคํ„ด์Šค
  • ์ธ๋ฑ์Šค ์›Œํฌ๋กœ๋“œ: CPU ์ง‘์•ฝ์ ์ธ ์ธ๋ฑ์Šค ๊ตฌ์ถ•์„ ์œ„ํ•œ ์ปดํ“จํŒ… ์ตœ์ ํ™” ์ธ์Šคํ„ด์Šค
  • ์ŠคํŒŸ ์ธ์Šคํ„ด์Šค: ์ธ๋ฑ์Šค ๋…ธ๋“œ ๋ฐ ๋น„์ฃผ์š” ๋ฐ์ดํ„ฐ ๋…ธ๋“œ๋Š” ์ƒ๋‹นํ•œ ์ ˆ์•ฝ์„ ์œ„ํ•ด ์ŠคํŒŸ ์ธ์Šคํ„ด์Šค์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.
  • ์˜จ๋””๋งจ๋“œ: ์•ˆ์ •์„ฑ์„ ์œ„ํ•ด ์˜จ๋””๋งจ๋“œ ์ธ์Šคํ„ด์Šค์—์„œ ์‹คํ–‰๋˜๋Š” ์ฟผ๋ฆฌ ๋…ธ๋“œ ๋ฐ ์ฝ”๋””๋„ค์ดํ„ฐ

์Šค์ผ€์ผ๋ง ๋™์ž‘

HPA๊ฐ€ ์Šค์ผ€์ค„๋งํ•  ์ˆ˜ ์—†๋Š” ์ƒˆ Pod๋ฅผ ์ƒ์„ฑํ•˜๋ฉด Cluster Autoscaler๋Š” ์ ์ ˆํ•œ ๋…ธ๋“œ ๊ทธ๋ฃน์— ์ƒˆ EC2 ์ธ์Šคํ„ด์Šค๋ฅผ ํ”„๋กœ๋น„์ €๋‹ํ•ฉ๋‹ˆ๋‹ค. ์ƒˆ ์ฟผ๋ฆฌ ๋…ธ๋“œ๋Š” ํ• ๋‹น๋œ ์„ธ๊ทธ๋จผํŠธ๋ฅผ S3์—์„œ ๋ฉ”๋ชจ๋ฆฌ๋กœ ๋กœ๋“œํ•˜๊ณ  ์ฟผ๋ฆฌ๋ฅผ ์„œ๋น„์Šคํ•˜๊ธฐ ์‹œ์ž‘ํ•˜๋ฉฐ, ์ „์ฒด ์Šค์ผ€์ผ์—… ํ”„๋กœ์„ธ์Šค๋Š” ๋ช‡ ๋ถ„ ๋‚ด์— ์™„๋ฃŒ๋ฉ๋‹ˆ๋‹ค.

S3 ๊ธฐ๋ฐ˜ ์˜๊ตฌ ์Šคํ† ๋ฆฌ์ง€

๋ธ”๋ก ์Šคํ† ๋ฆฌ์ง€ ๋Œ€์‹  S3๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ด์œ 

S3๋Š” Milvus์šฉ ๋ธ”๋ก ์Šคํ† ๋ฆฌ์ง€์— ๋น„ํ•ด ์ƒ๋‹นํ•œ ์ด์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค:

  • ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์˜ ๊ฒฝ์šฐ ์Šคํ† ๋ฆฌ์ง€ ๋น„์šฉ ์•ฝ 80% ์ ˆ๊ฐ
  • ๋‚ด์žฅ๋œ ๋‹ค์ค‘ AZ ๋ณต์ œ๋กœ 11-๋‚˜์ธ ๋‚ด๊ตฌ์„ฑ
  • ์ˆ˜๋™ ๋ณผ๋ฅจ ํฌ๊ธฐ ์กฐ์ • ์—†์ด ๋ฌด์ œํ•œ ์Šค์ผ€์ผ๋ง
  • Pod ๋…๋ฆฝ์  โ€” Pod ๋˜๋Š” ๋…ธ๋“œ ๋ผ์ดํ”„์‚ฌ์ดํด๊ณผ ๊ด€๊ณ„์—†์ด ํ•ญ์ƒ ๋ฐ์ดํ„ฐ ์‚ฌ์šฉ ๊ฐ€๋Šฅ
  • AZ ์ข…์†์„ฑ ์—†์Œ โ€” ๋ชจ๋“  ๊ฐ€์šฉ ์˜์—ญ์—์„œ ๋ฐ์ดํ„ฐ ์ ‘๊ทผ ๊ฐ€๋Šฅ

S3๋ฅผ ์‚ฌ์šฉํ•œ ๋ฐ์ดํ„ฐ ํ๋ฆ„

  1. ์“ฐ๊ธฐ ๊ฒฝ๋กœ: ๋ฐ์ดํ„ฐ ๋…ธ๋“œ๋Š” ์‚ฝ์ž…์„ ๋ฉ”๋ชจ๋ฆฌ์— ๋ฒ„ํผ๋งํ•œ ๋‹ค์Œ, ๋ฐ€๋ด‰๋œ ์„ธ๊ทธ๋จผํŠธ๋ฅผ S3๋กœ ํ”Œ๋Ÿฌ์‹œํ•ฉ๋‹ˆ๋‹ค.
  2. ์ธ๋ฑ์Šค ๊ตฌ์ถ•: ์ธ๋ฑ์Šค ๋…ธ๋“œ๋Š” S3์—์„œ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ์ฝ๊ณ  ์ธ๋ฑ์Šค๋ฅผ ๊ตฌ์ถ•ํ•œ ๋‹ค์Œ ์ธ๋ฑ์Šค ํŒŒ์ผ์„ S3์— ๋‹ค์‹œ ์”๋‹ˆ๋‹ค.
  3. ์ฟผ๋ฆฌ ๊ฒฝ๋กœ: ์ฟผ๋ฆฌ ๋…ธ๋“œ๋Š” S3์—์„œ ์„ธ๊ทธ๋จผํŠธ์™€ ์ธ๋ฑ์Šค๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  ๋ฉ”๋ชจ๋ฆฌ์— ๋กœ๋“œํ•˜์—ฌ ์ฟผ๋ฆฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  4. ๋ณต๊ตฌ: Pod๊ฐ€ ๋‹ค์‹œ ์‹œ์ž‘๋  ๋•Œ, ์ฟผ๋ฆฌ ๋…ธ๋“œ๋Š” ํ• ๋‹น๋œ ์„ธ๊ทธ๋จผํŠธ๋ฅผ S3์—์„œ ๋‹ค์‹œ ๋‹ค์šด๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค (๋ฐ์ดํ„ฐ ์†์‹ค ์—†์Œ).

S3 ์„ฑ๋Šฅ ์ตœ์ ํ™”

  • ์„ธ๊ทธ๋จผํŠธ ํฌ๊ธฐ ํŠœ๋‹์€ S3 ์š”์ฒญ ๋น„์šฉ๊ณผ ๋ฐ์ดํ„ฐ ์‹ ์„ ๋„๋ฅผ ๊ท ํ˜• ์žˆ๊ฒŒ ๋งž์ถฅ๋‹ˆ๋‹ค.
  • NVMe ์ธ์Šคํ„ด์Šค ์Šคํ† ๋ฆฌ์ง€์˜ ๋กœ์ปฌ SSD ์บ์‹ฑ์€ ํ•ซ ์„ธ๊ทธ๋จผํŠธ์— ๋Œ€ํ•œ ๋ฐ˜๋ณต์ ์ธ S3 ์ฝ๊ธฐ๋ฅผ ๋ฐฉ์ง€ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ณ‘๋ ฌ ๋‹ค์šด๋กœ๋“œ๋Š” ๋น ๋ฅธ ์ฟผ๋ฆฌ ๋…ธ๋“œ ์‹œ์ž‘์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
  • ์ˆ˜๋ช… ์ฃผ๊ธฐ ์ •์ฑ…์€ ์˜ค๋ž˜๋œ ๋ฐ์ดํ„ฐ๋ฅผ ๋” ์ €๋ ดํ•œ ์Šคํ† ๋ฆฌ์ง€ ๊ณ„์ธต์œผ๋กœ ์•„์นด์ด๋น™ํ•ฉ๋‹ˆ๋‹ค.

๋ชจ๋‹ˆํ„ฐ๋ง ๋ฐ ๊ด€์ฐฐ ๊ฐ€๋Šฅ์„ฑ

๋ฐฐํฌ์—๋Š” Prometheus ๋ฐ Grafana๋ฅผ ํ†ตํ•œ ํฌ๊ด„์ ์ธ ๋ชจ๋‹ˆํ„ฐ๋ง์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค:

  • ์ฟผ๋ฆฌ ์„ฑ๋Šฅ โ€” ์ง€์—ฐ ์‹œ๊ฐ„ ๋ถ„ํฌ, QPS, ์บ์‹œ ์ ์ค‘๋ฅ 
  • ํด๋Ÿฌ์Šคํ„ฐ ๊ฐœ์š” โ€” ๋…ธ๋“œ ์ˆ˜, Pod ์ƒํƒœ, ๋ฆฌ์†Œ์Šค ํ™œ์šฉ๋ฅ 
  • ์Šคํ† ๋ฆฌ์ง€ ์ƒํƒœ โ€” S3 ์‚ฌ์šฉ๋Ÿ‰, ์„ธ๊ทธ๋จผํŠธ ์ˆ˜, ํ”Œ๋Ÿฌ์‹œ ์†๋„
  • ์˜คํ† ์Šค์ผ€์ผ๋ง ์ด๋ฒคํŠธ โ€” HPA ์ด๋ฒคํŠธ, ๋…ธ๋“œ ์Šค์ผ€์ผ๋ง, Pod ์Šค์ผ€์ค„๋ง ์ง€์—ฐ ์‹œ๊ฐ„
  • ๊ฒฝ๊ณ  โ€” ๋†’์€ ์ง€์—ฐ ์‹œ๊ฐ„, OOM ์œ„ํ—˜, ํ”Œ๋Ÿฌ์‹œ ์‹คํŒจ ๋ฐ ์šฉ๋Ÿ‰ ์ œํ•œ์— ๋Œ€ํ•œ ์ž๋™ ๊ฒฝ๊ณ 

์ฃผ์š” ํŠน์ง•

  1. ์ฟผ๋ฆฌ ๋…ธ๋“œ HPA โ€” CPU, ๋ฉ”๋ชจ๋ฆฌ, ์ง€์—ฐ ์‹œ๊ฐ„ ๋ฐ ํ ๊นŠ์ด์— ๊ธฐ๋ฐ˜ํ•œ ์ž๋™ ์Šค์ผ€์ผ๋ง
  2. EC2 Cluster Autoscaler โ€” ํ˜ผํ•ฉ ์ธ์Šคํ„ด์Šค ์œ ํ˜•์„ ์‚ฌ์šฉํ•œ ๋™์  ๋…ธ๋“œ ํ”„๋กœ๋น„์ €๋‹
  3. S3 ์˜๊ตฌ ์ €์žฅ โ€” 11-๋‚˜์ธ ๋‚ด๊ตฌ์„ฑ, ๋ธ”๋ก ์Šคํ† ๋ฆฌ์ง€๋ณด๋‹ค ์•ฝ 80% ์ €๋ ด, AZ ์žฅ์•  ์ƒ์กด ๊ฐ€๋Šฅ
  4. ์ŠคํŒŸ ์ธ์Šคํ„ด์Šค โ€” ์ƒ๋‹นํ•œ ์ปดํ“จํŒ… ์ ˆ์•ฝ์„ ์œ„ํ•œ ์ŠคํŒŸ ์ธ์Šคํ„ด์Šค ์ƒ์˜ ์ธ๋ฑ์Šค ๋ฐ ๋ฐ์ดํ„ฐ ๋…ธ๋“œ
  5. ๋กœ์ปฌ SSD ์บ์‹œ โ€” NVMe ์บ์‹ฑ์€ ํ•ซ ์„ธ๊ทธ๋จผํŠธ์— ๋Œ€ํ•œ ๋ฐ˜๋ณต์ ์ธ S3 ์ฝ๊ธฐ๋ฅผ ์ œ๊ฑฐํ•ฉ๋‹ˆ๋‹ค.
  6. ๋ฌด์ค‘๋‹จ ๋ณต๊ตฌ โ€” Pod ์žฌ์‹œ์ž‘ ์‹œ S3์—์„œ ์„ธ๊ทธ๋จผํŠธ๋ฅผ ๋‹ค์‹œ ๋กœ๋“œํ•˜์—ฌ ๋ฐ์ดํ„ฐ ์†์‹ค ์—†์Œ
  7. ๋‹ค์ค‘ AZ โ€” ์™„๋ฒฝํ•œ AZ ์žฅ์•  ํ—ˆ์šฉ์„ ์œ„ํ•œ S3 ์Šคํ† ๋ฆฌ์ง€ + ๋‹ค์ค‘ AZ ๋…ธ๋“œ ๊ทธ๋ฃน
  8. ๊ด€์ฐฐ ๊ฐ€๋Šฅ์„ฑ โ€” Milvus ํŠน์ • ๋ฉ”ํŠธ๋ฆญ ๋ฐ ์˜คํ† ์Šค์ผ€์ผ๋ง ๊ฐ€์‹œ์„ฑ์„ ์ œ๊ณตํ•˜๋Š” Prometheus + Grafana

๊ฒฐ๊ณผ

์Šคํ† ๋ฆฌ์ง€ ๋น„์šฉ: ๋ธ”๋ก ์Šคํ† ๋ฆฌ์ง€ ๊ธฐ๋ฐ˜ ๋ฐฐํฌ ๋Œ€๋น„ ์•ฝ 80% ์ ˆ๊ฐ
์ปดํ“จํŒ… ๋น„์šฉ: ์ŠคํŒŸ ์ธ์Šคํ„ด์Šค ๋ฐ ์ ์ • ๊ทœ๋ชจ ์˜คํ† ์Šค์ผ€์ผ๋ง์„ ํ†ตํ•ด ์•ฝ 40% ์ ˆ๊ฐ
์ฟผ๋ฆฌ ์ง€์—ฐ ์‹œ๊ฐ„: 10๋ฐฐ ๋กœ๋“œ ์ŠคํŒŒ์ดํฌ ๋ฐœ์ƒ ์‹œ์—๋„ P99๊ฐ€ 200ms ๋ฏธ๋งŒ ์œ ์ง€
๋ณต๊ตฌ ์‹œ๊ฐ„: Pod ์žฌ์‹œ์ž‘ ํ›„ 30-90์ดˆ ๋‚ด์— ์ฟผ๋ฆฌ ์„œ๋น„์Šค ๊ฐ€๋Šฅ (S3 ์„ธ๊ทธ๋จผํŠธ ์žฌ๋กœ๋“œ)

๊ธฐ์ˆ  ์Šคํƒ

MilvusAmazon EKSKubernetes HPACluster AutoscalerAmazon EC2Amazon S3etcdPrometheusGrafanaHelmNVMe Instance Storage

caseStudyDetail.more ์‚ฌ๋ก€ ์—ฐ๊ตฌ

๋” ๋งŽ์€ ๊ธฐ์ˆ  ๊ตฌํ˜„ ์‚ฌ๋ก€๋ฅผ ์‚ดํŽด๋ณด์„ธ์š”

AI Accounting

OCR ๋ฐ QuickBooks ์—ฐ๋™์„ ํ†ตํ•œ AI ๊ธฐ๋ฐ˜ ์†ก์žฅ ์ฒ˜๋ฆฌ

๋งค์›” ์ˆ˜๋ฐฑ ๊ฑด์˜ ๊ณต๊ธ‰์—…์ฒด ์†ก์žฅ์„ ์ฒ˜๋ฆฌํ•˜๋Š” ์ค‘๊ฒฌ ๊ธฐ์—…์€ AI/OCR์„ ์‚ฌ์šฉํ•˜์—ฌ ์†ก์žฅ ๋ฐ์ดํ„ฐ๋ฅผ ์ž๋™์œผ๋กœ ์ถ”์ถœํ•˜๊ณ  ์ด๋ฅผ QuickBooks์— ์ง์ ‘ ๋™๊ธฐํ™”ํ•˜์—ฌ ์žฅ๋ถ€ ์ •๋ฆฌ ๋ฐ ์ง€๊ธ‰ ์ถ”์ ์„ ํ•จ์œผ๋กœ์จ ์ˆ˜๋™ ๋ฐ์ดํ„ฐ ์ž…๋ ฅ์„ ์—†์• ์•ผ ํ–ˆ์Šต๋‹ˆ๋‹ค.

์‚ฌ๋ก€ ์—ฐ๊ตฌ ์ฝ๊ธฐ
Video Encoding

SCTE-35 ๋งˆ์ปค ํŒŒ์‹ฑ ๋ฐ ๋‹ค์ค‘ ํ”Œ๋žซํผ ํ”Œ๋ ˆ์ด์–ด ํ†ตํ•ฉ์„ ํ†ตํ•œ ํด๋ผ์ด์–ธํŠธ ์ธก ๊ด‘๊ณ  ์‚ฝ์ž…(CSAI)

ํ•œ ๋น„๋””์˜ค ์ŠคํŠธ๋ฆฌ๋ฐ ํ”Œ๋žซํผ์€ ์›น, ๋ชจ๋ฐ”์ผ ๋ฐ ์ปค๋„ฅํ‹ฐ๋“œ TV ์•ฑ ์ „๋ฐ˜์— ๊ฑธ์ณ Client-Side Ad Insertion (CSAI)์„ ๊ตฌํ˜„ํ•ด์•ผ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์„œ๋ฒ„ ์ธก ์‚ฝ์ž…์œผ๋กœ๋Š” ์ œ๊ณตํ•  ์ˆ˜ ์—†๋Š”, ํด๋ฆญ ๊ฐ€๋Šฅํ•œ ์˜ค๋ฒ„๋ ˆ์ด, ์ปดํŒจ๋‹ˆ์–ธ ๋ฐฐ๋„ˆ, ๊ฑด๋„ˆ๋›ฐ๊ธฐ ๋ฒ„ํŠผ ๋“ฑ ์™„์ „ํ•œ ๊ด‘๊ณ  ์ƒํ˜ธ์ž‘์šฉ ์ง€์›์„ ํ†ตํ•ด ๊ฐœ์ธํ™”๋œ ๊ธฐ๊ธฐ ์ˆ˜์ค€์˜ ๊ด‘๊ณ  ๊ฒฝํ—˜์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

์‚ฌ๋ก€ ์—ฐ๊ตฌ ์ฝ๊ธฐ

์ž์ฃผ ๋ฌป๋Š” ์งˆ๋ฌธ

MicrocosmWorks configured horizontal pod autoscaling with custom metrics from Milvus's built-in memory usage exporter, triggering scale-out events when any query node exceeds 75% memory utilization. Collection segments are automatically redistributed across new nodes using Milvus's segment manager, preventing any single node from becoming a bottleneck.

MicrocosmWorks selected S3-backed storage using MinIO as the object storage layer because it decouples storage from compute, allowing query nodes to scale independently without provisioning new EBS volumes. This architecture reduces storage costs by approximately 60% compared to gp3 EBS volumes while maintaining sub-100ms segment load times from S3.

MicrocosmWorks configured the deployment with replica sets for each Milvus component, including query nodes, index nodes, and data nodes, with pod disruption budgets ensuring minimum availability during rolling updates. Since all persistent data resides in S3, a failed node's replacement can immediately access all segments without data migration.

MicrocosmWorks found that r6i.2xlarge instances provide the optimal cost-to-performance ratio for Milvus query workloads, offering 64GB of memory for in-memory segment caching at a competitive spot price. For GPU-accelerated index building, g5.xlarge instances with NVIDIA A10G GPUs reduced index build times by 8x compared to CPU-only builds.

MicrocosmWorks delivers Kubernetes infrastructure projects at rates of $30-$50/hr, with a Milvus autoscaling deployment including Helm chart customization, HPA configuration, S3 integration, and monitoring setup typically requiring 150-250 hours. Ongoing managed support for cluster optimization and upgrades is available at the same hourly rates.

๋น„์ฆˆ๋‹ˆ์Šค ํ˜์‹ ์„ ์‹œ์ž‘ํ•  ์ค€๋น„๊ฐ€ ๋˜์…จ๋‚˜์š”?

๊ท€ํ•˜์˜ ๊ณผ์ œ์— ์œ ์‚ฌํ•œ ์†”๋ฃจ์…˜์„ ์ ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ๋…ผ์˜ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๋ฌธ์˜ํ•˜๊ธฐcaseStudyDetail.viewAllCaseStudies
๋‚ด๊ตฌ์„ฑ: ์—ฌ๋Ÿฌ ๋…ธ๋“œ ๊ต์ฒด ๋ฐ AZ ์žฅ์•  ์กฐ์น˜ ์ „๋ฐ˜์— ๊ฑธ์ณ ๋ฐ์ดํ„ฐ ์†์‹ค ์—†์Œ
ํ™•์žฅ์„ฑ: 2๊ฐœ์—์„œ 20๊ฐœ ์ฟผ๋ฆฌ ๋…ธ๋“œ๋กœ ์ž๋™ ํ™•์žฅ๋˜๋ฉฐ 5์ฒœ๋งŒ ๊ฐœ ์ด์ƒ์˜ ๋ฒกํ„ฐ ์ฒ˜๋ฆฌ
Web Scraping

AI ๊ธฐ๋ฐ˜ ๋ธ”๋กœ๊ทธ ์ฝ˜ํ…์ธ  ์Šคํฌ๋ž˜ํ•‘ ๋ฐ ์ƒ์„ฑ ํ”Œ๋žซํผ

ํ•œ ๋ฏธ๋””์–ด ํšŒ์‚ฌ๋Š” ๊ธฐ์กด ์›น ์ฝ˜ํ…์ธ ๋ฅผ ์Šคํฌ๋ž˜ํ•‘ํ•˜๊ณ  AI๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ถ„์„ํ•˜๋ฉฐ, ์ถ”์ถœ๋œ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ๋…์ฐฝ์ ์ด๊ณ  SEO์— ์ตœ์ ํ™”๋œ ๋ธ”๋กœ๊ทธ ๊ฒŒ์‹œ๋ฌผ์„ ์ƒ์„ฑํ•˜์—ฌ ๋ธ”๋กœ๊ทธ ์ฝ˜ํ…์ธ  ์ œ์ž‘์„ ์ž๋™ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ์ง€๋Šฅํ˜• ์ฝ˜ํ…์ธ  ํ”Œ๋žซํผ์„ ํ•„์š”๋กœ ํ–ˆ์Šต๋‹ˆ๋‹ค.

์‚ฌ๋ก€ ์—ฐ๊ตฌ ์ฝ๊ธฐ