ืืขื ืง ื-LLM ืฉืื ืืืฉื ืื ืชืื ืื ืฉืื ืืื ืฆืืจื ื-fine-tuning. RAG ืืืฉืจ ืขื ืืคืขืจ ืืื ืืืืื ืฉืคื ืืืืืื ืืืืข ืกืคืฆืืคื ืืชืืื.

ืืจืฆืื ื ืืื ืืช ืขืืืจ AI ืฉืขืื ื ืขื ืฉืืืืช ืื ืืืขืืช ืืืกืืื ืืืจืืื ืฉืื โ ืืืืื, ืืืื ืืืช, ืืืืจื ืืืข, ืชืืขืื ืืืฆืจ, ืจืฉืืืืช ืจืคืืืืืช. ืืืฆืืข fine-tuning ื-LLM ืขื ืื ืชืื ืื ืฉืื ืืงืจ, ืืืื ืืืืฆืจ ืืืื ืงืคืื ืื ืงืืืช ืืืืืื. ืืชื ืืงืืง ืืืจืืืืงืืืจื ืฉืื ื-LLM ืืืื ืืืฉืช ืืืืืข ืขืืื ื ืืกืคืฆืืคื ืืชืืื ืืืื ืฉืืืืชื, ืืฆืื ืืช ืืงืืจืืชืื, ืืืืืื ืข ื'ืืืืืช' ืขืืืืืช ืฉืืื ื ื ืืฆืืืช ืืืกืืืื ืฉืื. RAG (Retrieval-Augmented Generation) ืืื ืืืจื ืืืืืข ืืฉื.
Explore more design patterns and system architectures
ืืืจืืืืื ืฉืื ื ืืืืืื ืืขืืืจ ืื ืืขืฆื ืืืื ืืช ืืขืจืืืช ืชืื ืฉืืืืฉ ืืืคืืก ืื ืืืจืืฉืืช ืืกืคืฆืืคืืืช ืฉืื.
ืฆืจื ืงืฉืจRAG ืืฉืคืจ ืืช ืืฆืืจืช ื-LLM ืขื ืืงืฉืจ ืืืืืืจ ืืืืืจ ืืืข. ืืืื ืฉืืืืชื, ืืืขืจืืช ืืืืจื ืืช ืฉืืืช ืืืฉืชืืฉ ื-embedding, ืืืคืฉืช ื-vector database ืืืจ document chunks ืืืืื ืกืื ืืืช, ืืืืืืช ืืช ื-chunks ืืจืืืื ืืืื ืืืืชืจ ืืืงืฉืจ ื-LLM prompt. ืื ืืืกืก ืืช ืชืืืืช ืืืืื ืืืกืืืื ืืืืชืืื, ืืืคืฉืจ ืฆืืืื ืืงืืจืืช, ืืฉืืืจ ืขื ืืืืจ ืืืืข ื ืืชื ืืขืืืื ืืื ืืืืื ืืืืฉ. RAG pipeline ืืกืืืืช ืืืฆืืจ ืืืคื ืืืื ืกื (parsing, chunking, embedding), ืืืืืจ (vector search, reranking, hybrid search), ืืืฆืืจื (prompt construction, streaming, guardrails).
ืืืจืืืืงืืืจื ืฉื ื pipelines. ื-ingestion pipeline ืืขืื ืืกืืืื ืืืืฆืขืืช parsing (ืืืืืฅ PDF, DOCX, HTML), chunking (ืกืื ืื ืื ืืืืื ืงืืืข ืขื ืืคืืคื), embedding (ืืืืฆืขืืช embedding model), ืืืืกืื (vector database + document store). ื-query pipeline ืืงืื ืฉืืืช ืืฉืชืืฉ, ืืืืฆืจ query embedding, ืืืืืจ candidate chunks ื-vector database, ืืืจื ืืืชื ืืืืฉ ืืคื ืจืืืื ืืืืช, ืืื ื prompt ืขื ื-chunks ืืืืืืืื ืืืงืฉืจ, ืืืืจืื ืืช ืชืืืืช ื-LLM ืขื ืฆืืืืื ืืงืืจืืช.
text-embedding-3-large, Cohere embed-v4, ืื ืืืืคืืช ืงืื ืคืชืื (BGE, E5). ืขืืืื ืืฆืืื ืืืื ืกื, ืขืืืื ืฉืืืืชื ืืืืื ืืืืคืืฉ| ืฉืืื | ืืื ืืืืืืืช |
|---|---|
| ื ืืชืื ืืกืืืื (Document Parsing) | Unstructured, Apache Tika, LlamaParse, Docling, custom OCR (Tesseract, AWS Textract) |
| Embedding | OpenAI text-embedding-3-large, Cohere embed-v4, BGE-M3, E5-large-v2 |
| Vector Database | Milvus, Pinecone, Qdrant, Weaviate, pgvector (for small-scale) |
| ืืืคืืฉ ืืืืืช ืืคืชื (Keyword Search) | Elasticsearch, OpenSearch, PostgreSQL full-text search |
| Reranking | Cohere Rerank, BGE Reranker, ColBERT v2, FlashRank |
| LLM | Claude (via AI Gateway), GPT-4, Gemini โ ืืื ืืกืื ืืกืคืง ืืืืฆืขืืช AI SDK |
| ืืืจืงืกืืจืฆืื (Orchestration) | LangChain, LlamaIndex, ืื custom pipeline (ืืขืืคื ืฉื MW ืืกืืืืช ืืืฆืืจ) |
| ืืฉืชืืฉ ืืืฉืจ | ืืืื ืข ืืืฉืจ |
|---|---|
| ืืฉืชืืฉืื ืืงืืงืื ืืชืฉืืืืช ืืืืืกืกืืช ืขื ืืกืืืื ืกืคืฆืืคืืื ืฉื ืืืจืืื ืฉืื | ืืืืจ ืืืืข ืืื ืคืืืช ื-50 ืขืืืืื โ ืคืฉืื ืืื ืก ืืืชื ื-system prompt |
| ืืกืืืื ืืชืขืืื ืื ืืขืืชืื ืงืจืืืืช ืื-AI ืืงืืง ืืืืืข ืขืืื ื | ืืชื ืฆืจืื ืฉืืืืื ืืืื ืืืืื ืืช/ืืชื ืืืืช ืืืฉื, ืื ืืืฉ ืืขืืืืืช ืืืฉืืช (ืืฆืข fine-tune ืืืงืื) |
| ืฆืืืื ืืงืืจืืช ืืืืืืช ืืืงืืจืช ืื ืืจืืฉืืช (ืืฉืคืื, ืฆืืืช, ืืจืืืืช) | ืืฉืืืืช ืื ืฉืืืชืืืช ืืืื ืืืื ื ืืืจืฉืืช ืืืกืืก ืขืืืืชื |
| ืงืืืฆืืช ืืฉืชืืฉืื ืืจืืืืช ืืงืืงืืช ืืืืฉื ืืชืช-ืงืืืฆืืช ืืกืืืื ืฉืื ืืช (RAG ืืกืื ื ืืจืฉืืืช) | ืืชื ืืื ื ืืื ืืชืืื ืืฆืืจืชืืช ืฉืื ืืืืง ืขืืืืชื ืืื ื ืืืืจื |
MW ืืื ื RAG pipelines ืืืืืืช ืืืืืืจ ืืืคื ืืืฅ โ ืื ื ืืืืืื ืืช ืืืืง ืืืืืืจ ืืคื ื ื ืืืขื ื-LLM prompt. ืืขืจืืช RAG ืขื ืืืืืจ ืืื ืื ื ื-LLM ืืขืืื ืืืืฆืจืช ืชืฉืืืืช ืฉืืืืืช ืฉื ืฉืืขืืช ืืืืืืช. ื-pipeline ืืกืื ืืจืื ืฉืื ื ืืืื ืืื ืืขืจืืช ืืืืืจ: ืงืืืฆื ืฉื ืฉืืืืชืืช ืืืืงื ืขื ืืกืืืื ืจืืืื ืืืื ืืืืขืื, ืื ืืืืื ืืคื MRR@5 ื-NDCG@10. ืื ื ืืืฆืขืื ืืืืจืฆืืืช ืขื chunking, embedding model ื-reranking ืขื ืฉืืืื ืืืืืืจ ืืืืขืื ืืกืคื ืืืขื ืืคื ื ืืืคืืืืืืฆืื ืฉื ืืฆืืจื. ืื ืื ื ืืขืจืืืช RAG ืืกืงืืจืช ืืกืืืื ืืฉืคืืืื, ืืืืจื ืืืข ืืชืืื ืืืจืืืืช ืืชืืืืช ืืงืืืืช ืจื-ืืฉืื ืืช โ ืืืืงื ืืืฉืืชืฃ ืืื ืฉืืืืืช ืืืืืืจ ืืืืื 80% ืืืืืืช ืืชืฉืืื.
ืืืคืืฉ ืืืืขืืช ืงื ืขืืืจ 10K ืืงืืืจืื. ืขืืืจ 100M ืืงืืืจืื ืขื P99 ืื ืืื ื-100ms, ืื ืืขืืืช ืชืฉืชืืช โ ืืื ืืืขืื ืฉืืชืื ืืช ืืื ืคืืชืจืช.
MicrocosmWorks ืืืืฉืืช ืืืฉืื ืงืื ืคืืืงืืื ืืฆืื ืืจืืช RAG ืืืืฆืขืืช ืืืจืื ืกืืืืช ืืงืืจ, ืฉืงืืืช ืขืืื ืืืช ืืืืกืกืช ืืืชืืช ืืื, ืื ืืงืื ืืืืืื ืืืขืจืื ืขื ืืื ืื ืงืืข ืืืืืืจ ืชืืื ืืืขื ืชื. ืืืฉืจ ืืืืืืจืื ืงืืขืื ืกืืชืจืื, ืืฆืื ืืจ ืฉืื ื ืืฆืื ืืช ืืชืฉืืื ืืขืืช ืืกืืืืช ืืืืืื ืืืืชืจ ืชืื ืืฆืื ืฉืงืืคื ืฉื ืื ืืืกืืื ืืฆืืืืื ืืืงืืจืืช, ืื ืฉืืฉืชืืฉืื ืืืืื ืืงืื ืืืืืืช ืืืฉืืืืช. ืื ื ืืื ืื ืื ืืืืืืช ืืฉืื ืฉืืื ืืืืื ืชืืื ืืืืืื ืืกืื ืืืฉืืืื ืฉืืืืื, ืื ืฉืืฉืคืจ ืืช ืืืจืื ืืืืืืจ ืืืืจื ืืื.
MicrocosmWorks ืืฉืชืืฉืช ื-chunking ืืืืข-ืชืืื ืฉืืืืฉื ืืกืืจืืืืืช ืฉืื ืืช ืืืชืืกืก ืขื ืืื ื ืืืกืื โ ืคืืฆืื ืคืกืงืืืช ืกืื ืื ืืคืจืืื, chunking ืืจืืช ืฉืืจื ืื ืืจืืช ืืงืืข ืขืืืจ ืืืืืืช ืขื ืฉืืืืจ ืืงืฉืจ ืฉื ืืืืชืจืืช, ื-chunking ืืจืืช ืคืื ืงืฆืื ืขืืืจ ืงืื ืขื ืืฆืืจืืช import ืืฆืืจืคืืช. ืื ื ืืขืฉืืจืื ืื chunk ื-metadata ืืืืืืื ืืืชืจืช ืืกืื, ืืืจืจืืืืช ืืงืืขืื ืืกืื ืชืืื, ืื ืฉืฉืื ืืฉืืืคื ืืืื ืืืืฉื ื ืืงืื ืกืคืฆืืคื ืืกืื. ืืืฉื ืื ืขืืื ืืืืคื ืขืงืื ืืืืฆืืขืื ืขื chunking ื ืืืื ืืืืื ืงืืืข ื-25-40% ืืืืื ืจืืืื ืืืืช ืฉืืืคื ืืคืจืืืงืื ืืืงืืืืช ืฉืื ื.
MicrocosmWorks ืืื ื ืืขืจืืืช ืืขืจืื ืืืืืงืืช ืคืืืคืืืื ืื ืฉื RAG ืขื ืคื ื ืฉืืืฉื ืืืืื: ืจืืืื ืืืืช ืืืืืจ (ืืื ื-'ืฆ'ืื ืงืื' ืื ืืื ืื ื ืืฆืืื), ื ืืื ืืช ืืชืฉืืื (ืืื ืืชืฉืืื ืฉื ืืฆืจื ืืื ืืฉืงืคืช ืืช ืืชืืื ืฉืืืืืจ), ืืฉืืืืช ืืชืฉืืื (ืืื ืืื ืืชืืืืกืช ืืฉืืื ืืืืื). ืื ื ืืืฆืจืื ืืขืจืื ืืืืงื 'ืืืืื' ืขื ืืืืื ืชืืื ืืืืืืื ืฉืืืืชืืช ืขื ืชืฉืืืืช ืืืืขืืช, ืืงืจื ืงืฆื ืขืืื ืื, ืืฉืืืืช ืืืืจืฉืืช ืฉืืืื ืืืืข ืืืกืคืจ ืืกืืืื. ืืขืจืื ืื ืจืฆื ืืืืืืืืช ื-CI/CD ืื ืฉืื ืฉืื ืื ืืคืืืคืืืื ื ืืื ืื ืืื ืืืื ืืืืืช ืืกืืกืืื ืืคื ื ืืคืจืืกื.
MicrocosmWorks ืืืืจืช ืืืืจื ืืงืืืจืื ืืืชืืกืก ืขื ืงื ื ืืืืื ืฉืืื, ืชืื ืืช ืืฉืืืืชืืช ืืืจืืฉืืช ืืชืคืขืืโPinecone ืืคืฉืืืช ืื ืืืืช, Weaviate ืืืืคืืฉ ืืืืจืืื ืฉื ืืืืืช ืืคืชื-ืืงืืืจืื, pgvector ืืฆืืืชืื ืฉืืืจ ืืฉืงืืขื ื-PostgreSQL, ื-Qdrant ืืคืจืืกืืช ืขืฆืืืืืช ืขื ืชืคืืงื ืืืืื. ืืกืงืืืช ืืชืืช ื-10 ืืืืืื ืืงืืืจืื, ืจืื ืืืคืฉืจืืืืช ืืกืคืงืืช ืืื ืืืืืจ ืฉื ืคืืืช ื-100ms, ืื ืืืืืืื ืืืคืืื ืืืฉืืขืืชืืื ืืืืืช ืืืืืื ื ืืงืืืจืื ืฉืืื ืกืื ืืืื ืืงืก, ืงืืื ืืืืฆืื ืืืกืืจืืืืืช ืืืืงื ืืฉืืืื ืืืืื ืขืฆืืื. ืื ื ืืืฆืขืื ืื ืฆ'ืืจืง ืืืืื ืืืืืขื ืืืืืชืืื ืฉืืื ืืืชืื ืืืช ืืฉืืืืชืืช ืืื ืืืคืฉืจืืืืช ืฉื ืืืจื ืืงืฆืจื ืืืืื ืฉืื ืชืื ืื ืืืจืืืืงืืืจื ืฉืื ื.
MicrocosmWorks ืืื ื ืฆืื ืืจืืช ืืื ื ืืฆืืืจืื (incremental ingestion pipelines) ืฉืื ืืจืื ืืืืจื ืืกืืื ืืงืืจ (source document repositories) ืืฉืื ืืืื, ืืืฆืขืื re-chunk ื-re-embed ืจืง ืฉื ืืกืขืืคืื ืฉืืฉืชื ื, ืืืขืืื ืื ืืช ื-vector store ืืื ืฆืืจื ื-reindex ืืื. ืื ื ืืืืฉืืื document fingerprinting ืฉืืืื ืฉืื ืืืื ืืชืืื ืืจืืช ืืกืขืืฃ (section level), ืื ืฉืขืจืืื ืฉื ืคืกืงื ืืืช ืืื ื ืืคืขืืื ืขืืืื ืืืืฉ (reprocessing) ืฉื ืืกืื ืฉืื ืื 200 ืขืืืืื. ืขืืืจ ืืงืืืืช ืขื ืืจืืฉืืช real-time freshness, ืื ื ืืืกืืคืื ืฉืืืช live retrieval ืฉืืืฆืขืช ืฉืืืืชืืช ืืฉืืจืืช ืืืขืจืืช ืืืงืืจ ืขืืืจ ืืกืืืื ืฉืฉืื ื ืืืืจืื ื ืืืืืืช ืืช ืืชืืฆืืืช ืืืื ืขื vector search hits.