MicrocosmWorksІнновації та архітектура цифрового космосу
Про насКонтакт
MicrocosmWorksІнновації та архітектура цифрового космосу

Надаємо IT-рішення, які мають значення. Ми захоплені технологіями, безпекою та допомогою бізнесу зростати завдяки надійній, інноваційній IT-інфраструктурі.

[email protected]
+91 7011868196
New Delhi, India

Центр зростання AI

AI HubІнновації для стартапівПрискорювач для підприємств

Рішення

Всі рішенняДодатки для здоров'я та фітнесуAI відео платформаРозробка AI агентів

Ресурси

ІнсайтиГалузеві ПосібникиШаблони ВикористанняАрхітектурні ШаблониКейси

Компанія

Про НасКонтактНаша Робота

Послуги

Цифровий КонсалтингХмарна ІнфраструктураРозробка SaaSРозробка AIВідео Технології
Розробка ERPНалаштування ZohoРозробка OdooІнтеграція SalesforceРозробка Користувацьких CRM
Інтеграція QuickBooksРішення IoTРозробка Блокчейну
Консалтинг з КібербезпекиІТ Підтримка - L3

© 2026 MicrocosmWorks. Усі права захищено.

Політика КонфіденційностіУмови Обслуговування
Назад до Кейсів
Document IntelligenceОпубліковано June 22, 2026 · Оновлено June 22, 2026

Аналіз електронних таблиць та документів за допомогою AI з багатоагентною оркестрацією та перехресним посиланням між документами

Команді корпоративних даних потрібно було аналізувати, запитувати та редагувати великі колекції електронних таблиць та документів (Excel, CSV, Google Sheets, PDFs, Word docs) за допомогою природної мови — з можливістю перехресного посилання на дані між кількома файлами та виконання багатоетапних аналітичних робочих процесів без ручної підготовки даних.

Обговоріть Ваш Проєкт
spreadsheet-docs-analysis-multi-agent.webp
Document Intelligence
Domain
15
Technologies
6
Key Results
Delivered
Status

Виклик

Робота з бізнес-документами у великих масштабах була пов'язана з труднощами:

  • Розрізнені дані — Критична інформація була розкидана по десятках електронних таблиць, PDFs та документів Word без можливості робити запити по ним
  • Ручне перехресне посилання — Порівняння прейскуранта постачальника (Excel) з умовами контракту (PDF) та історією рахунків-фактур (CSV) вимагало годин ручного пошуку
  • Обмеження формул — Складні аналітичні питання не могли бути вирішені лише за допомогою формул електронних таблиць
  • Обмеження контекстного вікна — Великі електронні таблиці (50 000+ рядків) перевищували контекстні вікна LLM, що призводило до збою наївних підходів
  • Відсутність можливостей редагування — Існуючі інструменти AI могли аналізувати документи, але не могли записувати зміни назад у вихідні файли
  • Багатоетапне міркування — Питання, що вимагають послідовного аналізу кількох документів, потребували оркестрованих багатоетапних робочих процесів

Наше Рішення

Ми створили багатоагентну платформу інтелектуального аналізу документів на базі AI з вибіркою на основі векторної бази даних для великих документів, спеціалізованими агентами для різних типів документів, оркестратором для міждокументного міркування та можливостями зворотного запису для редагування електронних таблиць.

Архітектура

  • Оркестратор: Агент-оркестратор AI, що координує багатоетапні робочі процеси між спеціалізованими агентами
  • Агент електронних таблиць: Обробляє аналіз Excel/CSV/Google Sheets, генерацію формул та редагування комірок
  • Агент документів: Обробляє читання, вилучення та узагальнення документів PDF/Word
  • Агент перехресних посилань: Виконує об'єднання, порівняння та узгодження між типами документів
  • Векторна база даних: Milvus для семантичного індексування фрагментів документів та рядків електронних таблиць
  • Шар LLM: Багатомодельний підхід з викликом функцій
  • Бекенд: Python/FastAPI для обробки документів та оркестрації агентів
  • Фронтенд: React дашборд із завантаженням файлів, інтерфейсом чату та попереднім переглядом електронних таблиць у реальному часі
  • Сховище: S3 для оригінальних файлів, PostgreSQL для метаданих та відстеження завдань

Багатоагентна архітектура

Ролі агентів

1. Агент-оркестратор

Центральний координатор, який отримує запити користувачів, декомпозує їх на підзавдання та делегує спеціалізованим агентам. Він аналізує наміри користувача, створює плани виконання, керує потоком даних між агентами, агрегує результати та обробляє відновлення після помилок.

2. Агент електронних таблиць

Спеціалізується на операціях з табличними даними, включаючи розуміння схеми, переклад природної мови в запит, агрегації та фільтрацію, генерацію формул, редагування комірок та заповнення стовпців, пропозиції щодо діаграм та валідацію даних/виявлення аномалій.

3. Агент документів

Спеціалізується на неструктурованих та напівструктурованих документах, включаючи OCR та вилучення тексту з урахуванням макета, ідентифікацію розділів, вилучення пар ключ-значення з контрактів, узагальнення, семантичний пошук пунктів та вилучення таблиць з PDF/Word документів.

4. Агент перехресних посилань

Спеціалізується на міркуваннях між кількома документами, включаючи зіставлення сутностей між документами, узгодження даних та виявлення розбіжностей, аналіз часових шкал, вирішення залежностей для конфліктних даних та операції з'єднання, подібні до SQL, між типами документів.

Шар векторної бази даних

Чому векторна БД для документів

Великі документи та електронні таблиці не можуть поміститися в одне контекстне вікно LLM. Векторна база даних дозволяє виконувати семантичний пошук по мільйонах рядків та фрагментів документів, отримання лише відповідних частин за запитом, міждокументне зв'язування сутностей за допомогою подібності вбудовувань та постійне індексування, яке не потребує повторної обробки при кожному запиті.

Стратегія індексування

Індексування електронних таблиць:

Кожен рядок перетворюється на представлення природною мовою шляхом конкатенації значень ключових стовпців, потім вбудовується та зберігається з посиланнями на оригінальний файл, аркуш та індекс рядка для операцій зворотного запису.

Індексування документів:

Документи вилучаються з урахуванням макета, розбиваються на семантичні сегменти з перекриттям, вбудовуються та зберігаються з посиланнями на вихідний файл, розділ та номер сторінки.

Індекс сутностей між документами:

Окремий індекс пов'язує сутності (постачальники, продукти, люди, номери рахунків-фактур) між документами, дозволяючи запитам перехресних посилань швидко знаходити всі згадки сутності незалежно від вихідного файлу.

Конвеєр вибірки

Коли користувач ставить міждокументне питання, оркестратор визначає, які документи та агенти потрібні, виконує векторний пошук для знаходження відповідних даних у всіх джерелах, делегує спеціалізованим агентам для обробки та агрегує результати в зв'язну відповідь.

Двигун оркестрації

Декомпозиція запитів

Оркестратор розбиває складні запити на багатоетапні плани виконання. Наприклад, питання на кшталт "Знайти постачальників з простроченими поставками, перевірити пункти контракту про штрафні санкції та розрахувати можливі штрафи" буде декомпозовано на послідовні кроки: запит даних про доставку через Агента електронних таблиць, пошук контрактів через Агента документів та об'єднання результатів через Агента перехресних посилань.

Комунікація агентів

  • Агенти спілкуються через структуровані повідомлення з типізованими корисними навантаженнями
  • Оркестратор підтримує контекст виконання з проміжними результатами
  • Невдалі кроки запускають стратегії повторної спроби або відкату
  • Часткові результати повертаються, якщо деякі кроки виконані, а інші — ні

Редагування електронних таблиць та зворотний запис

Можливості редагування

Платформа підтримує оновлення комірок, заповнення стовпців, вставлення рядків, умовне форматування, створення нових аркушів та впровадження формул — все це пропонується агентами AI та застосовується за згодою користувача.

Конвеєр зворотного запису

  1. Агент визначає операцію редагування (які комірки, які значення)
  2. Користувачеві показується попередній перегляд редагування з виділенням відмінностей (старі проти нових значень)
  3. Користувач затверджує або змінює запропоновані зміни
  4. Бекенд застосовує зміни до файлу, використовуючи відповідні бібліотеки для кожного формату
  5. Змінений файл зберігається як нова версія з журналом аудиту редагування
  6. Векторний індекс оновлюється для змінених рядків

Контроль версій

  • Кожне редагування створює нову версію файлу (оригінал зберігається)
  • Журнал відмінностей показує, що саме змінилося, коли і чому
  • Відкат до будь-якої попередньої версії одним кліком
  • Атрибуція редагування: який агент або користувач зробив кожну зміну

Конвеєр обробки нових документів

Потік завантаження файлів

  1. Користувач завантажує файли (перетягуванням або через API)
  2. Тип файлу виявляється та направляється відповідному процесору
  3. Електронні таблиці: Розбираються, схема виводиться, рядки вбудовуються та індексуються
  4. PDFs: OCR (якщо відскановано) → вилучення макета → розділення на фрагменти → вбудовування → індексування
  5. Word Docs: Вилучення тексту → парсинг розділів → розділення на фрагменти → вбудовування → індексування
  6. Вилучення сутностей: NER ідентифікує людей, організації, дати, суми в усіх документах
  7. Міждокументне зв'язування: Індекс сутностей оновлюється новими згадками
  8. Метадані файлів зберігаються в PostgreSQL, вбудовування у векторній БД, оригінали в S3

Підтримувані формати

Платформа підтримує Excel, CSV та Google Sheets (з повним зворотним записом), нативні та відскановані PDFs (лише для читання), а також Word docs та Google Docs (з обмеженим зворотним записом).

Ключові особливості

  1. Багатоагентна архітектура — Спеціалізовані агенти для електронних таблиць, документів та перехресних посилань
  2. Оркестратор AI — Декомпозує складні запити на багатоетапні плани виконання
  3. Перехресне посилання між документами — Зв'язування сутностей та узгодження даних між типами файлів
  4. Вибірка на основі векторів — Семантичний пошук обробляє набори даних за межами контекстних обмежень LLM
  5. Зворотний запис електронних таблиць — AI редагує комірки, заповнює стовпці та впроваджує формули за згодою користувача
  6. Підтримка великих наборів даних — Електронні таблиці з 50 000+ рядками індексуються та доступні для запитів за допомогою векторного пошуку
  7. Контроль версій — Кожне редагування версіонується з журналом відмінностей та можливістю відкату
  8. Запити природною мовою — Ставте складні аналітичні питання простою англійською мовою
  9. Підтримка багатьох форматів — Excel, CSV, Google Sheets, PDF, Word, Google Docs
  10. Попередній перегляд змін — Попередній перегляд із виділенням відмінностей перед застосуванням будь-яких змін

Результати

Швидкість запитів: Відповіді на міждокументні питання за 10-30 секунд проти годин ручного пошуку
Масштаб даних: Оброблені 500+ документів та електронних таблиць із загальною кількістю 2М+ проіндексованих рядків
Точність редагування: Запропоновані AI зміни в електронних таблицях приймалися без змін у 85% випадків
Перехресне посилання: Зіставлення сутностей пов'язало дані між документами з точністю 92%
Точність вибірки: Векторний пошук повертав релевантні фрагменти в топ-5 результатів у 94% випадків
Економія часу: Скорочення робочих процесів аналізу кількох документів з годин до хвилин

Технологічний Стек

PythonFastAPILLM (GPT-4oClaude)MilvusOpenAI EmbeddingsLangChainLangGraphReactPostgreSQLS3Job QueueRedisOCRDocument Processing Libraries

caseStudyDetail.more Кейси

Ознайомтесь з іншими нашими технічними впровадженнями

Document Intelligence

Система RAG для документів з локальним зберіганням, гібридним пошуком та підтримкою різних форматів

Команда, що займається розробкою інструментів для розробників, потребувала повністю локальної, конфіденційної системи інтелектуального аналізу документів, яка могла б обробляти кілька форматів файлів, створювати бази знань, що підлягають пошуку, та відповідати на запити природною мовою за допомогою Retrieval-Augmented Generation — без відправлення будь-яких даних до зовнішніх API.

Читати Кейс
AI Accounting

Обробка рахунків-фактур за допомогою AI, OCR та інтеграції з QuickBooks

Середній бізнес, який щомісяця обробляє сотні рахунків-фактур від постачальників, потребував усунення ручного введення даних шляхом автоматичного вилучення даних рахунків-фактур за допомогою AI/OCR та їх прямої синхронізації з QuickBooks для ведення бухгалтерського обліку та відстеження платежів.

Читати Кейс
Video Encoding

Вставка реклами на стороні клієнта (CSAI) з парсингом маркерів SCTE-35 та інтеграцією багатоплатформного плеєра

Платформа потокового відео потребувала впровадження вставки реклами на стороні клієнта (CSAI) для веб-, мобільних програм та програм для підключених телевізорів — що забезпечує персоналізований рекламний досвід на рівні пристрою з повною підтримкою взаємодії з рекламою (натискні оверлеї, супутні банери, кнопки пропуску), який не може забезпечити вставка на стороні сервера.

Читати Кейс

Часті запитання

MicrocosmWorks розробила багатоагентну архітектуру, де спеціалізовані агенти обробляють різні аспекти аналізу документів, такі як агент з вилучення таблиць для електронних таблиць, агент з узагальнення тексту для наративних документів та агент перехресних посилань, який ідентифікує зв'язки між точками даних у кількох файлах. Такий розподіл праці дає точніші результати, ніж один монолітний виклик LLM, оскільки кожен агент працює у сфокусованому контекстному вікні та застосовує доменні стратегії підказок.

Так, MicrocosmWorks розробила механізм аналізу електронних таблиць, що розв'язує залежності формул, розгортає підсумки зведених таблиць та відстежує посилання між аркушами перед передачею структурованих даних агентам аналізу. Система перетворює складні конструкції Excel на ущільнені представлення даних, з якими LLM можуть ефективно працювати, та зберігає реляційний контекст між аркушами, щоб AI міг відповідати на питання, такі як 'який відділ перевищив свій бюджет за Q3', що вимагають об'єднання даних з кількох вкладок.

MicrocosmWorks реалізувала конвеєр зв'язування сутностей, який витягує іменовані сутності, числові ідентифікатори та посилання на дати з усіх завантажених документів, а потім будує граф знань, що з'єднує пов'язані згадки між файлами. Коли користувач ставить запитання, агент перехресних посилань обходить цей граф, щоб витягти релевантні дані з кількох вихідних документів, надаючи відповіді, які синтезують інформацію способами, що зайняли б у людського аналітика години ручної перевірки.

MicrocosmWorks розробила систему для обробки пакетів документів до 500 файлів за одну сесію аналізу, з індивідуальними розмірами файлів до 100MB для електронних таблиць та 50MB для PDF-файлів. Великі документи автоматично розділяються на фрагменти та обробляються паралельно кількома екземплярами агентів, а оркестратор підтримує цілісне уявлення про весь набір документів шляхом агрегування вихідних даних агентів в єдине представлення знань.

MicrocosmWorks розробляє платформи для багатоагентного аналізу документів за ціною $30-$50/год, при цьому готова до виробництва система зазвичай потребує 3-5 місяців розробки, включаючи парсинг документів, оркестрацію агентів, виявлення перехресних посилань та користувацький інтерфейс запитів. Вартість одного запиту у виробничому середовищі залежить від обсягу документів та використання токенів LLM, але багатоагентні архітектури фактично знижують витрати на LLM, направляючи лише релевантний контекст кожному агенту, замість того, щоб вкладати цілі набори документів в один промпт.

Готові Трансформувати Свій Бізнес?

Давайте обговоримо, як ми можемо застосувати подібні рішення для ваших завдань.

Зв'язатися з НамиcaseStudyDetail.viewAllCaseStudies