Context Engineering

Стратегії управління контекстом AI-агента: пам'ять, стан, оптимізація та best practices

context engineeringконтекстRAGпромптоптимізація

Context Engineering -- це мистецтво надання LLM саме тієї інформації, яка необхідна для виконання наступного кроку, у межах обмеженого вікна моделі.

Два елементи

Елемент	Опис
Управління пам'яттю	Збереження контексту між кроками
Управління станом	Дозволяє агенту пам'ятати, де він знаходиться у процесі виконання складної задачі

⚠️Увага

Сміття на вході = Сміття на виході. Завжди точно знайте, що саме зараз знаходиться у контексті.

Контекст -- це короткострокова пам'ять агента, аналогічно RAM комп'ютера. Включає:

System prompt -- системний промпт
Історія діалогу -- попередні повідомлення
Визначення інструментів -- Tools, Skills, Subagents, MCP тощо
Зовнішні знання та файли -- RAG, результати пошуку, вміст файлів, логи помилок

Відсутність пам'яті: LLM за своєю природою є stateless
Обмеженість вікна та зростання витрат: подвоєння контексту збільшує обсяг обчислень учетверо
"Гниття контексту" (Context Rot) та ефект "Lost in the middle"
Запобігання галюцинаціям та плутанині
Деградація: чим більший обсяг контексту, тим нижча точність відповідей моделі

Спосіб	Суть	Обмеження	Сценарії
In-context Learning	Передача інформації безпосередньо у промпт	Обмежений контекстним вікном	Для разових задач
RAG	Зберігання документів у векторній базі, динамічне витягування	Потрібна інфраструктура	Для великих баз, що часто оновлюються
Fine-tuning / LoRA	Донавчання моделі на приватних даних	Дорого та довго	Специфічна термінологія при стабільних даних

Метод	Технологія	Плюси	Мінуси
Синтаксичний	LSP та AST	Низьке споживання ресурсів	Перестає працювати при помилках коду
Семантичний	IDE будує повний граф коду	Аналізує код з помилками	Високі витрати на індексацію
RAG по коду	Embeddings	Стабільна робота з неповним кодом	Потребує GPU або Cloud
Динамічне виявлення	grep, tail, read_range	Швидкий доступ	Обмежене розуміння структури
Feedback Loop	Тести, лінтери, логи	Самокорекція	Потребує налаштування

Складання чіткого плану роботи -- визначте послідовність дій заздалегідь
Сумаризація та очищення -- видаляйте старі повідомлення, використовуйте окремі сесії
Збереження проміжних думок -- у файли, бази даних або довгострокову пам'ять (Memory Bank)
Підтягування лише релевантних інструкцій -- використовуйте Skills
Розділення контексту -- між кількома вузькоспеціалізованими агентами

💡Порада

Проєктуйте архітектуру пам'яті ДО написання промптів. Глибоке планування до початку виконання роботи.