Що таке LLM?
Розуміння великих мовних моделей — основа AI-Driven Development
⏱ ~30 хвилин
Що таке велика мовна модель?
LLM (Large Language Model) — це нейронна мережа, натренована на величезних обсягах тексту. Вона вміє генерувати текст, відповідати на запитання, писати код та виконувати багато інших завдань.
Як це працює?
Модель отримує промпт (запит) і генерує відповідь, передбачаючи наступне слово на основі контексту. Основні етапи:
- Токенізація — текст розбивається на токени (частини слів)
- Обробка — модель аналізує всі токени через шари нейронної мережі
- Генерація — модель послідовно генерує токени відповіді
Популярні моделі
| Модель | Компанія | Особливості |
|---|---|---|
| GPT-4o | OpenAI | Мультимодальна, широкі можливості |
| Claude | Anthropic | Сильний в коді, великий контекст |
| Gemini | Інтеграція з Google сервісами | |
| Llama | Meta | Відкрита модель, можна запускати локально |
Ключові поняття
Контекстне вікно
Це максимальна кількість токенів, яку модель може обробити за один запит. Наприклад:
- GPT-4o: 128K токенів
- Claude: до 1M токенів
- Llama 3: 128K токенів
Температура
Параметр, що контролює випадковість відповіді:
- 0 — детерміновані, передбачувані відповіді
- 0.5 — збалансований варіант
- 1 — більш креативні, різноманітні відповіді
📝 Перевір себе
Що таке LLM?
Спробуйте самі
🧪 Практика
Напишіть свій перший промпт
Спробуйте написати промпт, який попросить LLM пояснити складну концепцію простими словами.
text
Підсумок
- LLM — це нейронна мережа для роботи з текстом
- Модель генерує відповідь токен за токеном
- Контекстне вікно обмежує обсяг вхідних даних
- Температура впливає на креативність відповіді