AI Wiki
Початківець/Урок 1
1/8

Що таке LLM?

Розуміння великих мовних моделей — основа AI-Driven Development

~30 хвилин

Що таке велика мовна модель?

LLM (Large Language Model) — це нейронна мережа, натренована на величезних обсягах тексту. Вона вміє генерувати текст, відповідати на запитання, писати код та виконувати багато інших завдань.

Як це працює?

Модель отримує промпт (запит) і генерує відповідь, передбачаючи наступне слово на основі контексту. Основні етапи:

  1. Токенізація — текст розбивається на токени (частини слів)
  2. Обробка — модель аналізує всі токени через шари нейронної мережі
  3. Генерація — модель послідовно генерує токени відповіді

Популярні моделі

МодельКомпаніяОсобливості
GPT-4oOpenAIМультимодальна, широкі можливості
ClaudeAnthropicСильний в коді, великий контекст
GeminiGoogleІнтеграція з Google сервісами
LlamaMetaВідкрита модель, можна запускати локально

Ключові поняття

Контекстне вікно

Це максимальна кількість токенів, яку модель може обробити за один запит. Наприклад:

  • GPT-4o: 128K токенів
  • Claude: до 1M токенів
  • Llama 3: 128K токенів

Температура

Параметр, що контролює випадковість відповіді:

  • 0 — детерміновані, передбачувані відповіді
  • 0.5 — збалансований варіант
  • 1 — більш креативні, різноманітні відповіді
📝 Перевір себе

Що таке LLM?

Спробуйте самі

🧪 Практика

Напишіть свій перший промпт

Спробуйте написати промпт, який попросить LLM пояснити складну концепцію простими словами.

text

Підсумок

  • LLM — це нейронна мережа для роботи з текстом
  • Модель генерує відповідь токен за токеном
  • Контекстне вікно обмежує обсяг вхідних даних
  • Температура впливає на креативність відповіді