Zero-shot обучение (обучение с нулевым количеством примеров) — это способность нейросети выполнять задачу, на которую она никогда не обучалась явно.
Как это возможно?
Благодаря огромному объёму общих знаний, полученных во время предобучения, и структуре языка, модель может вывести решение по аналогии.
Примеры:
Вы просите: «Переведи на суахили: “Добрый день”».
Модель никогда не видела пар «русский–суахили», но знает:- Что такое «перевод»,
- Что «Добрый день» — приветствие,
- Как звучат приветствия на других языках,
- И имеет представление о суахили из текстов.
→ Она генерирует: «Habari za mchana».
Вы пишете: «Напиши стих в стиле Бродского о кофе».
Модель не обучалась «стихи Бродского + кофе», но знает:- Стилистику Бродского,
- Тему кофе,
- Структуру стихотворения.
→ Она создаёт правдоподобный текст.
Ключевые условия для zero-shot:
- Модель должна быть крупной и предобученной на разнообразных данных,
- Запрос должен быть чётко сформулирован,
- Задача должна быть логически выводимой из имеющихся знаний.
Ограничения:
- Zero-shot менее точен, чем fine-tuning,
- Может «галлюцинировать» при сложных или узкоспециализированных задачах.
Тем не менее, zero-shot — это прорыв в гибкости ИИ. Он превращает нейросеть из узкого инструмента в универсального помощника, способного адаптироваться к новому контексту мгновенно — как человек.