Когда говорят, что нейросеть обучена, это не значит, что она запомнила ответы или формулы. На самом деле, она настроила свои внутренние параметры — миллионы и даже миллиарды чисел, называемых весами. Эти веса — основа работы нейросети. Именно они определяют, какой будет результат на заданный вход, как сеть интерпретирует данные и какие шаблоны она «узнаёт».
Как устроена нейросеть изнутри
Нейросеть состоит из нейронов, соединённых слоями. Каждый нейрон получает на вход числа, перемножает их на веса, складывает, применяет функцию активации и передаёт дальше.
Схематично:
scss
Копировать. Редактировать.
Вход (X) → Умножение на вес (W) → Функция → Выход (Y).
Каждое соединение между нейронами имеет вес (weight) — числовой коэффициент, который говорит, насколько важен этот сигнал.
Вес как «память» нейросети
Веса — это не «память» в обычном смысле. Это скорее настройки, отражающие закономерности в данных.
Пример: если нейросеть часто видит, что картинка с ушами и хвостом — это кошка, она усилит веса, связанные с этими признаками.
В следующем случае она «узнает» кошку даже без явной подсказки.
Как обучаются веса
На старте обучения веса — случайные.
Затем нейросеть делает предсказание, сравнивает с правильным ответом и рассчитывает ошибку. Далее работает алгоритм обратного распространения ошибки (backpropagation):
- Ошибка «прокатывается назад» по сети.
- Каждый вес получает поправку.
- Веса обновляются так, чтобы в следующий раз ошибка была меньше.
Это повторяется тысячи раз до тех пор, пока сеть не научится делать точные предсказания.
Параметры vs гипер параметры
Внутри нейросети есть два типа настроек:
- Параметры — это сами веса, которые сеть обучает автоматически.
- Гипер параметры — это то, что задаёт разработчик заранее:
- число слоёв;
- скорость обучения;
- размер батча;
- функция активации и др.
От правильного выбора гиперпараметров зависит качество и скорость обучения нейросети.
Сколько весов в нейросети?
Всё зависит от модели:
- Простая нейросеть — тысячи весов.
- GPT-3 — 175 миллиардов параметров.
- GPT-4 — ещё больше (точное число не раскрывается).
- Stable Diffusion — сотни миллионов.
Каждое число влияет на то, что и как понимает нейросеть.
Внутри нейросети нет знаний в привычном виде — только огромные массивы чисел, которые определяют её поведение. Эти числа (веса) и есть результат обучения, и именно они превращают «чёрный ящик» ИИ в работающий механизм.
Понимание, как работают веса, помогает лучше доверять, настраивать и использовать нейросети — не как магию, а как инструмент.