Rivalry2

HTML Diff

0 added 0 removed

Original 2026-01-01

Modified 2026-02-21

1 <a>#статьи</a>

2 <ul><li>11 дек 2025</li>

3 <li>0</li>

4 </ul>От установки до создания собственного локального ChatGPT.

5 Иллюстрация: Оля Ежак для Skillbox Media

6 Считает игры произведениями искусства и старается донести эту идею до широких масс. В свободное время стримит, рисует и часами зависает в фоторежимах.

7 Ollama - это фреймворк для запуска больших языковых моделей на вашем компьютере или сервере. С его помощью можно работать с LLama, Gemma, DeepSeek и другими нейросетями. Главное отличие от платных ИИ-сервисов - данные хранятся локально, поэтому никто не узнает о ваших запросах.

8 В этой статье вы узнаете, как установить Ollama на компьютер и где найти подходящие языковые модели. Также мы настроим удобный веб-интерфейс Open WebUI, который будет доступен через браузер с любого устройства.

9 Содержание

10 <ul><li><a>Преимущества и ограничения локальных моделей</a></li>

11 <li><a>Как установить и настроить Ollama</a></li>

12 <li><a>Как выбрать модель для работы</a></li>

13 <li><a>Как загрузить модели в Ollama</a></li>

14 <li><a>Как использовать API Ollama</a></li>

15 <li><a>Как создать локальный аналог ChatGPT с Ollama и Open WebUI</a></li>

16 </ul>На первый взгляд может показаться странным разворачивать локальный сервис, когда есть готовые решения: ChatGPT, Grok и другие. Однако у такого подхода есть свои плюсы:

17 <ul><li>Все данные хранятся и обрабатываются локально.Разработчик, который работает над конфиденциальным кодом в компании, или учёный, анализирующий чувствительные результаты исследования, с Ollama могут не беспокоиться, что информация попадёт к третьим лицам или будет использована для обучения коммерческих моделей. Данные всегда остаются на устройстве и не передаются через интернет.</li>

18 <li>Модели можно кастомизировать - менять их характеристики и обучать.Например, можно настроить температуру ответов, то есть степень разнообразия генерируемого текста, и контекстное окно - объём данных, которые модель "запоминает". Кроме того, вы можете загружать собственные документы через<a>RAG</a> - модель будет использовать их как дополнительный контекст для ответов.</li>

19 <li>Не нужно покупать подписки на сервисы.Ollama использует бесплатные модели с открытым исходным кодом без ограничений на количество запросов. Поэтому вам не придётся платить за токены, ежемесячную подписку или другие услуги - всё полностью бесплатно.</li>

20 </ul>Кроме того, у Ollama есть большое и активное<a>сообщество на Reddit</a>. Пользователи обсуждают фреймворк, модели нейросетей и интеграцию с различным софтом, а также делятся опытом. Здесь можно задать вопрос и получить ответ или найти решение в уже существующих обсуждениях.

21 Конечно, у Ollama есть и ограничения. Скорость работы зависит от мощности компьютера: для комфортной работы с моделями среднего размера нужно минимум 16 ГБ оперативной памяти и видеокарта с 8 ГБ VRAM. Крупные модели требуют ещё больше ресурсов - иначе генерация будет заметно тормозить. Например, для<a>популярной модели llama2:70b</a>с 70 миллиардами параметров рекомендуется компьютер с 64 ГБ оперативной памяти.

22 Помимо Ollama существуют и другие приложения с похожими возможностями:<a>LM Studio</a>,<a>GPT4All</a>и <a>Jan</a>. У каждого из них есть свои особенности установки, настройки и поддерживаемые модели - их мы разберём в следующих статьях.

23 Ollama поддерживает Windows, macOS и Linux. Системные требования зависят исключительно от языковых моделей, которые вы планируете использовать. Подробнее о требованиях сервиса к вычислительной мощности и поддерживаемых видеокартах можно<a>узнать на официальном сайте</a>.

24 На сайте Ollama можно<a>зарегистрироваться</a>, если вы планируете публиковать модели в публичную библиотеку или использовать веб-интерфейс для управления ими. Для локальной работы регистрацию можно пропустить.

25 Фреймворк поддерживает Windows 10 и новее. Для установки<a>скачайте установочный клиент с сайта</a>(1,16 ГБ). Только обратите внимание, что по умолчанию установка проходит на системный диск. Чтобы задать другой путь, откройте окно Выполнить (Win + R) и введите команду в таком формате:

26 (путь установочного клиента)\OllamaSetup.exe /DIR=(название жёсткого диска):\путь установкиМодели по умолчанию также загружаются на системный диск. Папку для их загрузки вы можете настроить в пункте Model Location во вкладке Settings в клиенте - она открывается при нажатии на значок в верхнем левом углу.

27 Меню настроек Ollama. Красным выделен пункт для выбора места установки моделейСкриншот:<a>Ollama</a>/ Skillbox MediaКлиент поддерживает macOS 14 Sonoma и новее. Для установки<a>скачайте файл образа</a>в формате DMG. Откройте его в проводнике и перетащите приложение в папку Applications. После Ollama можно запустить через Spotlight.

28 При первом запуске<a>приложение проверит</a>, что в переменной PATH есть ссылка на интерфейс командной строки (CLI), и если нет - запросит разрешение на её создание. После этого команды, связанные с фреймворком, можно будет выполнять из терминала. Это пригодится, если вы разработчик или планируете загружать дополнительные модели, о чём мы подробно расскажем дальше.

29 Чтобы запустить установку, скопируйте команду и введите в терминале:

30 curl -fsSL https://ollama.com/install.sh | shДальнейшее взаимодействие с фреймворком происходит через командную строку. Например, для запуска используется простая команда:

31 ollama serveЕсть и другой вариант запуска, при котором можно проверить, что фреймворк работает. Потребуется две последовательных команды:

32 sudo systemctl start ollama sudo systemctl status ollamaПосле терминал выведет информацию о статусе. Если фреймворк запустился, появится статус Enabled. А также информация о дате и времени запуска.

33 Запускаем Ollama в Linux и проверяем работу фреймворкаСкриншот: Bash / Skillbox MediaВыбор в пользу той или иной модели во многом зависит от ваших задач и конфигурации компьютера. У каждой LLM есть своя специфика: одни отлично работают с текстом, другие пишут код, а третьи и вовсе способны распознавать текст из отсканированных документов. Поэтому универсальной рекомендации нет. Все доступные модели<a>указаны в каталоге</a>и разбиты на пять категорий:

34 <ul><li>Cloud - для облачного развёртывания на серверах.</li>

35 <li>Embedding - для генерации эмбеддингов. Эти модели преобразуют текст или данные в числовые векторы, которые можно использовать для поиска, сравнения и кластеризации информации.</li>

36 <li>Vision - для распознавания и описания изображений.</li>

37 <li>Tools - для выполнения различных задач: написания кода, AI-ассистирования, настройки API-интеграций с другими сервисами.</li>

38 <li>Thinking - для логических ответов с рассуждениями и аргументацией.</li>

39 </ul>В каталоге для каждой модели указаны её название, краткое описание, количество параметров, число скачиваний и дата последнего обновления.

40 Ключевой параметр - количество параметров. Оно обозначается как 3b, 7b, 30b и так далее, где b - это миллиард. Чем оно больше - тем модель "умнее" и точнее, но при этом требует и больше ресурсов для работы. К примеру, модель 7b (7 миллиардов параметров) требует 8-12 ГБ оперативной памяти, тогда как 70b - 48-64 ГБ видеопамяти. Поэтому при выборе моделей учитывайте возможности своего железа, иначе решение задачи может занять много часов.

41 Для каждой модели указаны краткое описание и набор тегов для удобного выбораСкриншот:<a>Ollama</a>/ Skillbox MediaOllama поддерживает десятки моделей, включая<a>Llama</a>,<a>DeepSeek</a>,<a>Qwen</a>,<a>Gemma</a>,<a>Phi</a>и другие.<a>Полный список</a>доступен на сайте фреймворка. Для загрузки моделей есть три способа: через графический интерфейс, через командную строку или с помощью Hugging Face. Разберём каждый подробнее.

42 Чтобы установить базовую модель напрямую из Ollama, выберите подходящую во вкладке в правом верхнем углу окна чата и отправьте любое сообщение - загрузка начнётся автоматически. Вам будут доступны несколько моделей семейств Gemma, DeepSeek, Qwen, GPT, Minimax и GLM. Облачные версии, требующие доступа к интернету для работы, отмечены тегом cloud.

43 Загрузка выбранной модели через графический интерфейсСкриншот:<a>Ollama</a>/ Skillbox MediaГрафический интерфейс содержит не все поддерживаемые модели. Остальные нужно загружать через CLI - это также основной способ работы в Linux.

44 Прежде чем загрузить модель, её надо выбрать<a>в каталоге Ollama</a>. Для ускорения поиска можно воспользоваться сортировкой по пяти категориям, о которых мы говорили выше: Cloud, Embedding, Vision, Tools и Thinking. Обратите внимание, что одна модель может сочетать в себе несколько категорий.

45 После выбора модели вы увидите страницу с её описанием, доступными версиями и системными требованиями. Обязательно учитывайте количество параметров модели и объём оперативной памяти или видеопамяти на компьютере.

46 Скопируйте команду из раздела CLI и вставьте её в терминал - например, в Windows PowerShell или Terminal (в macOS) - и нажмитеEnter. После этого загрузка модели начнётся автоматически, а вам нужно немного подождать.

47 Установка модели через командную строку в PowerShellСкриншот: Windows PowerShell / Skillbox MediaПосле установки модель появится в графическом интерфейсе в списке доступных нейросетей, и её можно будет использовать для работы.

48 Мы установили через PowerShell модель llama2-uncensored, и теперь она доступна для выбораСкриншот:<a>Ollama</a>/ Skillbox MediaДля установки в Linux используйте команду pull, например:

49 ollama pull codellama:7bПосле этого начнётся установка модели. Если всё прошло успешно, то вы сможете запустить загруженную модель командой:

50 ollama run codellama:7bПосле запуска следующая строка начнётся с символов >>> - это приглашение для ввода команд. В это поле можно вводить промпты для работы с моделью.

51 У нас небольшая модель, которая была обучена на английском языке. Поэтому напишем запрос на нём же, чтобы быстрее получить ответ.

52 Красным выделена команда запуска модели и промпт. Мы попросили написать скрипт на Python для Blender - он создаст в сцене десять трёхмерных кубов с разными характеристикамиСкриншот: Bash / Skillbox MediaДля начала зайдите на <a>Hugging Face</a>под своей учётной записью. Hugging Face - это библиотека с тысячами языковых моделей с открытым кодом. Для каждой из них есть описание, инструкция по запуску и настройке и так далее.

53 Чтобы использовать модели с Hugging Face, вам нужно зайти в настройки<a>Local Apps and Hardware</a>и добавить Ollama в раздел Local Apps. После этого перейдите на страницу нужной модели - она должна быть в формате GGUF. Далее нажмите на вкладку Use this Model и выберите Ollama в списке.

54 Скриншот:<a>Hugging Face</a>/ Skillbox MediaВ открывшемся окне скопируйте ссылку и вставьте её в терминал - модель начнёт загружаться автоматически. После завершения загрузки выберите её из списка в графическом интерфейсе Ollama или запустите через командную строку, как мы писали выше. Способ работает во всех операционных системах.

55 Ollama - это полноценный локальный сервер, который работает через<a>HTTP-протокол</a>по адресу<a>http://localhost:11434</a>. Когда фреймворк запущен, при переходе на этот адрес в браузере появится надпись "Ollama is running". Зная синтаксис терминала, вы можете проверить интеграцию API на практике.

56 Например, напишем запрос с промптом для написания шутки в PowerShell:

57 Invoke-RestMethod -Uri http://localhost:11434/api/generate -Method Post -Body '{ "model": "qwen3-vl:4b", "prompt": "Tell me a joke", "stream": false }' -ContentType "application/json"Разберём его по пунктам:

58 <ul><li>Invoke-RestMethod - команда PowerShell, которая отправляет<a>REST-запрос</a>.</li>

59 <li>-Uri - указывает на локальный хост Ollama на стандартном порте 11434.</li>

60 <li>-Method Post - указывает, что данные отправляются на сервер методом<a>POST</a>.</li>

61 <li>-Body - блок данных, передаваемых в запросе. Включает тип модели ("qwen3-vl: 4b"), сам промпт ("Tell me a joke") и дополнительный параметр "stream": false. Без этого параметра нейросеть будет генерировать потоковый ответ пословно в режиме реального времени.</li>

62 <li>}' -ContentType "application/json" - закрывает запрос и указывает PowerShell, в каком текстовом формате поступают данные от нейросети. В нашем случае -<a>JSON</a>.</li>

63 </ul>Посмотрим на результат.

64 Нейросеть выдала каламбур на основе игры слов. Фраза "break the ice" (растопить лёд, наладить общение) превратилась в "break the egg" (разбить яйцо). Шутка в том, что яйца не могут рассказывать анекдоты - они просто разобьются в прямом и переносном смысле. Интересно, что в JSON-ответе есть поле thinking, где наша модель буквально "размышляет вслух" - старается выбрать подходящий тон и дать ответ без чёрного юмораСкриншот: Windows PowerShell / Skillbox MediaМожно пойти дальше и интегрировать API Ollama в своё собственное приложение или создать пользовательские скрипты для программ. Важно, что при выборе модели стоит выбирать подходящую: например, для генерации кода - Codellama или аналогичную.

65 Чтобы нейросеть не добавляла лишнего в генерируемый код, можно подстраховаться и явно прописать в промпт дополнительные условия, например "без пояснений, только рабочий код".

66 Попробуем интегрировать Ollama API в программу для 3D-моделирования Blender. С помощью модели gemma3:4b напишем скрипт на Python, который обращается к API и генерирует команду для создания пяти кубов в текущей сцене. Запустим и посмотрим на результат.

67 Всё сработало - мы получили пять кубов в рабочей области, а Blender не выдал ошибокСкриншот: Blender / Skillbox Media<a>В тематических ветках</a>по программированию на Reddit и других сообществах для разработчиков нередко встречаются упоминания об использовании Ollama в сочетании c Open WebUI.

68 <a>Open WebUI</a> - это локальная ИИ-платформа в формате веб-интерфейса с открытым исходным кодом, которая может работать в связке со многими фреймворками для запуска языковых моделей, в том числе и с Ollama. Такой подход имеет<a>преимущества</a>: работать можно через браузер на любом гаджете, даже на смартфоне, а в истории диалогов становится доступна фильтрация и поиск ответов. Всё как в привычных чат-ботах.

69 Например, вот что пишет пользователь Porespellar про Open WebUI в сабе<a>LocalLLaMA</a>:

70 "Прежде всего, спасибо создателям Open WebUI. Это потрясающий и надёжный клиент. Самый профессиональный чат-клиент с открытым исходным кодом + RAG, который я когда-либо использовал. Мне очень нравится реализация Docker, нравятся автоматические обновления Watchtower. Весь процесс развёртывания просто великолепен!"

71 Но, пожалуй, одна из самых полезных функций -<a>поддержка RAG</a>(Retrieval-Augmented Generation), генерации ответа, с учётом информации из внешних источников. Иными словами, если Ollama просто генерирует ответы, исходя из контекста диалога, в связке с Open WebUI можно подгружать собственные документы - система индексирует их и добавляет их содержимое в контекст моделей.

72 В результате при ответах ИИ подбирает релевантные фрагменты из загруженных файлов пользователя и формирует ответ, опираясь на эти данные. Такой подход удобно использовать для формирования отчётов, поиска конкретной информации в большом количестве текста, работы с репозиториями и так далее.

73 Также в Open WebUI существует поддержка многопользовательского режима в рамках локальной сети. Он доступен после регистрации, которую клиент предложит по умолчанию при первом запуске. При этом интернет-соединение не требуется: все данные остаются на компьютере или сервере. Такой подход позволяет контролировать настройки доступа среди участников проекта.

74 Первый зарегистрированный пользователь<a>получает права администратора</a>и может дать доступ другим участникам локальной сети, которые зарегистрируются позже. Если работа над корпоративными проектами не входит в ваши планы - создавать учётную запись в Open WebUI необязательно и этот шаг можно пропустить.

75 Существует несколько способов установки Open WebUI - через Python, Docker или Kubernetes. Рассмотрим вариант загрузки через Docker.

76 Скачайте<a>установочный клиент Docker Desktop</a>с сайта и запустите установку. После её завершения потребуется перезагрузка компьютера.

77 Для работы Docker Desktop на Windows требуется подсистема для Linux WSL2. Если она не установлена, введите в PowerShell команду:

78 wsl --installПосле перезагрузки запустите Docker, откройте терминал в нижнем правом углу и скачайте образ Open WebUI:

79 docker pull ghcr.io/open-webui/open-webui:mainПосле этого запустите Open WebUI:

80 docker run -d -p 3000:8080 -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:mainЕсли хотите, чтобы сервис запускался без регистрации, потребуется другая команда:

81 docker run -d -p 3000:8080 -e WEBUI_AUTH=False -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:mainПодробнее обо всех нюансах установки и дополнительных командах можно узнать<a>в официальной документации</a>.

82 Статус в виде зелёного круга в Containers показывает, что Open WebUI запущенСкриншот: Docker / Skillbox MediaТеперь Open WebUI можно открыть в браузере по адресу<a>http://localhost:3000</a>. В более ранних версиях требовалось подключать вручную Ollama, но в актуальной сборке сервис автоматически распознаёт наличие фреймворка на компьютере и сразу начинает работать в связке. В результате все модели, установленные в Ollama доступны и в Open WebUI.

83 На скриншоте видно, что Open Web UI "подхватил" все модели, которые мы до этого устанавливали в OllamaСкриншот:<a>Open WebUI</a>/ Skillbox MediaТаким образом, настроив Ollama и Open WebUI, вы получите мощный ИИ-инструмент, который работает локально на компьютере прямо из браузера, как любой популярный чат-бот, например ChatGPT. Дальше можно экспериментировать с разными моделями, загружать документы, настраивать параметры генерации и постепенно кастомизировать систему под собственные задачи. Здесь фантазия не ограничена.

84 <a>Нейросети

85 <ul><li>38+ топ-нейросетей в одном курсе: ChatGPT, Midjourney, StableDiffusion, DALL-E 3, Gen-3, Kling, Luma, Suno и другие</li>

86 <li>190+ готовых промптов, чтобы быстрее решать задачи</li>

87 <li>Практика на реальных кейсах и 10 проектов в портфолио</li>

88 <li>Бессрочный доступ с ежемесячными обновлениями</li>

89 </ul>Узнать о курсе

90 </a><a>Практический курс: "Нейросети" Узнать о курсе</a>