Инженер GPU-кластера
06 Апреля 2026
от 80 000 до 100 000 руб.
Город:
Лобня
Занятость:
Частичная занятость
Компания "СМО"
GPUGO — это инновационная платформа для аренды и сдачи GPU-серверов, предлагающая самые низкие цены на рынке и простой пользовательский опыт. Мы решаем проблемы сложных интерфейсов и завышенных цен у конкурентов, создавая минималистичный сервис для энтузиастов и компаний. Наша миссия - строить сообщество, где GPU-ресурсы доступны всем, с фокусом на удобство, прозрачность и выгодные условия. Мы уже создали MVP, который смог принести первую прибыль. Сейчас находимся на этапе активного развития и ищем специалистов, готовых внести вклад в продукт, которым пользуются ежедневно.
Обязанности:
- Физическая сборка, диагностика и обслуживание серверов (GPU, CPU, RAM, охлаждение).
- Установка и настройка Ubuntu Server 24.04, настройка драйверов NVIDIA (CUDA, NVIDIA Container Toolkit), Docker.
- Настройка физической сети и оверлеев. Организация бесперебойного интернета и туннелирования (WireGuard, GRE, RedSocks, vpn, proxy), настройка резервных каналов.
- Подключение новых нод к существующему кластеру, траблшутинг проблемных нод, настройка CNI на хостах.
- Обеспечение доступности серверов, настройка экспортеров для Vector и Victoria*.
Требования:
- Опыт администрирования Linux (Ubuntu) от 1 года (уверенная работа в консоли, понимание systemd, udev, networkd).
- Понимание архитектуры GPU-серверов, как работают PCIe-линии, охлаждение, электропитание.
- Опыт работы с драйверами NVIDIA под Linux (умение исправить конфликты версий и kernel modules).
- Базовое понимание Kubernetes со стороны инфраструктуры (kubelet, kube-proxy, как добавить ноду в кластер).
- Навыки работы с сетями (стат. маршрутизация, VPN, VLAN, bonding сетевых карт).
- Скриптинг на Bash/Python для автоматизации рутины (например, скрипт первичной настройки сервера).
Будет плюсом:
- Опыт массовой установки ОС (PXE boot, Ansible).
- Навыки диагностики "железных" проблем (dmesg, memtest, smartctl).
- Опыт построения GPU-ферм или майнинг-ригов в промышленном масштабе.
- Опыт работы с K3s.
- Сертификаты (CKA, RHCSA) или опыт в high-load GPU-кластерах
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
01 Апреля
NetSecOps - инженер (NGFW/VipNet)
Москва
Компания "Tele2" Что нужно делать: Выполнять установку, конфигурирование, проверку функционирования сетевого оборудования и эксплуатацию...
01 Апреля
Москва
Компания "Ventra" Наш клиент - м еждународная компания - крупнейший в мире производитель кукурузной муки в поиске Инженера механика...
01 Апреля
Руководитель команды DevOps-инженеров
Москва
Компания "ИСУ" Мы — часть группы «Газпромбанка» и аккредитованная IT-компания, создающая российскую no-code платформу Knowledge Space (KS). KS —...
01 Апреля
Москва
Компания "metaLead" Кто мы Мы международная амбициозная команда с интересными проектами, безграничными возможностями для карьерного...
01 Апреля
Ведущий сетевой инженер (администратор)
Москва
Компания "Велтрэйд" Группа компаний Велфарм – это ведущий игрок в фармацевтической индустрии, специализирующийся на разработке, производстве и...
Вакансия размещена в отрасли