Перейти к содержанию

Поиск типовых неисправностей платформы

Baremetal инсталляция

В первую очередь проверьте, что ваша инфраструктура соответствует требованиям

Компоненты, отвечающие за установку кластера

Имя компонента Описание
capi-controller-manager Отвечает за общую работу по разворачиванию кластеров
capi-kubeadm-control-plane-controller-manager Отвечает за управление ControlPlane
capi-kubeadm-bootstrap-controller-manager Отвечает за управление worker
byoh-controller-manager Отвечает за разворачивание на baremetal

Установка инфраструктурного кластера

Установка зависла на строчке wait controlplane

Это поведение характерно для проблем с настройкой K8SCPIP. На этом этапе bootsmanctl пытается связаться с кластером по IP адресу, указанному в конфигурации. Убедитесь, что адрес действительно свободен и он присвоен сетевому адаптеру на одном из мастеров. Сделать это можно командой на всех мастерах

ip a
Второй вариант возникновения данной проблемы - ошибки при работе host-agent. Для его диагностики подключитесь по ssh на нужный хост и посмотрите логи этого демона.

journalctl -u host-agent
Подробное описание ошибок host-agent вынесены в отдельную статью

Установка завершилась успешно, веб-интерфейс не доступен

Заметка

Поскольку Боцман не использует kube-proxy, вы не сможете увидеть проброс портов в iptables

Проверьте следующие вещи:

  • На воркерах доступны порты 80 и 443
  • В DNS-сервере заведена A-запись, и она идентична записи в конфиге
  • DNS-имя резолвится в IP адрес любого из воркеров
  • Под rancher запущен и работает

Установка подчинённого кластера

Кластер завис на этапе создания

Для начала убедитесь, создался ли кластер. В примере далее кластер имеет имя demo, формируем команду с учётом этого имени и выполняем на одном из мастеров команду:

kubectl --kubeconfig=/etc/kubernetes/admin.conf get byoh -A | grep demo
Пример вывода
default     worker-0.bootsman-v2-show   linux    redos   7.3.2                       RED OS MUROM (7.3.2)   amd64   demo-md-svdd7                    default
default     worker-1.bootsman-v2-show   linux    redos   7.3.2                       RED OS MUROM (7.3.2)   amd64   demo-srntz                       default
default     worker-2.bootsman-v2-show   linux    redos   7.3.2                       RED OS MUROM (7.3.2)   amd64   demo-md-52ccx                    default
default     worker-5.bootsman-v2-show   linux    redos   7.3.2                       RED OS MUROM (7.3.2)   amd64   demo-md-dwnqb                    default
Если количество хостов соответствует тому, что вы заказали, но при этом процесс создания кластера так и не завершился - проверьте доступность вашего инфраструктурного кластера по DNS-имени со всех членов нового подчинённого кластера.

В противном случае изучите журналы byoh-controller-manager и подов capi (capi-controller-manager, capi-kubeadm-control-plane-controller-manager, capi-kubeadm-bootstrap-controller-manager). Они содержат исчерпывающую информацию по процессу установки k8s на машины.