Проблема Неконтролируемое переключение между репликами

VR46

Member
21.11.2019
18
0
BIT
59
Изначально было два сервера, объединённых в кластер, Server1 и Server2. Через некоторое время в домен было добавлено еще два сервера, также объединённых в кластер, Server3 и Server4. Во всей этой кластеризации Server1 является основным. На первом кластере работает почта, на втором была развёрнута система электронного документооборота (СЭД). В качестве основного сервера в базах СЭД указан Server3. После настройки дополнительных серверов (Server3 и Server4) и СЭД, у пользователей были созданы подключения к ним, всё вроде бы хорошо. А теперь, собственно, проблема: периодически у некоторых пользователей при обращении к базе СЭД происходит переключение c основного Server3 на реплику, расположенную на Server4. Например, утром пользователь включает компьютер, запускает клиент Notes и при попытке открыть базу СЭД в строке состояние Notes появляется строка: "запрос адреса Server3 у Server1", после этого, видимо не получив алреса Server3, происходит переключение на Server4 и с него открывается реплика БД. Открыть базу на основном сервере документооборота получается только при повторном создании подключения к Server3 на рабочей станции "проблемного" пользователя. И эта ситуация может повториться в течении дня (на следующий день, через неделю...) Подскажете, может где/что недонастроено в серверных настройках или это проблема СЭД (такое тоже возможно)
 

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 985
611
BIT
473
видимо не получив алреса Server3, происходит переключение на Server4 и с него открывается реплика БД. Открыть базу на основном сервере документооборота получается только при повторном создании подключения к Server3 на рабочей станции "проблемного" пользователя.
не понял:
- это ток у одного юзера?
- что значит адреса, как организовано подключение?
 

VR46

Member
21.11.2019
18
0
BIT
59
не понял:
- это ток у одного юзера?
- что значит адреса, как организовано подключение?

- Нет, это может произойти у разных пользователей, у кого-то чаще, у кого-то реже. Проверял подключение с одного из проблемных клиентов на Server3 посредством выполнения на клиенте команды ping, всё хорошо, потерь нет.
- Прошу прощения, что значит "как организовано подключение"?
 

Вложения

  • ps1.jpg
    ps1.jpg
    5 КБ · Просмотры: 159

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 985
611
BIT
473
Прошу прощения, что значит "как организовано подключение"?
подключение бывает по имени, по документу connection

по имени - нотусня пытается определить IP адрес используя DNS или netbios (что плохо, если этот протокол отмечен в списке)
1600773712123.png

netbios - это "плохо"
здесь же (в этом разделе настроек) есть и Trace, проверку соединения нужно делать именно так (для TCPIP), а не ping, галочку с netbios снять.

Mожет плохо работать DNS, может быть перегружен сервер в кластере (индекс надо смотреть), может соединение именно с этим сервером неустойчивое по архитектуре сети....
 
Последнее редактирование:

savl

Lotus Team
28.10.2011
2 624
314
BIT
543
В конекшене есть поле с приоритетом, если у вас для сервер3 стоит Low, а в конекшене сервер4 Normal, то с вероятностью в 60% при долгом получении базы, клиент редиректнет на реплику.
 
  • Нравится
Реакции: lmike

VR46

Member
21.11.2019
18
0
BIT
59
подключение бывает по имени, по документу connection

по имени - нотусня пытается определить IP адрес используя DNS или netbios (что плохо, если этот протокол отмечен в списке)

netbios - это "плохо"
здесь же (в этом разделе настроек) есть и Trace, проверку соединения нужно делать именно так (для TCPIP), а не ping, галочку с netbios снять.

Mожет плохо работать DNS, может быть перегружен сервер в кластере (индекс надо смотреть), может соединение именно с этим сервером неустойчивое по архитектуре сети....

В этом списке netbios не отмечен, только TCPIP.
Trace.jpg




В конекшене есть поле с приоритетом, если у вас для сервер3 стоит Low, а в конекшене сервер4 Normal, то с вероятностью в 60% при долгом получении базы, клиент редиректнет на реплику.

В connection-документах обоих серверов приоритет стоит Low...
 

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 985
611
BIT
473

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 985
611
BIT
473
Да, соединение по правильному адресу.
ну значит осталось загруженность сервера и устойчивость соединения
а на какой ОС домина? просто если виндядко - там сама ОС может заниматься своими делами и похерить все остальные задачи
 

VR46

Member
21.11.2019
18
0
BIT
59
ну значит осталось загруженность сервера и устойчивость соединения
а на какой ОС домина? просто если виндядко - там сама ОС может заниматься своими делами и похерить все остальные задачи

Windows Server 2016
 

lmike

нет, пердело совершенство
Lotus Team
27.08.2008
7 985
611
BIT
473
тогда надо в винде искать траблы...
мониторинг загрузки лишние службы и тп
и да - снимать статистику и индекс загруженности с домины
+ смотреть IOPS (может тормоза на дисковых операциях и домина "встаёт")
 
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!