Публичные отчеты и различная статистка по нашим нодам, что мы насоздавали от балды.
  • Дата создания
    7 ноября 2017
  • Топиков
    44
  • Ограничение на постинг
    1.000
  • Категория:
    VM.Center

Снова самая первая нода Райзена - 6 часов падение

Короче нода опять зависла.


Но почему-то вместо того чтобы пойти вручную перезагрузить сервер — сотрудник написал ваш сервер заблокирован.
Но мы не получали никаких жалоб.

Как я понял — он увидел пометки о блокировках в аккаунте, столетние.
Еще летом 2020 которые.
Ну типо мы не успели вовремя ответить, там дается 3 часа на ответ. И IP был забанен.
Все эти VM были удалены еще летом 2020. Просто блокировку IP мы так и не снимали. В OVH DC например можно автоматически снять через панель. А в Hetzner нужно писать тикет для этого. Поэтому нам было просто лень.

Но окей, раз просят — значит нужно разбаниться.


И разбанили.



Потом наконец спустя 2 тикета подробных — будто дауну пишешь, будто ребенку на пальцах объясняешь.

Вот текст тикетов.
hello on Ticket # 2021040203006279
we are told that the server is blocked for alleged complaints
but we did not receive any complaints
the server just freezes the second day
and reboot doesn't help

but since we are asked to unblock the IP
then — here — I am writing to unblock the IP

these 2020 complaints
all VDS were removed back in 2020
and clients are blocked
remove the blocking marks for these IPs

thanks
and restart the server

/// и я продублировал тот тикет — который писал для разблокировки IP

Hello
this server is used for VDS
these are old IP blocking
these VDS have long been deleted and clients are blocked
screen1

but now the problem is that the server hangs spontaneously
and does not reboot

yesterday was
vm.center/2021/04/public-nodes-vm-center/teper-vash-server-dostupen-posle-holodnoy-perezagruzki.html

a year ago there was a problem with RAM
and recently repaired again
vm.center/2021/03/public-nodes-vm-center/ryzen-9-samaya-pervaya-noda-novinka-2020-goda-kotoraya.html
and today the monitoring worked again
it is the server itself that is frozen
screen2
Solution: we always block all complaints and delete
is always
привет по билету №2021040203006279
нам сказали, что сервер заблокирован по заявленным жалобам
но мы не получали никаких жалоб
сервер просто зависает на второй день
и перезагрузка не помогает

но поскольку нас просят разблокировать IP
потом — сюда — пишу для разблокировки айпи

эти жалобы 2020 года
все VDS были удалены еще в 2020 году
и клиенты заблокированы
удалить метки блокировки для этих IP-адресов

Благодарность
и перезапустите сервер

/// и я продублировал тот тикет — который писал для разблокировки IP

Привет
этот сервер используется для VDS
это старая блокировка IP
эти VDS уже давно удалены и клиенты заблокированы
экран1

но теперь проблема в том, что сервер самопроизвольно зависает
и не перезагружается

вчера было
vm.center/2021/04/public-nodes-vm-center/teper-vash-server-dostupen-posle-holodnoy-perezagruzki.html

год назад возникла проблема с оперативной памятью
и недавно снова отремонтировали
vm.center/2021/03/public-nodes-vm-center/ryzen-9-samaya-pervaya-noda-novinka-2020-goda-kotoraya.html
и сегодня мониторинг снова заработал
заморожен сам сервер
экран2
Решение: мы всегда блокируем все жалобы и удаляем
всегда
И заодно создал новый тикет где снова объяснил на пальцах суть проблемы. Что дело вовсе не в блокированных IP от 2020 года, а дело просто в том, что сервер — взял и завис :))
Hello
your employee in the manual reboot ticket says that the server is blocked

BUT we have not received any complaints

all the complaints that were — this is 2020 summer.
and all IPs that are listed on the account are blocked — this is the summer of 2020
and January 2021 — these virtual machines have long been deleted, and clients are
blocked. we just did not have time to unsubscribe to the complaint and therefore the
IP was blocked

these locks have nothing to do with today's incident that the server just froze and
does not respond to reboots

Yesterday, for example, it was the same — the server was hanging, the restart button
did not work. only a manual reboot on a ticket helped.

a year ago this server was sold to us with 64 frames instead of 128 frames.
and a week ago we wrote a ticket because the panel again began to define the server as
64 frames and we were repaired.

the server is just defective and freezes from loads

what kind of blocking are we talking about?

so be it — we have created a ticket for all additional addresses that have been from
the summer of 2020

but the point is simply that your server is dependent on the load, and the employee
does not want to restart it

then replace the server, drag the disks into the new one
Привет
ваш сотрудник в заявке на ручную перезагрузку говорит, что сервер заблокирован

НО претензий к нам не поступало

все жалобы, которые были — это лето 2020 года.
и все IP, которые указаны в аккаунте, заблокированы — это лето 2020 года.
и январь 2021 года — эти виртуальные машины давно удалены, а клиенты
заблокирован. просто не успели отписаться от жалобы и поэтому
IP был заблокирован

эти блокировки не имеют ничего общего с сегодняшним инцидентом, когда сервер просто завис и
не реагирует на перезагрузки

Вчера например было так же — завис сервер, кнопка перезагрузки
не работало. помогла только ручная перезагрузка по тикету.

год назад этот сервер нам продавали с 64 кадрами вместо 128 кадров.
а неделю назад мы написали тикет, потому что панель снова начала определять сервер как
64 кадра и мы отремонтировали.

сервер просто неисправен и зависает от нагрузок

о какой блокировке идет речь?

пусть будет так — мы создали тикет для всех дополнительных адресов, которые были с
лето 2020

но дело просто в том, что ваш сервер зависит от нагрузки, а сотрудник
не хочет перезапускать его

затем замените сервер, перетащите диски на новый
Наконец они перезагрузили сервер.




как и говорил, если брак на стадии покупки виден, то нада 100% отказываться, не отказался сразу — теперь страдай


Добавили VM-6 ноды в мониторинг (VM-5 не добавляли они архивны)

Теперь ваш сервер доступен после холодной перезагрузки

Опять самая первая нода.
Про нее уже было
Вот реально — если нода куплен проблемной — это будет всегда на протяжении всей жизни заказа hetzner

Короче зависла нода.
Все как обычно — перезагрузка не помогает.
Пишем на ручную перезагрузку сотрудником.
Но в этот раз даже сотрудник не справился с задачей. И сервер все равно не ожил.
Хотя ответ пришел что он перезагрузил.


Пришлось создавать еще один тикет.
И через пол часа вдруг ожил.


Целый час даунтайма.

Ryzen 9 - самая первая нода новинка 2020 года которая

Короче как только мы ее купили. Нам продали 64 озу вместо 128 озу.
В 2020 году еще мы переписывались с ДЦ и они там потом починили.

Но в 2021 снова произошло это дело.
Поэтому простой ноды — вот публичный отчет. Около часа валялась.





После починки

Сгорел дата-центр SBG2

История еще не завершилась и думаю еще пара недель уйдет на все это.
Следить за новостями можно тут
hosting.kitchen/ovh/datacenter-sbg.html



Итого, VM-ы которые сгорели. Или может быть потом что-то и восстановится посмотрим.

На данный момент считаем их погибшими.

Ryzen 7 SBG2 [VM-5]


i7-6700k SBG2 [VM-5]


i7-6700k SBG2 [VM-6]










Первая авария на VMmanager 6 версии (всем пострадавшим 1 месяц начислено бесплатно)

Хоть они и заявляют о стабильности, но на 2021 год — пока что это не так.


За 2020 было проделано много работы, что-то стало лучше, что-то стало хуже.
Например хуже стало то, что при создании кластера нельзя теперь указать настройки для него, например выставить лимит на канал, в итоге все ВМ создаются без ограничений и потом приходится вручную уже всем настраивать после создания ВМ. А раньше эта функция бралась из создания кластера, просто когда его создашь там указывалось.
А лучше стало наверно то, что больше функционала, все таки Март 2020, Апрель 2020 и Ноябрь 2020 — это небо и земля.

Короче по каким-то причинам часть узлов стала писаться якобы проблемы на узле.
Но узлы работали и ВМ на них работали.
Хотя в панели показывался статус что ВМ отключена и не работает.

Ради теста я перезагрузил 1 узел, он перестал писаться с ошибками. Но зато ВМ-ки на нем перестали работать.

В итоге почти сутки ISPsystem пытались разобраться в проблеме.

И до сих пор пока что проблема не исправлена.
Пишут что утечка ОЗУ, хотя сама панель их показывает что 2 ГБ в запасе.


Вероятно эта проблема случилась после обновления
Версия 6.15.0 VMmanager KVM 6


На VMmanager 5 — были похожие проблемы ранее.
Так вот, короче я перезагрузил 1 узел — и он сдох.
И вот всем кто пострадал на этом узле — 1 месяц бесплатно :)

Вот этим чувакам.

И в публичные отчеты честности для истории.
Дата подачи заявки о проблеме панели.
2021-02-05 15:39:27

Но восстановлен узел был только.
2021-02-06 19:48:21


Почти 24 часа короче.
Такие вот дела. Извиняюсь хоть это и не косяк хостера.

SMART отчет №4 - HDD SATA

А теперь я решил глянуть HDD ноды, которые в raid, и которые мы давно не делаем уже, т.к. тариф не особо интересный был. Чисто остатки прошлого висят.

noda1 — 43790 часов — 0 ошибок
noda2 — 51440 часов — 0 ошибок
noda3 — 56165 часов — 0 ошибок (6 лет)
noda4 — 48623 часов — 0 ошибок
noda5 — 30930 часов — 0 ошибок
noda6 — 16306 часов — 0 ошибок
noda7 — 42814 часов — 0 ошибок
noda8 — 51034 часов — 0 ошибок
noda9 — 48798 часов — 0 ошибок

Как так? Даже HDD диски — не сгорают у нас!

Читать дальше

SMART отчет №3


Первый был летом 2018
SSD Total Bytes Written

Второй был весной 2019
SMART отчет №2

Третий отчет. Лето 2020.
У нас так и не сгорел не один диск.
За эти годы я успел уже закрыть кучу нод из-за старых процессоров.
За эти годы я уже придумал новые тарифные модели.
За эти годы я уже успел разочароваться в дешевой аудитории.
Но — у нас так и не сгорел не один диск. Я так и не увидел собственными глазами как они сгорят ;(

SBG i7-6700k
noda1 — закрыли ее уже, сделали перенос на VM-6
noda2 — 295425295251 357302316667 — 137.57 TB 166.38 TB — 0 ошибок
noda3 — закрыли ее уже, сделали перенос на VM-6
noda4 — закрыли ее уже, сделали перенос на VM-6
noda5 — закрыли ее уже, сделали перенос на VM-6
noda6 — закрыли ее уже, сделали перенос на VM-6
noda7 — появилась новая нода, 231009455557 — 107.57 TB — 0 ошибок
noda8 — появилась новая нода, 133745752064 — 62.28 TB — 0 ошибок
noda01 2016 — закрыли ее уже цены 2016 отличаются от цен соврменности, сделали перенос на Райзен
noda02 2016 — закрыли ее уже цены 2016 отличаются от цен соврменности, сделали перенос на Райзен

GRA i7-6700k
noda1 — закрыли ее уже, сделали перенос на VM-6
noda2 — 53503605961 212621713408 — 24.91 TB 99.01 TB — 0 ошибок
noda3 — закрыли ее уже, сделали перенос на VM-6
noda4 — 233938 1701297 — 0 ТБ (либо ошибка, либо так и осталось с прошлого замера) — 0 ошибок
noda5 — 106640635623 292179512829 — 49.66 TB 136.06 TB — 0 ошибок
noda6 — 86617391991 243250025384 — 40.33 TB 113.27 TB — 0 ошибок
noda7 — 38769693909 356324041216 — 18.05 TB TB 165.93 TB — 0 ошибок
noda8 — 13825987528 119205617664 — 6.44 TB 55.51 TB — 0 ошибок
noda9 — появилась новая нода, 1318151026488 — 613.81 TB — 0 ошибок
noda10 — появилась новая нода, 132548597248 — 61.72 TB — 0 ошибок
noda01 2016 — закрыли ее уже цены 2016 отличаются от цен соврменности, сделали перенос на Райзен
noda02 2016 — закрыли ее уже цены 2016 отличаются от цен соврменности, сделали перенос на Райзен

Все остальные 1245 всякие — в raid1, хотя тоже не мешало бы замерить как-ниб.
Еще Райзены новые делаем в raid0 — но там NVME диски, там смарты не показываются даже. Но пока тоже не разу ничего не сгорело.

Так же было решено сохранить для будущего понимания.
Полноценные смарты.
Читать дальше