Утром 7 апреля сервер упал. В это время я на нём работал с vmware. Перед смертью сервер успел написать в лог следующее:
Apr 7 10:52:43 zigzag kernel: double fault, gdt at c3042260 [255 bytes]
Элементарный анализ показывает, что (1) действительно на процессоре случилось двойное исключение - что может быть только при битых базовых низкоуровневых структурах; (2) напечатанное значение - это действительно значение регистра gdt процессора в момент двойного исключения; (3) это значение для линукса некорректно; (4) модули vmware действительно играются с перезаписью gdt.
Т.е. вероятность того, что причиной падения являются некорректные действия модулей vmware, близка к единице.
В связи с этим с текущего момента вводится ЗАПРЕТ на запуск vmware на сервере zigzag. Кому нужен vmware, пускайте его на машине breeze.
Запрет будет действовать до тех пор, пока не будет получено убедительное доказательство, что ошибка в модулях vmware исправлена.
P.S. Сервер был перезагружен со включённым highmem64. Посмотрим что из этого получится.
Никита,
так ведь это было известно и ранее?
Nikita V. Youshchenko wrote:
Утром 7 апреля сервер упал. В это время я на нём работал с vmware. Перед смертью сервер успел написать в лог следующее:
Apr 7 10:52:43 zigzag kernel: double fault, gdt at c3042260 [255 bytes]
Элементарный анализ показывает, что (1) действительно на процессоре случилось двойное исключение - что может быть только при битых базовых низкоуровневых структурах; (2) напечатанное значение - это действительно значение регистра gdt процессора в момент двойного исключения; (3) это значение для линукса некорректно; (4) модули vmware действительно играются с перезаписью gdt.
Т.е. вероятность того, что причиной падения являются некорректные действия модулей vmware, близка к единице.
В связи с этим с текущего момента вводится ЗАПРЕТ на запуск vmware на сервере zigzag. Кому нужен vmware, пускайте его на машине breeze.
Запрет будет действовать до тех пор, пока не будет получено убедительное доказательство, что ошибка в модулях vmware исправлена.
P.S. Сервер был перезагружен со включённым highmem64. Посмотрим что из этого получится.
server-usage mailing list server-usage@zigzag.lvk.cs.msu.su http://zigzag.lvk.cs.msu.su/cgi-bin/mailman/listinfo/server-usage