bor75: (nedovolnyi)
Сегодня очередной раз боролся с программой, через которую мы запускаем расчёты. Программа запускает расчёты на компьютерный кластер, на котором они уже распределяются по отдельным компьютерам (нодам). Где-то пару месяцев назад, все расчёты, которые я запускал, начали вырубаться. Либо они просто вырубались, даже не начавшись, без определённого сообщения, либо они начинали считаться и вырубались через час с криками, что данный тип расчёта невозможен.
Со вторым случаем я разобрался. И то довольно странно - мне теперь приходится после запуска расчёта срочно ручками редактировать один файл, созданный программой. Сама программа создать правильный исходный файл почему-то не может.
С первой проблемой, когда расчёт просто тупо вылетает сразу, я наконец-то разобрался на прошлой неделе. Выяснилось, что некоторые ноды на кластере не работают. Ну, то есть программа думает, что они работают, запускает на них расчёт, а он там и помирает. При повторном запуске комп снова запускает их на тех же плохих нодах и всё повторяется. В общем, с этим я тоже разобрался - мы эти ноды отключили.
Сегодня расчёты неожиданно вдруг стали опять вырубаться. Я по привычке снова проверил ноды - всё было нормально. Посмотрел на сообщение с ошибкой - программа сообщала, что проблема с лицензией. Проверил программу, которая отвечает за лицензию - лицензия работала. Снова запустил расчёт - расчёт вырубился снова. Я вырубил лицензию - вырубилась лицензия у программы Шарияра. Вырубил опять - вырубилась моя наконец-то. Перезагрузил лицензию, после чего расчёт по-прежнему вырубался, но зато все сообщения об ощибках стали поступать на экран. Clock difference too large between client and license server system. То есть, оказалось, что на какой-то ноде установленное время отличалось сильно от времени на главном компе с лицензией. По-видимому, лицензия считает, что это надувательство и не даёт запустить расчёт. Притом время на ноде я поменять не могу - у меня нет прав на это. Предложить программе не запускать расчёт на этой ноде (Эй, гражданина! Ты туда не ходи - ты сюда ходи) я тоже не могу. Я решил обхитрить программу - запустить подряд сразу два расчёта! Тогда первый расчёт запустится на этой неправильной ноде и помрёт, но ведь зато второй расчёт запустится уже на другой ноде! Хрена с два. Программа тупо запустила первый расчёт и стала тормозить, дожидаясь отклика с ноды. Второй расчёт программа флегматично запустила на той же чёртовой ноде, после того, как первый расчёт помер. Тогда я решил сам занять эту ноду каким-нибудь расчётом, чтобы программа уже не покушалась на неё. Уж не знаю, помогло это или нет - хотя через пару минут программа по-прежнему вылетала, через пол часа расчёт, наконец, запустился. А всего на эти мучения ушло 2-3 часа. Вот на такую борьбу с программами регулярно уходит туева хуча времени.
bor75: (Default)
Который день мучаюсь с программой, которая генерит разные структуры. Сейчас наконец-то стала запускаться. Программа, она очень умная, и услужливо создаёт туеву хучу каких-то графиков с параметрами молекул. Всё это очень мило, но этих графиков очень много, и программа, вместо того, чтобы создавать графические файлы, открывает эти графики прямо на компе. Вот прям сейчас на экране красуется Figure 119. Ну, то есть умная программа уже открыла 119 окон. Я с интересом жду, когда ресурсы системы исчерпаются и программа вырубится.

PS. О, окна закончились с криком "Exception in thread "AWT-EventQueue-0" java.lang.OutOfMemoryError: Java heap space"
Правда, программа продолжает чего-то там считать.

Profile

bor75: (Default)
bor75

March 2014

S M T W T F S
      1
2345678
91011 12131415
16171819202122
23242526272829
3031     

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 25th, 2017 07:58 am
Powered by Dreamwidth Studios