Name | hadam3p_eu_9953_2014_0_010356934_0 |
Workunit | 10172802 |
Created | 9 Nov 2015, 18:23:38 UTC |
Sent | 9 Nov 2015, 18:24:23 UTC |
Report deadline | 21 Oct 2016, 23:44:23 UTC |
Received | 24 Nov 2015, 18:10:06 UTC |
Server state | Over |
Outcome | Computation error |
Client state | Compute error |
Exit status | 0 (0x00000000) |
Computer ID | 1348008 |
Run time | 3 days 16 hours 30 min 26 sec |
CPU time | 3 days 0 hours 39 min 30 sec |
Validate state | Invalid |
Credit | 1,992.44 |
Device peak FLOPS | 2.70 GFLOPS |
Application version | UK Met Office HadAM3P-HadRM3P Europe v7.26 windows_intelx86 |
Stderr | <core_client_version>7.6.9</core_client_version> <![CDATA[ <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7076, iMonCtr=2 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Conobal Worker:: CPD:: CPDN process is not running, exnting, bRatVal = 1, checkPID=0, selfPID=5l = 1, checkPID=0, selfPID=3352, iMonCtr=2 824, iMonCtr=2 Model crash detected, will try to restart... CGlobal Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9572, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5732, iMonCtr=2 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=6132, selfPID=8012, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... GCoontrollerr:: CPDN process is not running, exiting, bRetVall = 1 = 1 chcckPIheckPID=0, selfPID=7352, iMonCt r=2 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... 17:39:39 (7580): Can't acquire lockfile (32) - waiting 35s 17:40:14 (7580): Can't acquire lockfile (32) - exiting 17:40:14 (7580): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 18:40:26 (9520): Can't acquire lockfile (32) - waiting 35s 18:41:01 (9520): Can't acquire lockfile (32) - exiting 18:41:01 (9520): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 18:51:33 (8868): Can't acquire lockfile (32) - waiting 35s 18:52:08 (8868): Can't acquire lockfile (32) - exiting 18:52:08 (8868): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 20:22:21 (11052): Can't acquire lockfile (32) - waiting 35s 20:22:56 (11052): Can't acquire lockfile (32) - exiting 20:22:56 (11052): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 20:33:14 (2692): Can't acquire lockfile (32) - waiting 35s 20:33:49 (2692): Can't acquire lockfile (32) - exiting 20:33:49 (2692): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 21:37:41 (5744): Can't acquire lockfile (32) - waiting 35s 21:38:16 (5744): Can't acquire lockfile (32) - exiting 21:38:16 (5744): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 23:28:00 (9476): Can't acquire lockfile (32) - waiting 35s 23:28:35 (9476): Can't acquire lockfile (32) - exiting 23:28:35 (9476): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 00:29:27 (10576): Can't acquire lockfile (32) - waiting 35s 00:30:02 (10576): Can't acquire lockfile (32) - exiting 00:30:02 (10576): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 01:31:25 (8320): Can't acquire lockfile (32) - waiting 35s 01:32:00 (8320): Can't acquire lockfile (32) - exiting 01:32:00 (8320): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=11648, iMonCtr=2 15:11:54 (7608): Can't acquire lockfile (32) - waiting 35s 15:12:29 (7608): Can't acquire lockfile (32) - exiting 15:12:29 (7608): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 16:12:45 (3516): Can't acquire lockfile (32) - waiting 35s 16:13:20 (3516): Can't acquire lockfile (32) - exiting 16:13:20 (3516): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 16:23:28 (9076): Can't acquire lockfile (32) - waiting 35s 16:24:03 (9076): Can't acquire lockfile (32) - exiting 16:24:03 (9076): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 17:14:01 (10156): Can't acquire lockfile (32) - waiting 35s 17:14:37 (10156): Can't acquire lockfile (32) - exiting 17:14:37 (10156): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 17:28:19 (8464): Can't acquire lockfile (32) - waiting 35s 17:28:54 (8464): Can't acquire lockfile (32) - exiting 17:28:54 (8464): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 18:17:35 (8900): Can't acquire lockfile (32) - waiting 35s 18:18:10 (8900): Can't acquire lockfile (32) - exiting 18:18:10 (8900): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 18:30:23 (5764): Can't acquire lockfile (32) - waiting 35s 18:30:58 (5764): Can't acquire lockfile (32) - exiting 18:30:58 (5764): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 19:22:02 (8532): Can't acquire lockfile (32) - waiting 35s 19:22:37 (8532): Can't acquire lockfile (32) - exiting 19:22:37 (8532): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 19:52:51 (9184): Can't acquire lockfile (32) - waiting 35s 19:53:26 (9184): Can't acquire lockfile (32) - exiting 19:53:26 (9184): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 20:23:30 (5544): Can't acquire lockfile (32) - waiting 35s 20:24:05 (5544): Can't acquire lockfile (32) - exiting 20:24:05 (5544): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 20:55:33 (10024): Can't acquire lockfile (32) - waiting 35s 20:56:08 (10024): Can't acquire lockfile (32) - exiting 20:56:08 (10024): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 22:00:06 (8544): Can't acquire lockfile (32) - waiting 35s 22:00:41 (8544): Can't acquire lockfile (32) - exiting 22:00:41 (8544): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 22:11:29 (11692): Can't acquire lockfile (32) - waiting 35s 22:12:04 (11692): Can't acquire lockfile (32) - exiting 22:12:04 (11692): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 23:01:12 (4124): Can't acquire lockfile (32) - waiting 35s 23:01:47 (4124): Can't acquire lockfile (32) - exiting 23:01:47 (4124): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 23:14:26 (7176): Can't acquire lockfile (32) - waiting 35s 23:15:01 (7176): Can't acquire lockfile (32) - exiting 23:15:01 (7176): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) 00:03:25 (10580): Can't acquire lockfile (32) - waiting 35s 00:04:00 (10580): Can't acquire lockfile (32) - exiting 00:04:00 (10580): Error: Der Prozess kann nicht auf die Datei zugreifen, da sie von einem anderen Prozess verwendet wird. (0x20) Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7724, iMonCtr=2 Model crash detected, will try to restart... 15:48:05 (6880): No heartbeat from client for 30 sec - exiting 15:48:05 (6880): timer handler: client dead, exiting 15:48:06 (6880): No heartbeat from client for 30 sec - exiting 15:48:06 (6880): timer handler: client dead, exiting CPDN Monitor - No 'heartbeat' from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=7232, selfPID=7232, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7968, iMonCtr=2 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9284, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=7064, selfPID=8836, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=9068, selfPID=6124, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=5244, selfPID=1072, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=5472, selfPID=6500, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... 18:59:22 (6500): called boinc_finish(0) </stderr_txt> <message> upload failure: <file_xfer_error> <file_name>hadam3p_eu_9953_2014_0_010356934_0_11.zip</file_name> <error_code>-161 (not found)</error_code> </file_xfer_error> </message> ]]> |
Latest Trickles Received | ||||||
---|---|---|---|---|---|---|
Time Sent (UTC) | Host ID | Result ID | Result Name | Timestep | CPU Time (sec) | Average (sec/TS) |
23 Nov 2015 22:08:07 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 115,499 | 259,788 | 2.2493 |
23 Nov 2015 06:59:57 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 103,979 | 233,404 | 2.2447 |
22 Nov 2015 06:25:10 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 92,459 | 207,791 | 2.2474 |
21 Nov 2015 18:27:10 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 80,939 | 178,592 | 2.2065 |
17 Nov 2015 18:43:45 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 69,419 | 152,594 | 2.1982 |
16 Nov 2015 16:42:58 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 57,899 | 127,085 | 2.1949 |
14 Nov 2015 14:50:59 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 34,859 | 76,532 | 2.1955 |
12 Nov 2015 18:52:36 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 23,339 | 51,756 | 2.2176 |
11 Nov 2015 16:41:00 | 1348008 | 19044244 | hadam3p_eu_9953_2014_0_010356934_0 | 11,819 | 26,366 | 2.2308 |
©2024 cpdn.org