Task 15596698

Name	hadcm3n_4bno_1940_40_008309584_0
Workunit	8460719
Created	7 Feb 2013, 21:41:30 UTC
Sent	7 Feb 2013, 21:49:45 UTC
Report deadline	10 May 2013, 5:16:56 UTC
Received	7 Apr 2013, 8:56:27 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	21541
Run time	7 days 20 hours 28 min 42 sec
CPU time	7 days 9 hours 12 min 28 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	3.61 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.56</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 12:25:22 (4692): No heartbeat from core client for 30 sec - exiting 12:25:23 (4692): No heartbeat from core client for 30 sec - exiting 12:25:25 (4692): No heartbeat from core client for 30 sec - exiting 12:25:26 (4692): No heartbeat from core client for 30 sec - exiting 12:25:27 (4692): No heartbeat from core client for 30 sec - exiting 12:25:28 (4692): No heartbeat from core client for 30 sec - exiting 12:25:29 (4692): No heartbeat from core client for 30 sec - exiting 12:25:30 (4692): No heartbeat from core client for 30 sec - exiting 12:25:31 (4692): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 11:52:24 (4144): No heartbeat from core client for 30 sec - exiting 11:52:25 (4144): No heartbeat from core client for 30 sec - exiting 11:52:26 (4144): No heartbeat from core client for 30 sec - exiting 11:52:27 (4144): No heartbeat from core client for 30 sec - exiting 11:52:28 (4144): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 12:22:28 (4160): No heartbeat from core client for 30 sec - exiting 12:22:29 (4160): No heartbeat from core client for 30 sec - exiting 12:22:30 (4160): No heartbeat from core client for 30 sec - exiting 12:22:31 (4160): No heartbeat from core client for 30 sec - exiting 12:22:32 (4160): No heartbeat from core client for 30 sec - exiting 12:22:33 (4160): No heartbeat from core client for 30 sec - exiting 12:22:34 (4160): No heartbeat from core client for 30 sec - exiting 12:22:35 (4160): No heartbeat from core client for 30 sec - exiting 12:22:36 (4160): No heartbeat from core client for 30 sec - exiting 12:22:38 (4160): No heartbeat from core client for 30 sec - exiting 12:22:39 (4160): No heartbeat from core client for 30 sec - exiting 12:22:40 (4160): No heartbeat from core client for 30 sec - exiting 12:22:41 (4160): No heartbeat from core client for 30 sec - exiting 12:22:42 (4160): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:22:43 (4160): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 13:02:18 (4904): No heartbeat from core client for 30 sec - exiting 13:02:19 (4904): No heartbeat from core client for 30 sec - exiting 13:02:20 (4904): No heartbeat from core client for 30 sec - exiting 13:02:21 (4904): No heartbeat from core client for 30 sec - exiting 13:02:22 (4904): No heartbeat from core client for 30 sec - exiting 13:02:23 (4904): No heartbeat from core client for 30 sec - exiting 13:02:24 (4904): No heartbeat from core client for 30 sec - exiting 13:02:25 (4904): No heartbeat from core client for 30 sec - exiting 13:02:26 (4904): No heartbeat from core client for 30 sec - exiting 13:02:27 (4904): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3284, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3284, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3284, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3284, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3284, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3284, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
06 Apr 2013 16:26:10	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	570,240	624,424	1.0950
06 Apr 2013 07:48:14	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	544,320	595,776	1.0945
24 Mar 2013 09:57:26	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	518,400	566,348	1.0925
23 Mar 2013 13:30:01	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	492,480	537,576	1.0916
21 Mar 2013 20:43:51	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	466,560	510,192	1.0935
19 Mar 2013 19:40:32	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	440,640	482,943	1.0960
17 Mar 2013 19:42:31	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	414,720	455,941	1.0994
17 Mar 2013 11:59:42	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	388,800	429,956	1.1059
16 Mar 2013 11:54:18	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	362,880	404,289	1.1141
13 Mar 2013 15:30:32	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	336,960	378,397	1.1230
10 Mar 2013 14:30:22	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	311,040	352,547	1.1334
24 Feb 2013 15:31:14	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	285,120	326,511	1.1452
15 Feb 2013 13:30:13	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	259,200	296,882	1.1454
14 Feb 2013 16:55:55	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	233,280	266,464	1.1422
13 Feb 2013 19:50:36	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	207,360	236,549	1.1408
12 Feb 2013 21:43:52	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	181,440	207,414	1.1432
12 Feb 2013 13:10:24	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	155,520	178,120	1.1453
11 Feb 2013 16:25:58	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	129,600	148,928	1.1491
10 Feb 2013 20:26:29	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	103,680	118,942	1.1472
10 Feb 2013 11:37:50	21541	15596698	hadcm3n_4bno_1940_40_008309584_0	77,760	88,519	1.1384