Task 16099830

Name	hadcm3n_78vx_1980_40_008422800_1
Workunit	8573656
Created	29 Nov 2013, 6:18:34 UTC
Sent	29 Nov 2013, 6:18:42 UTC
Report deadline	28 Feb 2014, 13:45:53 UTC
Received	16 Jan 2014, 17:40:20 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1303978
Run time	32 days 15 hours 21 min 38 sec
CPU time	26 days 7 hours 48 min 40 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	2.00 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 03:43:05 (9168): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:31:34 (9544): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:59:57 (9836): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:40:10 (11364): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:45:42 (5644): No heartbeat from core client for 30 sec - exiting 07:45:43 (5644): No heartbeat from core client for 30 sec - exiting 07:45:44 (5644): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:02:48 (712): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:50:03 (8320): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 06:01:02 (6820): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:01:15 (4940): Can't acquire lockfile (32) - waiting 35s 17:02:07 (4940): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:07:26 (6220): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:07:28 (6220): No heartbeat from core client for 30 sec - exiting 13:55:12 (8736): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:21:51 (8776): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:21:52 (8776): No heartbeat from core client for 30 sec - exiting 18:21:54 (8776): No heartbeat from core client for 30 sec - exiting 18:21:55 (8776): No heartbeat from core client for 30 sec - exiting 19:01:40 (8168): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:01:41 (8168): No heartbeat from core client for 30 sec - exiting 13:11:54 (11776): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:04:27 (7860): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:23:50 (6812): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:23:51 (6812): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 18:05:48 (8588): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:20:57 (9760): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:36:22 (1432): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6812, iMonCtr=1 Model crash detected, will try to restart... 04:42:41 (352): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:06:48 (1164): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 11:45:41 (8008): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 11:45:55 (11488): Can't acquire lockfile (32) - waiting 35s 12:29:41 (11488): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:56:23 (5768): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
16 Jan 2014 04:42:35	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	596,160	2,269,177	3.8063
13 Jan 2014 12:11:32	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	570,240	2,161,986	3.7914
11 Jan 2014 09:02:42	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	544,320	2,045,557	3.7580
05 Jan 2014 13:20:54	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	518,400	1,933,354	3.7295
03 Jan 2014 15:22:42	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	492,480	1,828,952	3.7138
01 Jan 2014 13:10:34	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	466,560	1,734,347	3.7173
31 Dec 2013 08:09:39	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	440,640	1,641,131	3.7244
30 Dec 2013 03:10:38	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	414,720	1,549,286	3.7357
28 Dec 2013 22:10:20	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	388,800	1,456,809	3.7469
27 Dec 2013 15:07:45	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	362,880	1,363,387	3.7571
26 Dec 2013 05:07:57	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	336,960	1,271,497	3.7734
25 Dec 2013 01:03:46	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	311,040	1,182,320	3.8012
23 Dec 2013 06:00:31	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	285,120	1,088,800	3.8187
20 Dec 2013 22:13:52	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	259,200	998,482	3.8522
19 Dec 2013 02:13:28	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	233,280	897,381	3.8468
14 Dec 2013 05:44:42	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	181,440	693,192	3.8205
08 Dec 2013 23:20:25	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	155,520	602,534	3.8743
07 Dec 2013 20:48:57	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	129,600	510,673	3.9404
05 Dec 2013 04:01:10	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	103,680	412,670	3.9802
03 Dec 2013 17:14:39	1303978	16099830	hadcm3n_78vx_1980_40_008422800_1	77,760	306,683	3.9440