Task 17257170

Name	hadcm3n_sd06_1940_40_009115068_0
Workunit	9245404
Created	22 Oct 2014, 15:41:31 UTC
Sent	23 Oct 2014, 1:03:19 UTC
Report deadline	22 Jan 2015, 8:30:30 UTC
Received	28 Nov 2014, 6:04:40 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1322977
Run time	10 days 7 hours 14 min 49 sec
CPU time	9 days 16 hours 28 min 30 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	2.67 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.4.27</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 22:44:58 (3900): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 23:55:31 (3928): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:55:32 (3928): No heartbeat from core client for 30 sec - exiting 23:55:33 (3928): No heartbeat from core client for 30 sec - exiting 23:55:34 (3928): No heartbeat from core client for 30 sec - exiting 23:55:35 (3928): No heartbeat from core client for 30 sec - exiting 23:55:36 (3928): No heartbeat from core client for 30 sec - exiting 23:55:37 (3928): No heartbeat from core client for 30 sec - exiting 23:55:38 (3928): No heartbeat from core client for 30 sec - exiting 23:55:39 (3928): No heartbeat from core client for 30 sec - exiting 23:55:40 (3928): No heartbeat from core client for 30 sec - exiting 23:55:41 (3928): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 02:59:31 (6140): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:59:32 (6140): No heartbeat from core client for 30 sec - exiting 02:59:33 (6140): No heartbeat from core client for 30 sec - exiting 02:59:34 (6140): No heartbeat from core client for 30 sec - exiting 02:59:35 (6140): No heartbeat from core client for 30 sec - exiting 02:59:36 (6140): No heartbeat from core client for 30 sec - exiting 02:59:37 (6140): No heartbeat from core client for 30 sec - exiting 02:59:38 (6140): No heartbeat from core client for 30 sec - exiting 02:59:39 (6140): No heartbeat from core client for 30 sec - exiting 02:59:40 (6140): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 04:12:36 (5012): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1184, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 22:12:03 (7812): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:27:16 (7552): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:40:53 (8676): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:59:18 (1472): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 22:45:38 (2336): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:49:14 (1644): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 05:58:45 (3000): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
28 Nov 2014 03:12:33	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	648,000	838,682	1.2943
26 Nov 2014 07:45:30	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	622,080	805,837	1.2954
23 Nov 2014 08:20:38	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	596,160	773,955	1.2982
20 Nov 2014 10:21:48	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	570,240	740,621	1.2988
17 Nov 2014 00:58:54	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	544,320	708,777	1.3021
13 Nov 2014 07:18:55	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	518,400	675,387	1.3028
11 Nov 2014 10:52:12	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	492,480	641,776	1.3032
11 Nov 2014 00:54:41	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	466,560	608,075	1.3033
10 Nov 2014 14:12:35	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	440,640	573,738	1.3021
10 Nov 2014 04:48:15	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	414,720	539,953	1.3020
09 Nov 2014 09:27:57	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	388,800	506,317	1.3023
07 Nov 2014 21:13:52	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	362,880	472,648	1.3025
06 Nov 2014 07:56:49	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	336,960	439,267	1.3036
04 Nov 2014 12:26:11	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	311,040	403,774	1.2981
02 Nov 2014 04:46:36	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	285,120	366,886	1.2868
01 Nov 2014 00:27:24	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	259,200	332,380	1.2823
31 Oct 2014 01:16:47	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	233,280	299,193	1.2825
30 Oct 2014 06:57:48	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	207,360	266,009	1.2828
29 Oct 2014 21:20:33	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	181,440	232,607	1.2820
28 Oct 2014 23:08:18	1322977	17257170	hadcm3n_sd06_1940_40_009115068_0	155,520	198,709	1.2777