Task 15493493

Name	hadcm3n_3a28_1940_40_008264528_0
Workunit	8419652
Created	21 Dec 2012, 9:11:41 UTC
Sent	23 Dec 2012, 2:27:32 UTC
Report deadline	24 Mar 2013, 9:54:43 UTC
Received	30 Dec 2012, 18:18:54 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1244729
Run time	7 days 11 hours 35 min 23 sec
CPU time	6 days 22 hours 42 min 8 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	3.64 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 09:36:13 (6208): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:36:14 (6208): No heartbeat from core client for 30 sec - exiting 09:36:15 (6208): No heartbeat from core client for 30 sec - exiting 09:36:16 (6208): No heartbeat from core client for 30 sec - exiting 09:36:17 (6208): No heartbeat from core client for 30 sec - exiting 09:36:18 (6208): No heartbeat from core client for 30 sec - exiting 09:36:19 (6208): No heartbeat from core client for 30 sec - exiting 09:36:20 (6208): No heartbeat from core client for 30 sec - exiting 09:36:21 (6208): No heartbeat from core client for 30 sec - exiting 09:36:22 (6208): No heartbeat from core client for 30 sec - exiting 09:36:23 (6208): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 04:14:58 (7352): No heartbeat from core client for 30 sec - exiting 04:15:18 (7352): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:33:11 (7456): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:40:07 (7364): No heartbeat from core client for 30 sec - exiting 04:40:11 (7364): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:48:11 (7612): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1956, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1956, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1956, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1956, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1956, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1956, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
30 Dec 2012 10:09:49	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	518,400	591,929	1.1418
30 Dec 2012 00:47:22	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	492,480	560,413	1.1379
29 Dec 2012 14:52:02	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	466,560	529,519	1.1349
29 Dec 2012 05:19:34	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	440,640	498,648	1.1316
28 Dec 2012 20:00:25	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	414,720	467,687	1.1277
28 Dec 2012 11:10:00	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	388,800	437,342	1.1249
28 Dec 2012 02:23:05	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	362,880	407,098	1.1219
27 Dec 2012 17:32:26	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	336,960	377,032	1.1189
27 Dec 2012 08:54:25	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	311,040	347,450	1.1171
27 Dec 2012 00:17:32	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	285,120	317,580	1.1138
26 Dec 2012 15:40:31	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	259,200	288,334	1.1124
26 Dec 2012 07:13:38	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	233,280	259,273	1.1114
25 Dec 2012 23:31:58	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	207,360	229,710	1.1078
25 Dec 2012 14:25:45	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	181,440	200,581	1.1055
25 Dec 2012 06:12:00	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	155,520	171,452	1.1024
24 Dec 2012 21:14:05	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	129,600	142,789	1.1018
24 Dec 2012 12:45:16	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	103,680	114,257	1.1020
24 Dec 2012 04:26:36	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	77,760	85,629	1.1012
23 Dec 2012 19:53:50	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	51,840	56,937	1.0983
23 Dec 2012 11:28:38	1244729	15493493	hadcm3n_3a28_1940_40_008264528_0	25,920	28,273	1.0908