Task 13285934

Name	hadcm3n_o4u9_1940_40_007419238_1
Workunit	7616873
Created	24 Aug 2011, 17:09:07 UTC
Sent	24 Aug 2011, 17:09:08 UTC
Report deadline	24 Nov 2011, 0:36:19 UTC
Received	26 Sep 2011, 4:42:58 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1135179
Run time	10 days 14 hours 14 min 57 sec
CPU time	9 days 1 hours 0 min 50 sec
Validate state	Invalid
Credit	4,665.60
Device peak FLOPS	2.66 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3836, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3836, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3836, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:54:49 (3308): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1064, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
24 Sep 2011 19:49:41	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	388,800	828,999	2.1322
21 Sep 2011 14:15:56	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	362,880	771,743	2.1267
18 Sep 2011 10:08:11	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	336,960	714,920	2.1217
16 Sep 2011 05:58:04	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	311,040	658,407	2.1168
12 Sep 2011 21:36:26	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	285,120	602,712	2.1139
11 Sep 2011 23:42:54	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	259,200	546,962	2.1102
10 Sep 2011 18:44:56	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	233,280	491,155	2.1054
09 Sep 2011 20:36:10	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	207,360	435,679	2.1011
08 Sep 2011 22:46:12	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	181,440	380,037	2.0946
08 Sep 2011 02:25:40	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	155,520	324,676	2.0877
06 Sep 2011 23:29:52	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	129,600	268,614	2.0726
06 Sep 2011 05:50:08	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	103,680	214,379	2.0677
05 Sep 2011 09:11:28	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	77,760	160,069	2.0585
30 Aug 2011 21:39:33	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	51,840	106,003	2.0448
29 Aug 2011 23:35:11	1135179	13285934	hadcm3n_o4u9_1940_40_007419238_1	25,920	52,685	2.0326