Task 13347459

Name	hadcm3n_o13u_1940_40_007442843_1
Workunit	7640346
Created	8 Sep 2011, 22:22:17 UTC
Sent	8 Sep 2011, 22:26:36 UTC
Report deadline	9 Dec 2011, 5:53:47 UTC
Received	4 Oct 2011, 3:25:15 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1147692
Run time	15 days 6 hours 13 min 54 sec
CPU time	14 days 17 hours 22 min 11 sec
Validate state	Invalid
Credit	8,398.08
Device peak FLOPS	2.83 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5976, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7544, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7544, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7544, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7544, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6908, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6908, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Oct 2011 00:03:19	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	699,840	1,250,527	1.7869
24 Sep 2011 02:12:21	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	673,920	1,204,796	1.7877
23 Sep 2011 15:40:59	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	648,000	1,158,329	1.7875
22 Sep 2011 22:32:21	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	622,080	1,112,144	1.7878
22 Sep 2011 09:13:13	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	596,160	1,065,279	1.7869
21 Sep 2011 20:13:33	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	570,240	1,018,426	1.7860
21 Sep 2011 05:49:38	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	544,320	971,443	1.7847
20 Sep 2011 16:53:24	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	518,400	924,472	1.7833
20 Sep 2011 03:18:55	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	492,480	877,734	1.7823
19 Sep 2011 13:56:36	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	466,560	830,752	1.7806
19 Sep 2011 00:47:44	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	440,640	784,075	1.7794
18 Sep 2011 11:34:44	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	414,720	736,975	1.7770
17 Sep 2011 17:07:16	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	388,800	691,914	1.7796
17 Sep 2011 03:32:50	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	362,880	646,501	1.7816
16 Sep 2011 14:02:30	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	336,960	600,639	1.7825
16 Sep 2011 00:28:59	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	311,040	554,529	1.7828
15 Sep 2011 11:19:43	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	285,120	508,209	1.7824
14 Sep 2011 22:17:55	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	259,200	461,749	1.7814
14 Sep 2011 08:58:08	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	233,280	414,945	1.7787
13 Sep 2011 19:55:51	1147692	13347459	hadcm3n_o13u_1940_40_007442843_1	207,360	368,775	1.7784