Task 16044243

Name	hadcm3n_oe7l_1900_40_008473540_0
Workunit	8624379
Created	27 Sep 2013, 10:22:06 UTC
Sent	28 Sep 2013, 23:03:02 UTC
Report deadline	29 Dec 2013, 6:30:13 UTC
Received	8 Oct 2013, 12:47:50 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1267833
Run time	5 days 15 hours 22 min 38 sec
CPU time	5 days 1 hours 38 min 57 sec
Validate state	Invalid
Credit	6,531.84
Device peak FLOPS	4.38 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:30:59 (4804): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4252, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4252, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4252, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4252, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4252, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4252, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
08 Oct 2013 01:49:55	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	544,320	430,907	0.7916
07 Oct 2013 19:55:48	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	518,400	409,664	0.7902
07 Oct 2013 14:33:41	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	492,480	389,680	0.7913
06 Oct 2013 23:13:36	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	466,560	369,146	0.7912
06 Oct 2013 17:24:00	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	440,640	348,400	0.7907
06 Oct 2013 03:57:01	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	414,720	326,878	0.7882
05 Oct 2013 18:02:03	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	388,800	305,618	0.7861
05 Oct 2013 12:15:15	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	362,880	284,827	0.7849
04 Oct 2013 21:38:49	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	336,960	263,394	0.7817
04 Oct 2013 04:13:53	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	311,040	242,199	0.7787
03 Oct 2013 23:06:18	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	285,120	223,853	0.7851
03 Oct 2013 17:52:47	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	259,200	205,099	0.7913
03 Oct 2013 01:07:41	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	233,280	183,534	0.7868
02 Oct 2013 17:12:45	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	207,360	162,569	0.7840
02 Oct 2013 12:18:08	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	181,440	141,966	0.7824
01 Oct 2013 21:31:00	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	155,520	121,902	0.7838
01 Oct 2013 16:40:15	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	129,600	104,442	0.8059
30 Sep 2013 19:19:03	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	103,680	83,558	0.8059
30 Sep 2013 02:27:22	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	77,760	61,751	0.7941
29 Sep 2013 20:44:43	1267833	16044243	hadcm3n_oe7l_1900_40_008473540_0	51,840	41,378	0.7982