Task 15675357

Name	hadcm3n_3ipl_1940_40_008259316_1
Workunit	8414440
Created	21 Mar 2013, 21:35:58 UTC
Sent	21 Mar 2013, 21:36:04 UTC
Report deadline	21 Jun 2013, 5:03:15 UTC
Received	6 Apr 2013, 12:14:43 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1246907
Run time	11 days 23 hours 9 min 20 sec
CPU time	10 days 10 hours 38 min 26 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	2.29 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 14:13:46 (232): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
05 Apr 2013 20:51:38	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	440,640	872,129	1.9792
05 Apr 2013 05:08:11	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	414,720	820,772	1.9791
04 Apr 2013 03:58:48	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	388,800	769,438	1.9790
01 Apr 2013 19:26:46	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	362,880	718,248	1.9793
01 Apr 2013 04:12:50	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	336,960	666,964	1.9794
31 Mar 2013 03:27:46	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	311,040	615,672	1.9794
30 Mar 2013 11:30:14	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	285,120	564,147	1.9786
29 Mar 2013 14:55:32	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	259,200	512,945	1.9790
28 Mar 2013 08:53:42	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	233,280	460,602	1.9745
27 Mar 2013 16:40:50	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	207,360	409,055	1.9727
27 Mar 2013 01:24:25	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	181,440	358,792	1.9775
26 Mar 2013 01:38:23	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	155,520	308,447	1.9833
25 Mar 2013 09:32:26	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	129,600	257,015	1.9831
24 Mar 2013 16:50:43	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	103,680	205,266	1.9798
24 Mar 2013 00:24:17	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	77,760	153,836	1.9783
23 Mar 2013 07:57:57	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	51,840	102,552	1.9782
22 Mar 2013 15:40:31	1246907	15675357	hadcm3n_3ipl_1940_40_008259316_1	25,920	51,639	1.9922