Task 15885702

Name	hadcm3n_3g8t_1940_40_008267032_3
Workunit	8422156
Created	8 Jul 2013, 18:46:01 UTC
Sent	12 Jul 2013, 0:29:16 UTC
Report deadline	11 Oct 2013, 7:56:27 UTC
Received	18 Jul 2013, 11:03:42 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1282455
Run time	2 days 5 hours 55 min 24 sec
CPU time	2 days 5 hours 40 min 16 sec
Validate state	Invalid
Credit	3,110.40
Device peak FLOPS	3.31 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 17:48:22 (5356): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:52:41 (5984): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 16:16:33 (6928): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 05:16:46 (8616): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:55:32 (7572): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:55:33 (7572): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7768, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7768, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7768, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7768, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7768, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7768, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
23 Jul 2013 14:33:21	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	259,200	183,994	0.7099
23 Jul 2013 14:33:21	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	233,280	165,680	0.7102
23 Jul 2013 14:33:21	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	207,360	147,401	0.7108
23 Jul 2013 14:33:21	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	181,440	129,187	0.7120
23 Jul 2013 14:33:21	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	155,520	110,971	0.7135
23 Jul 2013 14:33:20	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	129,600	92,565	0.7142
23 Jul 2013 14:33:20	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	103,680	74,010	0.7138
23 Jul 2013 14:33:20	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	77,760	55,693	0.7162
23 Jul 2013 14:33:20	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	51,840	37,166	0.7169
23 Jul 2013 14:33:20	1282455	15885702	hadcm3n_3g8t_1940_40_008267032_3	25,920	18,617	0.7182