Task 15505139

Name	hadcm3n_z9mz_1960_40_008271760_0
Workunit	8426884
Created	24 Dec 2012, 7:21:56 UTC
Sent	25 Dec 2012, 21:53:05 UTC
Report deadline	27 Mar 2013, 5:20:16 UTC
Received	11 Mar 2013, 16:54:42 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1180870
Run time	11 days 4 hours 9 min 17 sec
CPU time	10 days 12 hours 53 min 6 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	2.74 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.44</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:26:24 (4964): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:00:56 (2436): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on z9mzko.dah0c20 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:49:14 (888): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5480, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5480, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5480, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5480, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5480, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1180, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
11 Mar 2013 13:15:07	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	596,160	908,888	1.5246
10 Mar 2013 17:10:54	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	570,240	870,382	1.5263
10 Mar 2013 17:10:54	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	544,320	826,376	1.5182
08 Mar 2013 03:44:53	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	518,400	792,868	1.5295
08 Mar 2013 03:44:53	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	492,480	758,648	1.5405
03 Mar 2013 11:56:33	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	466,560	722,102	1.5477
03 Mar 2013 00:03:45	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	440,640	681,865	1.5474
02 Mar 2013 13:55:20	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	414,720	641,920	1.5478
02 Mar 2013 13:55:20	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	388,800	600,552	1.5446
02 Mar 2013 13:55:20	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	362,880	558,741	1.5397
02 Mar 2013 13:55:20	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	336,960	517,687	1.5363
25 Feb 2013 05:58:46	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	311,040	477,390	1.5348
21 Jan 2013 14:00:31	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	285,120	439,569	1.5417
21 Jan 2013 14:00:31	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	259,200	395,957	1.5276
20 Jan 2013 13:45:32	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	233,280	351,617	1.5073
20 Jan 2013 13:45:32	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	207,360	309,454	1.4924
08 Jan 2013 13:30:20	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	181,440	269,038	1.4828
08 Jan 2013 13:30:20	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	155,520	230,258	1.4806
08 Jan 2013 13:30:20	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	129,600	191,578	1.4782
31 Dec 2012 12:50:14	1180870	15505139	hadcm3n_z9mz_1960_40_008271760_0	103,680	153,460	1.4801