Task 15855892

Name	hadcm3n_zkxn_1960_40_008393744_1
Workunit	8544603
Created	22 Jun 2013, 1:09:23 UTC
Sent	22 Jun 2013, 17:33:29 UTC
Report deadline	22 Sep 2013, 1:00:40 UTC
Received	3 Sep 2013, 18:59:54 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1185663
Run time	6 days 9 hours 47 min 50 sec
CPU time	5 days 3 hours 48 min 53 sec
Validate state	Invalid
Credit	5,598.72
Device peak FLOPS	3.24 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5056, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5056, iMonCtr=1 Model crash detected, will try to restart... 13:24:25 (5056): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5904, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5904, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5904, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5904, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Sep 2013 11:36:35	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	466,560	422,978	0.9066
03 Sep 2013 03:28:15	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	440,640	399,353	0.9063
02 Sep 2013 20:30:16	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	414,720	375,742	0.9060
02 Sep 2013 11:30:17	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	388,800	352,143	0.9057
02 Sep 2013 04:27:21	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	362,880	328,508	0.9053
01 Sep 2013 20:24:12	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	336,960	304,929	0.9049
01 Sep 2013 12:30:40	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	311,040	281,311	0.9044
01 Sep 2013 03:22:25	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	285,120	257,793	0.9042
31 Aug 2013 17:54:09	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	259,200	234,329	0.9040
31 Aug 2013 08:19:33	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	233,280	210,708	0.9032
31 Aug 2013 00:00:59	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	207,360	187,378	0.9036
30 Aug 2013 15:34:04	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	181,440	163,988	0.9038
30 Aug 2013 06:36:42	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	155,520	140,465	0.9032
29 Aug 2013 21:05:58	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	129,600	116,860	0.9017
29 Aug 2013 13:06:49	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	103,680	93,226	0.8992
29 Aug 2013 03:33:00	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	77,760	69,653	0.8957
28 Aug 2013 18:20:51	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	51,840	46,398	0.8950
28 Aug 2013 10:23:41	1185663	15855892	hadcm3n_zkxn_1960_40_008393744_1	25,920	23,273	0.8979