Task 15461773

Name	hadcm3n_zhs0_1880_40_008253527_2
Workunit	8408651
Created	26 Nov 2012, 12:03:58 UTC
Sent	26 Nov 2012, 12:04:35 UTC
Report deadline	25 Feb 2013, 19:31:46 UTC
Received	3 Dec 2012, 22:45:08 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1253874
Run time	5 days 18 hours 44 min 10 sec
CPU time	5 days 17 hours 26 min 27 sec
Validate state	Invalid
Credit	6,531.84
Device peak FLOPS	3.42 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7316, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Dec 2012 15:20:49	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	544,320	471,029	0.8654
03 Dec 2012 05:43:46	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	518,400	438,536	0.8459
02 Dec 2012 20:30:57	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	492,480	405,922	0.8242
02 Dec 2012 10:13:54	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	466,560	374,091	0.8018
02 Dec 2012 01:02:10	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	440,640	341,381	0.7747
01 Dec 2012 18:30:13	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	414,720	319,647	0.7708
01 Dec 2012 14:02:28	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	388,800	296,894	0.7636
01 Dec 2012 00:34:24	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	362,880	274,795	0.7573
30 Nov 2012 15:04:06	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	336,960	255,678	0.7588
30 Nov 2012 09:57:04	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	311,040	237,206	0.7626
30 Nov 2012 05:00:59	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	285,120	219,406	0.7695
29 Nov 2012 23:24:39	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	259,200	201,252	0.7764
29 Nov 2012 16:13:41	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	233,280	176,771	0.7578
29 Nov 2012 09:02:36	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	207,360	152,783	0.7368
28 Nov 2012 19:14:54	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	181,440	129,594	0.7143
28 Nov 2012 11:52:28	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	155,520	111,321	0.7158
28 Nov 2012 06:41:16	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	129,600	93,162	0.7188
28 Nov 2012 01:14:59	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	103,680	74,388	0.7175
27 Nov 2012 20:07:13	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	77,760	55,955	0.7196
27 Nov 2012 14:29:49	1253874	15461773	hadcm3n_zhs0_1880_40_008253527_2	51,840	38,122	0.7354