Task 13584965

Name	hadcm3n_yaaz_1900_40_007523263_3
Workunit	7720738
Created	2 Nov 2011, 9:10:29 UTC
Sent	2 Nov 2011, 9:13:47 UTC
Report deadline	1 Feb 2012, 16:40:58 UTC
Received	7 Dec 2011, 9:20:34 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	923317
Run time	15 days 5 hours 51 min 1 sec
CPU time	12 days 18 hours 12 min 13 sec
Validate state	Invalid
Credit	8,709.12
Device peak FLOPS	2.89 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:53:05 (3124): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:44:06 (7012): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 06:42:58 (4924): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 06:24:09 (6736): No heartbeat from core client for 30 sec - exiting 06:24:10 (6736): No heartbeat from core client for 30 sec - exiting 06:24:11 (6736): No heartbeat from core client for 30 sec - exiting 06:24:12 (6736): No heartbeat from core client for 30 sec - exiting 06:24:13 (6736): No heartbeat from core client for 30 sec - exiting 06:24:14 (6736): No heartbeat from core client for 30 sec - exiting 06:24:15 (6736): No heartbeat from core client for 30 sec - exiting 06:24:16 (6736): No heartbeat from core client for 30 sec - exiting 06:24:17 (6736): No heartbeat from core client for 30 sec - exiting 06:24:19 (6736): No heartbeat from core client for 30 sec - exiting 06:24:20 (6736): No heartbeat from core client for 30 sec - exiting 06:24:22 (6736): No heartbeat from core client for 30 sec - exiting 06:24:23 (6736): No heartbeat from core client for 30 sec - exiting 06:24:24 (6736): No heartbeat from core client for 30 sec - exiting 06:24:25 (6736): No heartbeat from core client for 30 sec - exiting 06:24:26 (6736): No heartbeat from core client for 30 sec - exiting 06:24:27 (6736): No heartbeat from core client for 30 sec - exiting 06:24:28 (6736): No heartbeat from core client for 30 sec - exiting 06:24:29 (6736): No heartbeat from core client for 30 sec - exiting 06:24:30 (6736): No heartbeat from core client for 30 sec - exiting 06:24:31 (6736): No heartbeat from core client for 30 sec - exiting 06:24:32 (6736): No heartbeat from core client for 30 sec - exiting 06:24:33 (6736): No heartbeat from core client for 30 sec - exiting 06:24:34 (6736): No heartbeat from core client for 30 sec - exiting 06:24:35 (6736): No heartbeat from core client for 30 sec - exiting 06:24:36 (6736): No heartbeat from core client for 30 sec - exiting 06:24:37 (6736): No heartbeat from core client for 30 sec - exiting 06:24:38 (6736): No heartbeat from core client for 30 sec - exiting 06:24:39 (6736): No heartbeat from core client for 30 sec - exiting 06:24:40 (6736): No heartbeat from core client for 30 sec - exiting 06:24:41 (6736): No heartbeat from core client for 30 sec - exiting 06:24:42 (6736): No heartbeat from core client for 30 sec - exiting 06:24:43 (6736): No heartbeat from core client for 30 sec - exiting 06:24:44 (6736): No heartbeat from core client for 30 sec - exiting 06:24:45 (6736): No heartbeat from core client for 30 sec - exiting 06:24:46 (6736): No heartbeat from core client for 30 sec - exiting 06:24:47 (6736): No heartbeat from core client for 30 sec - exiting 06:24:48 (6736): No heartbeat from core client for 30 sec - exiting 06:24:49 (6736): No heartbeat from core client for 30 sec - exiting 06:24:50 (6736): No heartbeat from core client for 30 sec - exiting 06:24:51 (6736): No heartbeat from core client for 30 sec - exiting 06:24:52 (6736): No heartbeat from core client for 30 sec - exiting 06:24:53 (6736): No heartbeat from core client for 30 sec - exiting 06:24:54 (6736): No heartbeat from core client for 30 sec - exiting 06:24:55 (6736): No heartbeat from core client for 30 sec - exiting 06:24:56 (6736): No heartbeat from core client for 30 sec - exiting 06:24:57 (6736): No heartbeat from core client for 30 sec - exiting 06:24:58 (6736): No heartbeat from core client for 30 sec - exiting 06:24:59 (6736): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:25:00 (6736): No heartbeat from core client for 30 sec - exiting 06:25:01 (6736): No heartbeat from core client for 30 sec - exiting 06:25:02 (6736): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 05:26:43 (7936): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 00:09:45 (7536): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:09:46 (7536): No heartbeat from core client for 30 sec - exiting 00:09:47 (7536): No heartbeat from core client for 30 sec - exiting 00:09:48 (7536): No heartbeat from core client for 30 sec - exiting 00:09:49 (7536): No heartbeat from core client for 30 sec - exiting 00:09:50 (7536): No heartbeat from core client for 30 sec - exiting 00:09:51 (7536): No heartbeat from core client for 30 sec - exiting 00:09:52 (7536): No heartbeat from core client for 30 sec - exiting 00:09:53 (7536): No heartbeat from core client for 30 sec - exiting 00:09:54 (7536): No heartbeat from core client for 30 sec - exiting 00:09:55 (7536): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4812, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4812, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4812, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4812, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5636, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5636, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
06 Dec 2011 22:47:13	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	725,760	1,082,444	1.4915
05 Dec 2011 14:02:32	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	699,840	1,042,874	1.4902
05 Dec 2011 00:54:02	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	673,920	1,002,749	1.4879
03 Dec 2011 22:47:17	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	648,000	969,559	1.4962
03 Dec 2011 00:24:05	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	622,080	928,477	1.4925
01 Dec 2011 23:09:21	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	596,160	889,000	1.4912
30 Nov 2011 22:57:11	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	570,240	848,548	1.4881
30 Nov 2011 01:44:23	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	544,320	810,608	1.4892
28 Nov 2011 22:12:25	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	518,400	772,277	1.4897
27 Nov 2011 00:03:05	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	492,480	732,869	1.4881
25 Nov 2011 22:31:45	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	466,560	694,996	1.4896
23 Nov 2011 21:53:18	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	440,640	654,930	1.4863
22 Nov 2011 23:20:13	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	414,720	617,501	1.4890
21 Nov 2011 23:56:27	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	388,800	576,477	1.4827
20 Nov 2011 10:13:07	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	362,880	538,112	1.4829
19 Nov 2011 22:15:16	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	336,960	499,974	1.4838
18 Nov 2011 09:34:23	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	311,040	460,305	1.4799
17 Nov 2011 09:03:26	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	285,120	423,749	1.4862
16 Nov 2011 21:55:24	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	259,200	387,662	1.4956
15 Nov 2011 21:14:04	923317	13584965	hadcm3n_yaaz_1900_40_007523263_3	233,280	349,809	1.4995