Task 13674743

Name	hadcm3n_y9m9_1940_40_007547924_4
Workunit	7745156
Created	29 Nov 2011, 23:16:13 UTC
Sent	29 Nov 2011, 23:22:16 UTC
Report deadline	29 Feb 2012, 6:49:27 UTC
Received	2 Jan 2012, 20:20:09 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	972599
Run time	12 days 15 hours 12 min 34 sec
CPU time	8 days 11 hours 33 min 59 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	2.79 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:12:22 (5648): No heartbeat from core client for 30 sec - exiting 15:12:23 (5648): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:12:24 (5648): No heartbeat from core client for 30 sec - exiting 15:12:25 (5648): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:00:59 (6024): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:08:53 (5704): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:15:27 (4868): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 08:48:41 (8036): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:54:40 (8072): No heartbeat from core client for 30 sec - exiting 20:54:41 (8072): No heartbeat from core client for 30 sec - exiting 20:54:42 (8072): No heartbeat from core client for 30 sec - exiting 20:54:43 (8072): No heartbeat from core client for 30 sec - exiting 20:54:44 (8072): No heartbeat from core client for 30 sec - exiting 20:54:45 (8072): No heartbeat from core client for 30 sec - exiting 20:54:46 (8072): No heartbeat from core client for 30 sec - exiting 20:54:47 (8072): No heartbeat from core client for 30 sec - exiting 20:54:48 (8072): No heartbeat from core client for 30 sec - exiting 20:54:49 (8072): No heartbeat from core client for 30 sec - exiting 20:54:50 (8072): No heartbeat from core client for 30 sec - exiting 20:54:51 (8072): No heartbeat from core client for 30 sec - exiting 20:54:52 (8072): No heartbeat from core client for 30 sec - exiting 20:54:53 (8072): No heartbeat from core client for 30 sec - exiting 20:54:54 (8072): No heartbeat from core client for 30 sec - exiting 20:54:55 (8072): No heartbeat from core client for 30 sec - exiting 20:54:56 (8072): No heartbeat from core client for 30 sec - exiting 20:54:57 (8072): No heartbeat from core client for 30 sec - exiting 20:54:58 (8072): No heartbeat from core client for 30 sec - exiting 20:54:59 (8072): No heartbeat from core client for 30 sec - exiting 20:55:00 (8072): No heartbeat from core client for 30 sec - exiting 20:55:01 (8072): No heartbeat from core client for 30 sec - exiting 20:55:02 (8072): No heartbeat from core client for 30 sec - exiting 20:55:03 (8072): No heartbeat from core client for 30 sec - exiting 20:55:04 (8072): No heartbeat from core client for 30 sec - exiting 20:55:05 (8072): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 02:30:35 (7116): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 02:30:36 (2792): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 02:35:26 (5228): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 10:15:10 (2752): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 20:17:39 (5520): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:35:43 (4500): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 16:03:52 (8108): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:22:13 (2636): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 12:59:20 (1644): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:41:38 (7632): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:50:27 (7516): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7856, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7856, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7856, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7856, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7856, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7856, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Jan 2012 11:35:27	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	492,480	723,553	1.4692
01 Jan 2012 15:53:58	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	466,560	687,122	1.4727
31 Dec 2011 19:38:04	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	440,640	650,424	1.4761
30 Dec 2011 16:03:10	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	414,720	613,971	1.4804
29 Dec 2011 18:34:10	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	388,800	577,022	1.4841
28 Dec 2011 14:06:05	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	362,880	539,948	1.4880
27 Dec 2011 16:24:12	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	336,960	501,743	1.4890
26 Dec 2011 11:55:46	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	311,040	464,856	1.4945
25 Dec 2011 19:11:02	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	285,120	427,165	1.4982
24 Dec 2011 21:05:43	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	259,200	389,084	1.5011
24 Dec 2011 06:04:28	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	233,280	351,337	1.5061
23 Dec 2011 06:00:36	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	207,360	313,649	1.5126
21 Dec 2011 23:00:19	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	181,440	275,579	1.5188
13 Dec 2011 23:55:20	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	155,520	235,891	1.5168
13 Dec 2011 06:04:52	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	129,600	195,134	1.5057
12 Dec 2011 07:18:00	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	103,680	155,834	1.5030
10 Dec 2011 18:45:49	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	77,760	117,278	1.5082
08 Dec 2011 21:59:52	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	51,840	77,997	1.5046
08 Dec 2011 06:02:22	972599	13674743	hadcm3n_y9m9_1940_40_007547924_4	25,920	39,290	1.5158