Task 16650360

Name	hadcm3n_8b6c_1980_40_008723903_1
Workunit	8869881
Created	29 May 2014, 14:23:11 UTC
Sent	29 May 2014, 14:23:34 UTC
Report deadline	28 Aug 2014, 21:50:45 UTC
Received	29 Jun 2014, 22:11:18 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1045292
Run time	12 days 7 hours 11 min 3 sec
CPU time	12 days 3 hours 19 min 6 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	3.05 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 16:06:52 (4468): No heartbeat from core client for 30 sec - exiting 16:06:53 (4468): No heartbeat from core client for 30 sec - exiting 16:06:54 (4468): No heartbeat from core client for 30 sec - exiting 16:06:55 (4468): No heartbeat from core client for 30 sec - exiting 16:06:56 (4468): No heartbeat from core client for 30 sec - exiting 16:06:57 (4468): No heartbeat from core client for 30 sec - exiting 16:06:58 (4468): No heartbeat from core client for 30 sec - exiting 16:06:59 (4468): No heartbeat from core client for 30 sec - exiting 16:07:00 (4468): No heartbeat from core client for 30 sec - exiting 16:07:01 (4468): No heartbeat from core client for 30 sec - exiting 16:07:03 (4468): No heartbeat from core client for 30 sec - exiting 16:07:04 (4468): No heartbeat from core client for 30 sec - exiting 16:07:05 (4468): No heartbeat from core client for 30 sec - exiting 16:07:06 (4468): No heartbeat from core client for 30 sec - exiting 16:07:07 (4468): No heartbeat from core client for 30 sec - exiting 16:07:08 (4468): No heartbeat from core client for 30 sec - exiting 16:07:09 (4468): No heartbeat from core client for 30 sec - exiting 16:07:10 (4468): No heartbeat from core client for 30 sec - exiting 16:07:11 (4468): No heartbeat from core client for 30 sec - exiting 16:07:12 (4468): No heartbeat from core client for 30 sec - exiting 16:07:13 (4468): No heartbeat from core client for 30 sec - exiting 16:07:15 (4468): No heartbeat from core client for 30 sec - exiting 16:07:16 (4468): No heartbeat from core client for 30 sec - exiting 16:07:17 (4468): No heartbeat from core client for 30 sec - exiting 16:07:18 (4468): No heartbeat from core client for 30 sec - exiting 16:07:19 (4468): No heartbeat from core client for 30 sec - exiting 16:07:20 (4468): No heartbeat from core client for 30 sec - exiting 16:07:21 (4468): No heartbeat from core client for 30 sec - exiting 16:07:22 (4468): No heartbeat from core client for 30 sec - exiting 16:07:23 (4468): No heartbeat from core client for 30 sec - exiting 16:07:24 (4468): No heartbeat from core client for 30 sec - exiting 16:07:25 (4468): No heartbeat from core client for 30 sec - exiting 16:07:27 (4468): No heartbeat from core client for 30 sec - exiting 16:07:28 (4468): No heartbeat from core client for 30 sec - exiting 16:07:29 (4468): No heartbeat from core client for 30 sec - exiting 16:07:30 (4468): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4080, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4080, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Jun 2014 03:33:30	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	492,480	1,025,730	2.0828
17 Jun 2014 12:16:23	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	466,560	971,186	2.0816
16 Jun 2014 21:39:38	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	440,640	920,465	2.0889
16 Jun 2014 07:38:16	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	414,720	870,281	2.0985
15 Jun 2014 17:26:59	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	388,800	819,644	2.1081
15 Jun 2014 03:10:47	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	362,880	769,283	2.1199
14 Jun 2014 15:09:46	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	336,960	726,297	2.1554
14 Jun 2014 00:53:24	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	311,040	674,987	2.1701
13 Jun 2014 12:27:10	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	285,120	630,314	2.2107
11 Jun 2014 02:51:25	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	259,200	576,069	2.2225
10 Jun 2014 09:24:37	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	233,280	519,039	2.2250
10 Jun 2014 09:03:37	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	207,360	466,504	2.2497
10 Jun 2014 09:02:13	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	181,440	412,859	2.2755
10 Jun 2014 09:01:10	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	155,520	355,093	2.2833
09 Jun 2014 18:05:43	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	129,600	296,995	2.2916
05 Jun 2014 06:54:31	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	103,680	240,451	2.3192
04 Jun 2014 16:37:20	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	77,760	180,233	2.3178
03 Jun 2014 19:58:42	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	51,840	119,161	2.2986
02 Jun 2014 01:05:45	1045292	16650360	hadcm3n_8b6c_1980_40_008723903_1	25,920	59,709	2.3036