Task 16586692

Name	hadcm3n_89mj_1980_40_008721894_0
Workunit	8867872
Created	23 Apr 2014, 12:41:08 UTC
Sent	4 May 2014, 21:44:59 UTC
Report deadline	4 Aug 2014, 5:12:10 UTC
Received	10 Jun 2014, 21:11:00 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1237082
Run time	10 days 1 hours 7 min 1 sec
CPU time	9 days 14 hours 58 min 42 sec
Validate state	Invalid
Credit	5,598.72
Device peak FLOPS	2.30 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 22:07:02 (6496): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 05:59:50 (5404): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4116, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4424, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4424, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4424, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4424, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4424, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4424, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 Jun 2014 09:04:32	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	466,560	794,402	1.7027
01 Jun 2014 10:53:19	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	440,640	753,951	1.7110
31 May 2014 22:21:11	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	414,720	711,063	1.7146
31 May 2014 08:51:28	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	388,800	667,292	1.7163
30 May 2014 08:57:06	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	362,880	623,965	1.7195
29 May 2014 20:09:21	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	336,960	579,348	1.7193
29 May 2014 00:14:53	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	311,040	534,292	1.7178
28 May 2014 03:45:28	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	285,120	489,827	1.7180
27 May 2014 07:25:53	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	259,200	445,900	1.7203
26 May 2014 11:13:29	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	233,280	401,451	1.7209
17 May 2014 00:29:27	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	207,360	356,972	1.7215
16 May 2014 04:34:17	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	181,440	313,476	1.7277
14 May 2014 10:14:53	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	155,520	269,361	1.7320
13 May 2014 08:38:59	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	129,600	224,317	1.7308
12 May 2014 15:57:55	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	103,680	179,639	1.7326
11 May 2014 21:08:18	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	77,760	134,738	1.7327
09 May 2014 11:59:01	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	51,840	89,703	1.7304
06 May 2014 06:55:58	1237082	16586692	hadcm3n_89mj_1980_40_008721894_0	25,920	44,901	1.7323