Task 13681216

Name	hadcm3n_t6sc_1940_40_007548118_2
Workunit	7745350
Created	1 Dec 2011, 15:31:51 UTC
Sent	1 Dec 2011, 15:48:42 UTC
Report deadline	1 Mar 2012, 23:15:53 UTC
Received	31 Dec 2011, 15:43:56 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1168700
Run time	14 days 22 hours 34 min 42 sec
CPU time	14 days 5 hours 20 min 52 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	2.82 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... 08:13:21 (6684): No heartbeat from core client for 30 sec - exiting 08:13:22 (6684): No heartbeat from core client for 30 sec - exiting 08:13:23 (6684): No heartbeat from core client for 30 sec - exiting 08:13:24 (6684): No heartbeat from core client for 30 sec - exiting 08:13:25 (6684): No heartbeat from core client for 30 sec - exiting 08:13:26 (6684): No heartbeat from core client for 30 sec - exiting 08:13:27 (6684): No heartbeat from core client for 30 sec - exiting 08:13:28 (6684): No heartbeat from core client for 30 sec - exiting 08:13:29 (6684): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:27:34 (6640): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 14:45:21 (3492): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:45:01 (7280): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:14:20 (7096): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/t6scko.pjf5c10 Error converting file to netcdf: dataout/t6scko.pif5c10 Error converting file to netcdf: dataout/t6scko.pff5c10 Error converting file to netcdf: dataout/t6scka.phf5c10 Error converting file to netcdf: dataout/t6scka.pgf5c10 Error converting file to netcdf: dataout/t6scka.pef5c10 Error converting file to netcdf: dataout/t6scka.pdf5c10 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8028, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8028, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8028, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8028, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish 10:41:06 (8028): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=732, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=732, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
31 Dec 2011 12:47:21	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	777,600	1,222,304	1.5719
30 Dec 2011 23:23:48	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	751,680	1,178,367	1.5676
30 Dec 2011 11:31:55	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	725,760	1,136,495	1.5659
29 Dec 2011 22:31:41	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	699,840	1,095,428	1.5653
29 Dec 2011 05:37:59	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	673,920	1,053,753	1.5636
28 Dec 2011 16:56:46	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	648,000	1,011,381	1.5608
28 Dec 2011 00:07:43	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	622,080	968,962	1.5576
27 Dec 2011 11:48:13	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	596,160	926,751	1.5545
26 Dec 2011 23:35:03	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	570,240	884,120	1.5504
26 Dec 2011 11:40:43	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	544,320	842,696	1.5482
25 Dec 2011 23:18:14	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	518,400	799,995	1.5432
25 Dec 2011 10:59:23	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	492,480	758,251	1.5397
24 Dec 2011 22:51:16	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	466,560	717,216	1.5372
24 Dec 2011 10:45:19	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	440,640	676,860	1.5361
23 Dec 2011 20:22:02	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	414,720	634,569	1.5301
23 Dec 2011 07:20:56	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	388,800	591,239	1.5207
22 Dec 2011 17:26:07	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	362,880	546,737	1.5067
22 Dec 2011 04:32:10	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	336,960	503,308	1.4937
21 Dec 2011 15:04:33	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	311,040	461,202	1.4828
19 Dec 2011 13:33:48	1168700	13681216	hadcm3n_t6sc_1940_40_007548118_2	285,120	427,433	1.4991