Task 15923402

Name	hadcm3n_4a2r_2020_40_008393424_2
Workunit	8544283
Created	16 Aug 2013, 2:06:22 UTC
Sent	16 Aug 2013, 2:07:07 UTC
Report deadline	15 Nov 2013, 9:34:18 UTC
Received	11 Oct 2013, 17:00:57 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1280874
Run time	27 days 22 hours 17 min 57 sec
CPU time	23 days 0 hours 40 min 22 sec
Validate state	Invalid
Credit	9,953.28
Device peak FLOPS	3.14 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 14:34:48 (4596): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/4a2rko.pjo7c10 Error converting file to netcdf: dataout/4a2rko.pio7c10 Error converting file to netcdf: dataout/4a2rko.pfo7c10 Error converting file to netcdf: dataout/4a2rka.pho7c10 Error converting file to netcdf: dataout/4a2rka.pgo7c10 Error converting file to netcdf: dataout/4a2rka.peo7c10 Error converting file to netcdf: dataout/4a2rka.pdo7c10 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5480, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5480, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5436, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5436, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5436, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5436, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
23 Sep 2013 15:12:44	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	829,440	1,297,288	1.5641
23 Sep 2013 15:12:43	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	803,520	1,255,523	1.5625
22 Sep 2013 01:28:17	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	777,600	1,211,000	1.5574
21 Sep 2013 08:40:32	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	751,680	1,169,033	1.5552
20 Sep 2013 20:56:45	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	725,760	1,123,415	1.5479
19 Sep 2013 21:50:01	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	699,840	1,069,876	1.5287
18 Sep 2013 22:09:26	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	673,920	1,008,955	1.4971
18 Sep 2013 00:36:07	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	648,000	949,090	1.4646
18 Sep 2013 00:36:07	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	648,000	949,090	1.4646
17 Sep 2013 06:52:29	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	622,080	899,728	1.4463
16 Sep 2013 19:59:53	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	596,160	864,515	1.4501
16 Sep 2013 08:36:47	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	570,240	828,366	1.4527
15 Sep 2013 18:26:47	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	544,320	793,095	1.4570
15 Sep 2013 07:18:28	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	518,400	758,529	1.4632
14 Sep 2013 12:39:03	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	492,480	721,733	1.4655
14 Sep 2013 02:10:24	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	466,560	683,565	1.4651
14 Sep 2013 02:10:24	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	440,640	643,879	1.4612
12 Sep 2013 14:31:29	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	414,720	607,418	1.4646
11 Sep 2013 22:55:40	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	388,800	564,267	1.4513
11 Sep 2013 12:16:58	1280874	15923402	hadcm3n_4a2r_2020_40_008393424_2	362,880	524,268	1.4447