Task 15596672

Name	hadcm3n_49kk_1940_40_008309565_0
Workunit	8460700
Created	7 Feb 2013, 21:36:50 UTC
Sent	7 Feb 2013, 21:39:46 UTC
Report deadline	10 May 2013, 5:06:57 UTC
Received	6 Mar 2013, 6:40:05 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1222836
Run time	13 days 0 hours 36 min 23 sec
CPU time	12 days 8 hours 36 min 13 sec
Validate state	Invalid
Credit	8,398.08
Device peak FLOPS	2.70 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/49kkko.pje2c10 Error converting file to netcdf: dataout/49kkko.pie2c10 Error converting file to netcdf: dataout/49kkko.pfe2c10 Error converting file to netcdf: dataout/49kkka.phe2c10 Error converting file to netcdf: dataout/49kkka.pge2c10 Error converting file to netcdf: dataout/49kkka.pee2c10 Error converting file to netcdf: dataout/49kkka.pde2c10 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 11:01:56 (4332): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3868, iMonCtr=1 Model crash detected, will try to restart... 11:06:12 (2564): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3656, iMonCtr=1 Model crash detected, will try to restart... 11:39:15 (5068): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2872, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5760, iMonCtr=1 Model crash detected, will try to restart... SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 Model crashed: SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 Model crashed: SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 Model crashed: SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 Model crashed: SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 Model crashed: SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 Model crashed: SETPOS: Unit 68 to Word Address -198 Failed with Error Code -1 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
06 Mar 2013 00:59:00	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	699,840	1,062,482	1.5182
04 Mar 2013 21:57:22	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	673,920	1,023,989	1.5195
04 Mar 2013 07:43:11	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	648,000	986,326	1.5221
03 Mar 2013 10:31:16	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	622,080	947,832	1.5236
02 Mar 2013 17:40:38	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	596,160	908,683	1.5242
01 Mar 2013 23:34:14	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	570,240	869,688	1.5251
01 Mar 2013 09:32:40	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	544,320	831,451	1.5275
28 Feb 2013 02:16:02	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	518,400	793,146	1.5300
24 Feb 2013 19:44:29	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	492,480	753,345	1.5297
23 Feb 2013 12:07:50	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	466,560	714,827	1.5321
23 Feb 2013 00:55:25	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	440,640	675,583	1.5332
22 Feb 2013 13:20:12	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	414,720	636,023	1.5336
22 Feb 2013 02:15:36	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	388,800	596,761	1.5349
21 Feb 2013 14:30:32	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	362,880	556,756	1.5343
21 Feb 2013 03:13:26	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	336,960	517,186	1.5349
20 Feb 2013 16:25:46	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	311,040	477,895	1.5364
20 Feb 2013 04:52:16	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	285,120	438,807	1.5390
19 Feb 2013 17:01:16	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	259,200	399,440	1.5410
19 Feb 2013 05:07:28	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	233,280	359,526	1.5412
18 Feb 2013 15:40:40	1222836	15596672	hadcm3n_49kk_1940_40_008309565_0	207,360	320,588	1.5460