Task 13100123

Name	hadcm3n_ybs6_1900_40_007348128_1
Workunit	7545558
Created	6 Jul 2011, 13:48:41 UTC
Sent	18 Jul 2011, 12:57:21 UTC
Report deadline	17 Oct 2011, 20:24:32 UTC
Received	15 Nov 2011, 18:34:19 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	301953
Run time	53 days 9 hours 58 min 12 sec
CPU time	53 days 9 hours 58 min 12 sec
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	1.50 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>5.8.16</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2604, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:34:45 (2604): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:51:09 (11440): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:23:52 (3956): No heartbeat from core client for 30 sec - exiting 11:23:53 (3956): No heartbeat from core client for 30 sec - exiting 11:23:54 (3956): No heartbeat from core client for 30 sec - exiting 11:23:55 (3956): No heartbeat from core client for 30 sec - exiting 11:23:56 (3956): No heartbeat from core client for 30 sec - exiting 11:23:58 (3956): No heartbeat from core client for 30 sec - exiting 11:23:59 (3956): No heartbeat from core client for 30 sec - exiting 11:24:00 (3956): No heartbeat from core client for 30 sec - exiting 11:24:01 (3956): No heartbeat from core client for 30 sec - exiting 11:24:02 (3956): No heartbeat from core client for 30 sec - exiting 11:24:03 (3956): No heartbeat from core client for 30 sec - exiting 11:24:04 (3956): No heartbeat from core client for 30 sec - exiting 11:24:05 (3956): No heartbeat from core client for 30 sec - exiting 11:24:06 (3956): No heartbeat from core client for 30 sec - exiting 11:24:07 (3956): No heartbeat from core client for 30 sec - exiting 11:24:08 (3956): No heartbeat from core client for 30 sec - exiting 11:24:09 (3956): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... zip error: Could not create output file (was replacing the original zip file) cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\Program Files\BOINC/projects/climateprediction.net/hadcm3n_ybs6_1900_40_007348128/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	1,036,800	4,615,261	4.4514
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	1,010,880	4,506,363	4.4579
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	984,960	4,396,577	4.4637
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	959,040	4,287,332	4.4704
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	933,120	4,182,249	4.4820
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	907,200	4,051,953	4.4664
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	881,280	3,944,681	4.4761
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	855,360	3,838,654	4.4878
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	829,440	3,735,996	4.5042
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	803,520	3,637,117	4.5265
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	777,600	3,528,562	4.5378
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	751,680	3,405,616	4.5307
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	725,760	3,287,379	4.5296
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	699,840	3,175,456	4.5374
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	673,920	3,062,212	4.5439
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	648,000	2,944,123	4.5434
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	622,080	2,832,539	4.5533
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	596,160	2,718,434	4.5599
15 Nov 2011 18:38:40	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	570,240	2,610,154	4.5773
14 Sep 2011 13:36:25	301953	13100123	hadcm3n_ybs6_1900_40_007348128_1	544,320	2,504,795	4.6017