Task 13092500

Name	hadcm3n_y8ub_1900_40_007344317_1
Workunit	7541747
Created	6 Jul 2011, 13:23:48 UTC
Sent	22 Jul 2011, 16:14:13 UTC
Report deadline	21 Oct 2011, 23:41:24 UTC
Received	19 Sep 2011, 12:42:51 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1024632
Run time	29 days 0 hours 23 min 16 sec
CPU time	24 days 12 hours 0 min 48 sec
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	2.24 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Model crashed: TEMPHIST: Failed in OPEN of history file tmp/pipe_dummy 2048 16:03:54 (5472): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 08:55:15 (1444): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:51:01 (1996): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:51:02 (1996): No heartbeat from core client for 30 sec - exiting 14:51:03 (1996): No heartbeat from core client for 30 sec - exiting 14:51:04 (1996): No heartbeat from core client for 30 sec - exiting 14:51:05 (1996): No heartbeat from core client for 30 sec - exiting 14:51:06 (1996): No heartbeat from core client for 30 sec - exiting 14:51:07 (1996): No heartbeat from core client for 30 sec - exiting 14:51:08 (1996): No heartbeat from core client for 30 sec - exiting 14:51:09 (1996): No heartbeat from core client for 30 sec - exiting 14:51:10 (1996): No heartbeat from core client for 30 sec - exiting 14:51:11 (1996): No heartbeat from core client for 30 sec - exiting 14:51:12 (1996): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 09:49:50 (4128): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:49:52 (4128): No heartbeat from core client for 30 sec - exiting 09:49:53 (4128): No heartbeat from core client for 30 sec - exiting 09:49:54 (4128): No heartbeat from core client for 30 sec - exiting 09:49:55 (4128): No heartbeat from core client for 30 sec - exiting 09:49:56 (4128): No heartbeat from core client for 30 sec - exiting 09:49:57 (4128): No heartbeat from core client for 30 sec - exiting 09:49:58 (4128): No heartbeat from core client for 30 sec - exiting 09:49:59 (4128): No heartbeat from core client for 30 sec - exiting 09:50:00 (4128): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 14:29:09 (4532): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 forrtl: There is not enough space on the disk. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2276, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
19 Sep 2011 12:40:47	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	1,036,800	2,116,843	2.0417
18 Sep 2011 17:32:12	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	1,010,880	2,249,934	2.2257
18 Sep 2011 00:40:25	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	984,960	2,192,560	2.2260
17 Sep 2011 07:29:41	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	959,040	2,133,128	2.2242
16 Sep 2011 11:53:46	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	933,120	2,072,764	2.2213
15 Sep 2011 02:44:27	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	907,200	2,049,225	2.2588
14 Sep 2011 10:06:16	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	881,280	1,988,480	2.2564
13 Sep 2011 16:12:41	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	855,360	1,928,505	2.2546
12 Sep 2011 20:14:03	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	829,440	1,866,869	2.2508
12 Sep 2011 02:12:04	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	803,520	1,803,571	2.2446
11 Sep 2011 08:00:36	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	777,600	1,739,894	2.2375
10 Sep 2011 14:40:06	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	751,680	1,679,272	2.2340
09 Sep 2011 21:38:04	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	725,760	1,619,443	2.2314
09 Sep 2011 04:20:27	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	699,840	1,559,754	2.2287
08 Sep 2011 11:49:32	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	673,920	1,502,165	2.2290
07 Sep 2011 19:32:55	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	648,000	1,443,737	2.2280
07 Sep 2011 02:48:46	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	622,080	1,384,358	2.2254
06 Sep 2011 09:41:22	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	596,160	1,324,518	2.2217
05 Sep 2011 16:14:11	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	570,240	1,263,437	2.2156
05 Sep 2011 06:48:09	1024632	13092500	hadcm3n_y8ub_1900_40_007344317_1	544,320	1,205,554	2.2148