Task 14101572

Name	hadcm3n_yceg_1980_40_007752650_0
Workunit	7907759
Created	16 Feb 2012, 17:47:12 UTC
Sent	16 Feb 2012, 17:47:18 UTC
Report deadline	18 May 2012, 1:14:29 UTC
Received	2 Apr 2012, 14:35:09 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	834066
Run time	24 days 23 hours 51 min 58 sec
CPU time	20 days 6 hours 46 min 32 sec
Validate state	Invalid
Credit	8,709.12
Device peak FLOPS	2.07 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 23:54:01 (3840): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:52:56 (2644): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:51:52 (6832): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:00:01 (2188): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 02:58:59 (2208): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:59:00 (2208): No heartbeat from core client for 30 sec - exiting 17:57:58 (7164): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:56:56 (5272): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:55:50 (3444): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:54:47 (6580): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:53:47 (6476): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:52:44 (5888): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:51:43 (1156): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITHEAD: I/O error tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITHEAD: I/O error tmp/pipe_dummy 2048 forrtl: There is not enough space on the disk. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1044, iMonCtr=1 Model crash detected, will try to restart... forrtl: There is not enough space on the disk. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1044, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 01:15:14 (7872): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:14:13 (6584): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1760, iMonCtr=1 Model crash detected, will try to restart... 13:31:32 (5288): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:30:32 (5384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:29:32 (6364): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:28:32 (6844): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:59:54 (2540): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:26:36 (2844): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:25:30 (4340): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:24:28 (6848): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:23:25 (5768): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:22:26 (2112): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:49:40 (5960): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:48:34 (6924): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:47:30 (3396): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:46:28 (7016): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:45:25 (3892): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:44:24 (5664): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:43:26 (4752): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:42:24 (6940): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:41:28 (7300): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:00:04 (9012): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:39:32 (5624): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Apr 2012 09:44:15	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	725,760	1,758,374	2.4228
01 Apr 2012 08:39:26	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	699,840	1,692,917	2.4190
31 Mar 2012 07:13:12	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	673,920	1,626,612	2.4137
30 Mar 2012 08:05:38	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	648,000	1,562,390	2.4111
29 Mar 2012 10:12:22	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	622,080	1,498,162	2.4083
28 Mar 2012 13:48:10	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	596,160	1,434,415	2.4061
27 Mar 2012 14:10:55	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	570,240	1,369,256	2.4012
26 Mar 2012 15:24:23	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	544,320	1,303,656	2.3950
25 Mar 2012 11:07:48	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	518,400	1,233,948	2.3803
22 Mar 2012 05:07:09	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	492,480	1,170,543	2.3768
21 Mar 2012 11:43:19	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	466,560	1,113,312	2.3862
20 Mar 2012 10:55:55	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	440,640	1,048,908	2.3804
19 Mar 2012 14:59:01	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	414,720	986,017	2.3775
18 Mar 2012 17:05:27	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	388,800	922,915	2.3738
17 Mar 2012 19:02:59	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	362,880	858,166	2.3649
16 Mar 2012 23:08:46	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	336,960	791,977	2.3504
16 Mar 2012 04:04:50	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	311,040	727,961	2.3404
15 Mar 2012 06:08:17	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	285,120	662,102	2.3222
14 Mar 2012 09:20:14	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	259,200	595,608	2.2979
24 Feb 2012 12:12:33	834066	14101572	hadcm3n_yceg_1980_40_007752650_0	233,280	564,427	2.4195