Task 15600035

Name	hadcm3n_4ic0_1940_40_008312227_0
Workunit	8463362
Created	8 Feb 2013, 7:23:10 UTC
Sent	8 Feb 2013, 14:21:47 UTC
Report deadline	10 May 2013, 21:48:58 UTC
Received	18 Mar 2013, 3:54:43 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-226 (0xFFFFFF1E) ERR_TOO_MANY_EXITS
Computer ID	1186851
Run time	26 days 7 hours 17 min 41 sec
CPU time	22 days 20 hours 20 min 28 sec
Validate state	Invalid
Credit	10,575.36
Device peak FLOPS	2.03 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> too many exit(0)s </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... 01:29:53 (8068): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:32:55 (4008): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:32:56 (4008): No heartbeat from core client for 30 sec - exiting 01:32:57 (4008): No heartbeat from core client for 30 sec - exiting 01:32:58 (4008): No heartbeat from core client for 30 sec - exiting 01:32:59 (4008): No heartbeat from core client for 30 sec - exiting 01:33:00 (4008): No heartbeat from core client for 30 sec - exiting 01:51:24 (6940): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:00:40 (6196): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:16:09 (8360): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 02:27:22 (6384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6332, iMonCtr=1 Model crash detected, will try to restart... 01:22:27 (6192): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:17:30 (4468): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:15:30 (10460): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:24:51 (18440): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:24:52 (18440): No heartbeat from core client for 30 sec - exiting 01:24:54 (17916): Can't acquire lockfile (32) - waiting 35s 02:24:38 (17916): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:49:38 (10452): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:25:29 (6280): No heartbeat from core client for 30 sec - exiting 02:25:30 (6280): No heartbeat from core client for 30 sec - exiting 02:25:31 (6280): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:28:30 (10996): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:41:51 (5548): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:45:01 (2840): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:00:33 (6084): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
16 Mar 2013 00:20:17	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	881,280	1,953,041	2.2161
14 Mar 2013 13:20:06	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	855,360	1,892,999	2.2131
13 Mar 2013 17:16:10	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	829,440	1,832,256	2.2090
09 Mar 2013 09:47:29	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	803,520	1,771,811	2.2051
08 Mar 2013 14:35:25	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	777,600	1,711,741	2.2013
07 Mar 2013 14:15:19	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	751,680	1,650,739	2.1961
06 Mar 2013 16:00:41	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	725,760	1,586,728	2.1863
05 Mar 2013 21:52:50	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	699,840	1,526,950	2.1819
05 Mar 2013 04:14:35	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	673,920	1,467,548	2.1776
04 Mar 2013 10:49:03	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	648,000	1,407,898	2.1727
03 Mar 2013 14:55:29	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	622,080	1,347,621	2.1663
02 Mar 2013 19:06:14	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	596,160	1,287,157	2.1591
02 Mar 2013 01:25:04	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	570,240	1,227,709	2.1530
01 Mar 2013 07:37:11	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	544,320	1,167,482	2.1448
28 Feb 2013 19:24:55	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	518,400	1,106,088	2.1337
28 Feb 2013 19:24:55	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	492,480	1,044,456	2.1208
28 Feb 2013 19:24:55	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	466,560	987,384	2.1163
26 Feb 2013 09:30:33	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	440,640	932,258	2.1157
25 Feb 2013 16:17:05	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	414,720	876,758	2.1141
24 Feb 2013 22:09:50	1186851	15600035	hadcm3n_4ic0_1940_40_008312227_0	388,800	821,983	2.1142