Task 15643301

Name	hadcm3n_o1lj_1980_40_008154507_4
Workunit	8309631
Created	28 Feb 2013, 6:17:28 UTC
Sent	28 Feb 2013, 6:17:39 UTC
Report deadline	30 May 2013, 13:44:50 UTC
Received	10 Apr 2013, 6:57:58 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-226 (0xFFFFFF1E) ERR_TOO_MANY_EXITS
Computer ID	1147086
Run time	17 days 11 hours 34 min 55 sec
CPU time	15 days 0 hours 46 min 35 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.15 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.60</core_client_version> <![CDATA[ <message> too many exit(0)s </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10376, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:14:20 (136064): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 17:24:47 (170264): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:22:27 (2500): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19820, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 22:09:36 (5292): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:13:12 (580): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:16:24 (444): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:20:37 (4452): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:24:51 (772): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:29:06 (5184): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:33:23 (5672): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:37:38 (5340): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:41:49 (2500): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:46:04 (3540): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:50:18 (5820): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:54:33 (5904): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:58:51 (5072): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:03:07 (4904): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:07:28 (5812): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:11:50 (5920): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:16:12 (5520): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
08 Apr 2013 08:16:56	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	518,400	1,262,333	2.4351
04 Apr 2013 20:59:41	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	492,480	1,203,833	2.4444
01 Apr 2013 04:22:54	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	466,560	1,142,403	2.4486
29 Mar 2013 23:06:04	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	440,640	1,079,225	2.4492
27 Mar 2013 23:35:21	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	414,720	1,016,045	2.4500
26 Mar 2013 11:07:03	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	388,800	953,431	2.4522
24 Mar 2013 04:35:45	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	362,880	888,609	2.4488
23 Mar 2013 02:05:32	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	336,960	824,855	2.4479
19 Mar 2013 07:08:39	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	311,040	761,052	2.4468
17 Mar 2013 06:53:33	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	285,120	699,856	2.4546
14 Mar 2013 08:24:43	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	259,200	636,794	2.4568
13 Mar 2013 03:03:29	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	233,280	572,197	2.4528
12 Mar 2013 01:14:20	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	207,360	509,077	2.4550
11 Mar 2013 00:05:00	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	181,440	445,988	2.4580
09 Mar 2013 21:43:22	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	155,520	384,816	2.4744
08 Mar 2013 19:41:07	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	129,600	321,427	2.4801
08 Mar 2013 19:41:06	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	103,680	258,327	2.4916
06 Mar 2013 12:51:40	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	77,760	194,053	2.4955
03 Mar 2013 08:15:49	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	51,840	129,366	2.4955
02 Mar 2013 07:02:32	1147086	15643301	hadcm3n_o1lj_1980_40_008154507_4	25,920	63,961	2.4676