Task 15453494

Name	hadcm3n_zijc_1880_40_008251182_1
Workunit	8406306
Created	22 Nov 2012, 10:36:59 UTC
Sent	22 Nov 2012, 10:37:38 UTC
Report deadline	21 Feb 2013, 18:04:49 UTC
Received	22 May 2013, 11:51:10 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1205934
Run time	10 days 7 hours 1 min 42 sec
CPU time	9 days 12 hours 35 min 40 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.62 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> (unknown error) - exit code 193 (0xc1) </message> <stderr_txt> 09:42:47 (3684): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:43:32 (1984): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:35:47 (2712): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:56:20 (980): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:39:39 (3992): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3624, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3372, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3832, iMonCtr=1 Model crash detected, will try to restart... 09:37:15 (2588): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2300, iMonCtr=1 Model crash detected, will try to restart... 09:37:16 (2624): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 09:43:16 (3016): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:01:47 (2240): No heartbeat from core client for 30 sec - exiting 10:01:48 (2240): No heartbeat from core client for 30 sec - exiting 10:01:49 (2240): No heartbeat from core client for 30 sec - exiting 10:01:50 (2240): No heartbeat from core client for 30 sec - exiting 10:01:52 (2240): No heartbeat from core client for 30 sec - exiting 10:01:53 (2240): No heartbeat from core client for 30 sec - exiting 10:01:54 (2240): No heartbeat from core client for 30 sec - exiting 10:01:55 (2240): No heartbeat from core client for 30 sec - exiting 10:01:56 (2240): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:43:57 (3720): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:08:15 (2620): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3980, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2240, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2240, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3936, iMonCtr=1 Model crash detected, will try to restart... 09:52:34 (3316): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:52:35 (3316): No heartbeat from core client for 30 sec - exiting 09:59:24 (2484): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:47:11 (2528): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:48:32 (3868): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:26:04 (716): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:43:14 (1192): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:08:35 (3428): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:38:14 (3836): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:45:59 (2528): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:56:58 (3904): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:15:11 (2176): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:42:31 (2324): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:43:11 (3032): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:44:51 (2512): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:08:32 (2896): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:47:03 (360): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
22 May 2013 11:54:26	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	518,400	822,937	1.5875
15 May 2013 09:50:54	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	492,480	781,693	1.5873
03 May 2013 12:09:42	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	466,560	739,542	1.5851
16 Apr 2013 09:50:01	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	440,640	697,401	1.5827
08 Apr 2013 11:48:11	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	414,720	655,262	1.5800
02 Apr 2013 09:54:01	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	388,800	614,302	1.5800
22 Mar 2013 12:45:16	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	362,880	572,803	1.5785
18 Mar 2013 11:54:40	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	336,960	531,300	1.5767
11 Mar 2013 12:44:30	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	311,040	489,759	1.5746
04 Mar 2013 11:49:19	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	285,120	448,485	1.5730
26 Feb 2013 08:45:17	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	259,200	407,168	1.5709
14 Feb 2013 11:51:21	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	233,280	366,390	1.5706
04 Feb 2013 13:25:21	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	207,360	326,008	1.5722
29 Jan 2013 12:50:09	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	181,440	286,270	1.5778
23 Jan 2013 11:48:45	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	155,520	245,908	1.5812
18 Jan 2013 09:40:22	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	129,600	205,923	1.5889
10 Jan 2013 13:00:15	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	103,680	165,391	1.5952
18 Dec 2012 11:47:12	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	77,760	123,759	1.5916
14 Dec 2012 08:39:51	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	51,840	82,687	1.5950
30 Nov 2012 11:57:36	1205934	15453494	hadcm3n_zijc_1880_40_008251182_1	25,920	41,318	1.5941