Task 15792397

Name	hadcm3n_4ba8_1940_40_008310877_3
Workunit	8462012
Created	21 May 2013, 14:09:55 UTC
Sent	21 May 2013, 14:10:00 UTC
Report deadline	20 Aug 2013, 21:37:11 UTC
Received	28 Jun 2013, 15:04:37 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1264305
Run time	9 days 1 hours 6 min 54 sec
CPU time	8 days 16 hours 43 min 1 sec
Validate state	Invalid
Credit	4,665.60
Device peak FLOPS	3.32 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4908, iMonCtr=1 Model crash detected, will try to restart... 21:09:32 (4720): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4444, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4532, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5008, iMonCtr=1 Model crash detected, will try to restart... 14:36:58 (4712): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:40:02 (4592): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:37:36 (4640): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6160, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5040, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4568, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 13:11:31 (4604): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4484, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4892, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2640, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
12 Jun 2013 04:54:24	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	388,800	447,624	1.1513
10 Jun 2013 08:47:47	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	362,880	417,401	1.1502
07 Jun 2013 14:53:15	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	336,960	387,523	1.1501
05 Jun 2013 14:22:49	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	311,040	357,935	1.1508
04 Jun 2013 16:03:22	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	285,120	328,449	1.1520
02 Jun 2013 16:26:47	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	259,200	298,778	1.1527
30 May 2013 06:13:09	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	233,280	268,917	1.1528
29 May 2013 13:14:28	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	207,360	238,831	1.1518
29 May 2013 04:11:21	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	181,440	209,335	1.1537
28 May 2013 09:38:59	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	155,520	179,679	1.1553
27 May 2013 15:46:22	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	129,600	150,158	1.1586
27 May 2013 04:32:31	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	103,680	120,474	1.1620
26 May 2013 09:20:21	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	77,760	90,605	1.1652
24 May 2013 10:53:33	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	51,840	60,313	1.1634
24 May 2013 02:10:41	1264305	15792397	hadcm3n_4ba8_1940_40_008310877_3	25,920	30,164	1.1637