Task 15778640

Name	hadcm3n_4gmq_1980_40_008361438_1
Workunit	8512297
Created	12 May 2013, 2:24:01 UTC
Sent	12 May 2013, 2:24:21 UTC
Report deadline	11 Aug 2013, 9:51:32 UTC
Received	17 Jun 2013, 17:35:52 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1269938
Run time	11 days 4 hours 6 min 48 sec
CPU time	10 days 9 hours 35 min 4 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.33 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4256, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2188, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4128, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1152, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 21:08:38 (5144): No heartbeat from core client for 30 sec - exiting 21:08:39 (5144): No heartbeat from core client for 30 sec - exiting 21:08:41 (5144): No heartbeat from core client for 30 sec - exiting 21:08:42 (5144): No heartbeat from core client for 30 sec - exiting 21:08:43 (5144): No heartbeat from core client for 30 sec - exiting 21:08:44 (5144): No heartbeat from core client for 30 sec - exiting 21:08:45 (5144): No heartbeat from core client for 30 sec - exiting 21:08:46 (5144): No heartbeat from core client for 30 sec - exiting 21:08:47 (5144): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3604, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4260, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1716, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4060, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=860, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 09:04:11 (2212): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:34:38 (5160): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:34:40 (5160): No heartbeat from core client for 30 sec - exiting 01:29:40 (14532): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 Jun 2013 16:35:24	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	518,400	898,499	1.7332
17 Jun 2013 04:04:00	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	492,480	854,880	1.7359
16 Jun 2013 15:08:32	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	466,560	810,226	1.7366
11 Jun 2013 02:45:43	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	440,640	765,739	1.7378
08 Jun 2013 14:16:00	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	414,720	721,734	1.7403
05 Jun 2013 21:50:33	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	388,800	677,632	1.7429
05 Jun 2013 09:15:38	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	362,880	634,062	1.7473
03 Jun 2013 23:03:58	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	336,960	590,409	1.7522
01 Jun 2013 16:32:50	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	311,040	546,436	1.7568
30 May 2013 02:31:04	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	285,120	499,781	1.7529
28 May 2013 01:56:09	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	259,200	454,295	1.7527
26 May 2013 17:07:54	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	233,280	409,696	1.7562
24 May 2013 00:04:51	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	207,360	366,271	1.7664
22 May 2013 02:11:00	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	181,440	323,369	1.7822
20 May 2013 13:12:21	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	155,520	279,781	1.7990
19 May 2013 15:59:50	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	129,600	234,323	1.8080
18 May 2013 17:52:07	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	103,680	187,626	1.8097
18 May 2013 02:51:22	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	77,760	142,076	1.8271
16 May 2013 00:39:17	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	51,840	95,978	1.8514
13 May 2013 00:34:28	1269938	15778640	hadcm3n_4gmq_1980_40_008361438_1	25,920	47,634	1.8377