Task 15928490

Name	hadcm3n_n0e9_1920_40_008406913_0
Workunit	8557769
Created	20 Aug 2013, 8:54:41 UTC
Sent	20 Aug 2013, 9:01:54 UTC
Report deadline	19 Nov 2013, 16:29:05 UTC
Received	12 Sep 2013, 20:45:48 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1258246
Run time	8 days 8 hours 29 min 22 sec
CPU time	7 days 15 hours 46 min 4 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	3.20 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> (unknown error) - exit code 193 (0xc1) </message> <stderr_txt> 18:06:19 (4116): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2840, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 07:36:35 (3616): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:47:07 (4052): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:12:54 (2100): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3528, iMonCtr=1 Model crash detected, will try to restart... C05:20:38 (3912): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:22:44 (3696): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:08:02 (4016): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2120, iMonCtr=1 Model crash detected, will try to restart... 06:20:35 (3684): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1092, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3228, iMonCtr=1 Model crash detected, will try to restart... Unhandled Exception Detected... - Unhandled Exception Record - Reason: %s (0x111964) at address 0x%p %s Engaging BOINC Windows Runtime Debugger... Cannot serialize file %s Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
12 Sep 2013 19:48:01	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	518,400	661,559	1.2762
10 Sep 2013 19:57:23	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	492,480	628,728	1.2767
08 Sep 2013 22:15:44	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	466,560	595,633	1.2766
08 Sep 2013 05:46:03	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	440,640	562,867	1.2774
07 Sep 2013 14:20:25	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	414,720	530,093	1.2782
07 Sep 2013 05:03:06	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	388,800	496,990	1.2783
06 Sep 2013 10:02:30	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	362,880	463,373	1.2769
04 Sep 2013 10:22:21	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	336,960	430,184	1.2767
02 Sep 2013 08:59:11	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	311,040	397,042	1.2765
01 Sep 2013 02:52:15	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	285,120	363,579	1.2752
31 Aug 2013 09:09:52	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	259,200	330,140	1.2737
30 Aug 2013 21:59:24	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	233,280	295,937	1.2686
29 Aug 2013 08:49:00	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	207,360	263,396	1.2702
27 Aug 2013 11:52:12	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	181,440	230,601	1.2709
25 Aug 2013 19:45:23	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	155,520	197,556	1.2703
25 Aug 2013 04:42:18	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	129,600	164,227	1.2672
24 Aug 2013 09:53:27	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	103,680	130,613	1.2598
23 Aug 2013 23:50:34	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	77,760	97,734	1.2569
23 Aug 2013 12:11:40	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	51,840	65,381	1.2612
21 Aug 2013 10:52:17	1258246	15928490	hadcm3n_n0e9_1920_40_008406913_0	25,920	32,549	1.2557