Task 15812097

Name	hadcm3n_o7e6_1940_40_008380929_0
Workunit	8531788
Created	31 May 2013, 23:33:18 UTC
Sent	15 Jun 2013, 22:42:32 UTC
Report deadline	15 Sep 2013, 6:09:43 UTC
Received	14 Aug 2013, 17:04:40 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1096394
Run time	20 days 19 hours 8 min 29 sec
CPU time	17 days 14 hours 27 min
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	1.68 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> (unknown error) - exit code 193 (0xc1) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6008, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6008, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6008, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:24:58 (6636): No heartbeat from core client for 30 sec - exiting 14:25:00 (6636): No heartbeat from core client for 30 sec - exiting 14:25:01 (6636): No heartbeat from core client for 30 sec - exiting 14:25:02 (6636): No heartbeat from core client for 30 sec - exiting 14:25:03 (6636): No heartbeat from core client for 30 sec - exiting 14:25:04 (6636): No heartbeat from core client for 30 sec - exiting 14:25:05 (6636): No heartbeat from core client for 30 sec - exiting 14:25:06 (6636): No heartbeat from core client for 30 sec - exiting 14:25:07 (6636): No heartbeat from core client for 30 sec - exiting 14:25:08 (6636): No heartbeat from core client for 30 sec - exiting 14:25:10 (6636): No heartbeat from core client for 30 sec - exiting 14:25:11 (6636): No heartbeat from core client for 30 sec - exiting 14:25:12 (6636): No heartbeat from core client for 30 sec - exiting 14:25:13 (6636): No heartbeat from core client for 30 sec - exiting 14:25:14 (6636): No heartbeat from core client for 30 sec - exiting 14:25:15 (6636): No heartbeat from core client for 30 sec - exiting 14:25:16 (6636): No heartbeat from core client for 30 sec - exiting 14:25:17 (6636): No heartbeat from core client for 30 sec - exiting 14:25:18 (6636): No heartbeat from core client for 30 sec - exiting 14:25:19 (6636): No heartbeat from core client for 30 sec - exiting 14:25:20 (6636): No heartbeat from core client for 30 sec - exiting 14:25:21 (6636): No heartbeat from core client for 30 sec - exiting 14:25:22 (6636): No heartbeat from core client for 30 sec - exiting 14:25:24 (6636): No heartbeat from core client for 30 sec - exiting 14:25:25 (6636): No heartbeat from core client for 30 sec - exiting 14:25:26 (6636): No heartbeat from core client for 30 sec - exiting 14:25:27 (6636): No heartbeat from core client for 30 sec - exiting 14:25:28 (6636): No heartbeat from core client for 30 sec - exiting 14:25:29 (6636): No heartbeat from core client for 30 sec - exiting 14:25:30 (6636): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:52:27 (6280): No heartbeat from core client for 30 sec - exiting 13:52:28 (6280): No heartbeat from core client for 30 sec - exiting 13:52:29 (6280): No heartbeat from core client for 30 sec - exiting 13:52:30 (6280): No heartbeat from core client for 30 sec - exiting 13:52:31 (6280): No heartbeat from core client for 30 sec - exiting 13:52:32 (6280): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:28:34 (4440): No heartbeat from core client for 30 sec - exiting 02:28:36 (4440): No heartbeat from core client for 30 sec - exiting 02:28:37 (4440): No heartbeat from core client for 30 sec - exiting 02:28:38 (4440): No heartbeat from core client for 30 sec - exiting 02:28:39 (4440): No heartbeat from core client for 30 sec - exiting 02:28:40 (4440): No heartbeat from core client for 30 sec - exiting 02:28:42 (4440): No heartbeat from core client for 30 sec - exiting 02:28:43 (4440): No heartbeat from core client for 30 sec - exiting 02:28:44 (4440): No heartbeat from core client for 30 sec - exiting 02:28:45 (4440): No heartbeat from core client for 30 sec - exiting 02:28:46 (4440): No heartbeat from core client for 30 sec - exiting 02:28:47 (4440): No heartbeat from core client for 30 sec - exiting 02:28:48 (4440): No heartbeat from core client for 30 sec - exiting 02:28:49 (4440): No heartbeat from core client for 30 sec - exiting 02:28:50 (4440): No heartbeat from core client for 30 sec - exiting 02:28:51 (4440): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4592, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5904, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5904, iMonCtr=1 Model crash detected, will try to restart... 16:15:48 (3188): No heartbeat from core client for 30 sec - exiting 16:15:49 (3188): No heartbeat from core client for 30 sec - exiting 16:15:50 (3188): No heartbeat from core client for 30 sec - exiting 16:15:51 (3188): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4384, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x772A3AB3 read attempt to address 0x409E905F Engaging BOINC Windows Runtime Debugger... Cannot serialize file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o7e6_1940_40_008380929/dataout/shmem_restart.day Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
14 Aug 2013 17:09:21	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	518,400	1,520,814	2.9337
14 Aug 2013 17:09:21	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	492,480	1,443,483	2.9310
14 Aug 2013 17:09:21	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	466,560	1,365,733	2.9272
14 Aug 2013 17:09:21	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	440,640	1,289,074	2.9255
14 Aug 2013 17:09:21	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	414,720	1,212,608	2.9239
29 Jul 2013 14:03:33	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	388,800	1,133,224	2.9147
29 Jul 2013 14:03:33	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	362,880	1,056,363	2.9111
29 Jul 2013 14:03:33	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	336,960	977,357	2.9005
03 Jul 2013 18:33:45	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	311,040	891,213	2.8653
02 Jul 2013 11:01:22	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	285,120	819,929	2.8757
02 Jul 2013 10:08:51	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	259,200	743,409	2.8681
27 Jun 2013 12:35:37	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	233,280	665,634	2.8534
25 Jun 2013 21:56:59	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	207,360	590,376	2.8471
24 Jun 2013 23:16:15	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	181,440	516,627	2.8474
24 Jun 2013 00:41:06	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	155,520	442,504	2.8453
22 Jun 2013 22:27:09	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	129,600	368,954	2.8469
21 Jun 2013 20:56:02	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	103,680	294,874	2.8441
21 Jun 2013 00:24:07	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	77,760	222,860	2.8660
18 Jun 2013 05:07:09	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	51,840	148,970	2.8736
17 Jun 2013 01:48:07	1096394	15812097	hadcm3n_o7e6_1940_40_008380929_0	25,920	74,958	2.8919