Task 13616143

Name	hadcm3n_o1j6_1940_40_007448980_2
Workunit	7646483
Created	7 Nov 2011, 15:20:58 UTC
Sent	8 Nov 2011, 21:14:50 UTC
Report deadline	8 Feb 2012, 4:42:01 UTC
Received	28 Dec 2011, 14:08:12 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1118380
Run time	19 days 5 hours 5 min 32 sec
CPU time	14 days 23 hours 47 min 1 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.14 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5980, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 05:17:35 (5168): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5756, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5332, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5576, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6328, iMonCtr=1 Model crash detected, will try to restart... 05:22:02 (6140): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4908, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:14:56 (5960): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 21:01:30 (4972): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:01:32 (4972): No heartbeat from core client for 30 sec - exiting 21:01:40 (1568): Can't acquire lockfile (32) - waiting 35s 21:02:15 (1568): Can't acquire lockfile (32) - exiting 21:02:15 (1568): Error: The process cannot access the file because it is being used by another process. (0x20) CPDN Monitor - Quit request from BOINC... 09:54:04 (6468): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:54:14 (7568): Can't acquire lockfile (32) - waiting 35s 09:54:49 (7568): Can't acquire lockfile (32) - exiting 09:54:49 (7568): Error: The process cannot access the file because it is being used by another process. (0x20) CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
28 Dec 2011 01:38:04	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	518,400	1,295,191	2.4984
25 Dec 2011 16:25:28	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	492,480	1,230,711	2.4990
23 Dec 2011 15:22:39	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	466,560	1,163,477	2.4937
19 Dec 2011 02:56:22	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	440,640	1,096,185	2.4877
17 Dec 2011 16:50:41	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	414,720	1,033,034	2.4909
13 Dec 2011 17:59:05	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	388,800	968,690	2.4915
07 Dec 2011 05:39:53	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	362,880	905,575	2.4955
04 Dec 2011 22:28:21	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	336,960	840,391	2.4940
03 Dec 2011 17:43:47	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	311,040	777,028	2.4982
30 Nov 2011 00:03:53	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	285,120	712,868	2.5002
27 Nov 2011 19:09:59	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	259,200	646,434	2.4940
23 Nov 2011 17:49:38	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	233,280	582,340	2.4963
21 Nov 2011 00:56:33	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	207,360	514,328	2.4804
18 Nov 2011 21:25:09	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	181,440	443,031	2.4417
16 Nov 2011 23:05:48	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	155,520	378,361	2.4329
15 Nov 2011 18:32:44	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	129,600	315,645	2.4355
15 Nov 2011 18:01:09	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	103,680	252,029	2.4308
15 Nov 2011 18:01:09	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	77,760	189,968	2.4430
15 Nov 2011 18:01:09	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	51,840	129,001	2.4884
10 Nov 2011 03:14:03	1118380	13616143	hadcm3n_o1j6_1940_40_007448980_2	25,920	65,147	2.5134