Task 13124537

Name	hadcm3n_yl77_1900_40_007360333_0
Workunit	7557763
Created	6 Jul 2011, 15:12:01 UTC
Sent	7 Jul 2011, 19:06:38 UTC
Report deadline	7 Oct 2011, 2:33:49 UTC
Received	26 Aug 2011, 21:49:55 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1073001
Run time	5 days 13 hours 7 min 49 sec
CPU time	5 days 5 hours 35 min 54 sec
Validate state	Invalid
Credit	3,110.40
Device peak FLOPS	3.31 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.56</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6368, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1544, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7196, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5024, iMonCtr=1 Model crash detected, will try to restart... 17:26:31 (6432): Can't acquire lockfile (32) - waiting 35s 17:27:00 (1916): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5376, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5276, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5860, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1348, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5216, iMonCtr=1 Model crash detected, will try to restart... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x77453F9B read attempt to address 0x00000000 Engaging BOINC Windows Runtime Debugger... Cannot serialize file F:\Boinc/projects/climateprediction.net/hadcm3n_yl77_1900_40_007360333/dataout/shmem_restart.day Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
26 Aug 2011 21:52:20	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	259,200	452,147	1.7444
17 Aug 2011 22:43:03	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	233,280	405,568	1.7385
16 Aug 2011 15:19:56	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	207,360	358,969	1.7311
11 Aug 2011 02:13:39	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	181,440	312,616	1.7230
02 Aug 2011 02:18:05	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	155,520	266,440	1.7132
31 Jul 2011 02:30:54	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	129,600	220,328	1.7001
25 Jul 2011 22:28:54	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	103,680	175,050	1.6884
25 Jul 2011 21:44:05	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	77,760	136,338	1.7533
25 Jul 2011 19:50:30	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	51,840	94,465	1.8222
25 Jul 2011 19:50:30	1073001	13124537	hadcm3n_yl77_1900_40_007360333_0	25,920	47,130	1.8183