Task 15278372

Name	hadcm3n_zbxv_1880_40_008200036_1
Workunit	8355160
Created	13 Sep 2012, 4:24:29 UTC
Sent	13 Sep 2012, 4:35:00 UTC
Report deadline	13 Dec 2012, 12:02:11 UTC
Received	8 Nov 2012, 3:47:03 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1236187
Run time	11 days 4 hours 23 min 41 sec
CPU time	10 days 20 hours 58 min 38 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	3.04 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 18:21:03 (11800): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:27:14 (5700): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 12:40:49 (10716): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/zbxvko.pj83c10 Error converting file to netcdf: dataout/zbxvko.pi83c10 Error converting file to netcdf: dataout/zbxvko.pf83c10 Error converting file to netcdf: dataout/zbxvka.ph83c10 Error converting file to netcdf: dataout/zbxvka.pg83c10 Error converting file to netcdf: dataout/zbxvka.pe83c10 Error converting file to netcdf: dataout/zbxvka.pd83c10 Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 20:26:36 (11304): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:52:19 (10280): No heartbeat from core client for 30 sec - exiting 09:52:20 (10280): No heartbeat from core client for 30 sec - exiting 09:52:21 (10280): No heartbeat from core client for 30 sec - exiting 09:52:22 (10280): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:52:23 (10280): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 00:27:55 (8884): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:27:56 (8884): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9504, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9504, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9504, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x775E3AB3 read attempt to address 0x40864A78 Engaging BOINC Windows Runtime Debugger... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x775E3AB3 read attempt to address 0x40864A78 Engaging BOINC Windows Runtime Debugger... Cannot serialize file D:\Data\Public\BOINC/projects/climateprediction.net/hadcm3n_zbxv_1880_40_008200036/dataout/shmem_restart.day Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Nov 2012 12:33:07	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	777,600	924,077	1.1884
07 Nov 2012 04:27:08	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	751,680	893,661	1.1889
06 Nov 2012 19:44:27	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	725,760	863,938	1.1904
06 Nov 2012 16:46:47	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	699,840	835,548	1.1939
05 Nov 2012 03:27:24	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	673,920	807,214	1.1978
04 Nov 2012 07:35:28	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	648,000	775,711	1.1971
04 Nov 2012 04:35:05	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	622,080	743,195	1.1947
03 Nov 2012 10:50:05	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	596,160	712,822	1.1957
03 Nov 2012 02:43:59	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	570,240	681,875	1.1958
02 Nov 2012 00:03:34	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	544,320	653,666	1.2009
01 Nov 2012 08:41:33	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	518,400	616,582	1.1894
31 Oct 2012 21:08:47	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	492,480	576,500	1.1706
31 Oct 2012 01:38:01	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	466,560	548,742	1.1761
30 Oct 2012 17:42:43	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	440,640	519,970	1.1800
30 Oct 2012 03:09:27	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	414,720	491,530	1.1852
30 Oct 2012 03:09:27	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	388,800	463,356	1.1918
28 Oct 2012 00:33:05	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	362,880	433,169	1.1937
25 Oct 2012 16:51:07	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	336,960	402,761	1.1953
22 Oct 2012 01:01:29	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	311,040	376,183	1.2094
21 Oct 2012 12:25:22	1236187	15278372	hadcm3n_zbxv_1880_40_008200036_1	285,120	344,397	1.2079