Task 15798000

Name	hadcm3n_zex3_1960_40_008320771_1
Workunit	8471906
Created	26 May 2013, 23:15:19 UTC
Sent	26 May 2013, 23:15:29 UTC
Report deadline	26 Aug 2013, 6:42:40 UTC
Received	19 Oct 2013, 9:42:56 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1280801
Run time	16 days 23 hours 38 min 15 sec
CPU time	16 days 0 hours 37 min 39 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	1.13 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> Det går inte att hitta ett specifikt område eller spår på disken. (0x19) - exit code 25 (0x19) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 06:19:49 (5432): No heartbeat from core client for 30 sec - exiting 06:19:52 (5432): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5096, iMonCtr=1 Model crash detected, will try to restart... 13:50:06 (5908): No heartbeat from core client for 30 sec - exiting 13:50:08 (5908): No heartbeat from core client for 30 sec - exiting 13:50:09 (5908): No heartbeat from core client for 30 sec - exiting 13:50:10 (5908): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:07:25 (6932): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5724, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4896, iMonCtr=1 Model crash detected, will try to restart... 17:50:22 (5392): No heartbeat from core client for 30 sec - exiting 17:50:25 (5392): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5352, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5352, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5352, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5352, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5352, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5352, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( 09:21:45 (5052): No heartbeat from core client for 30 sec - exiting 09:21:51 (5052): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 06:27:28 (4712): No heartbeat from core client for 30 sec - exiting 06:27:30 (4712): No heartbeat from core client for 30 sec - exiting 06:27:31 (4712): No heartbeat from core client for 30 sec - exiting 06:27:32 (4712): No heartbeat from core client for 30 sec - exiting 06:27:33 (4712): No heartbeat from core client for 30 sec - exiting 06:27:34 (4712): No heartbeat from core client for 30 sec - exiting 06:27:35 (4712): No heartbeat from core client for 30 sec - exiting 06:27:36 (4712): No heartbeat from core client for 30 sec - exiting 06:27:37 (4712): No heartbeat from core client for 30 sec - exiting 06:27:38 (4712): No heartbeat from core client for 30 sec - exiting 06:27:39 (4712): No heartbeat from core client for 30 sec - exiting 06:27:40 (4712): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6364, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
24 Aug 2013 11:43:51	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	596,160	718,218	1.2047
24 Aug 2013 11:43:51	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	570,240	690,602	1.2111
24 Aug 2013 11:43:51	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	544,320	662,968	1.2180
24 Aug 2013 11:43:51	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	518,400	635,178	1.2253
24 Aug 2013 11:43:51	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	492,480	607,532	1.2336
26 Jul 2013 19:10:18	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	466,560	572,473	1.2270
23 Jul 2013 20:26:34	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	440,640	529,724	1.2022
23 Jul 2013 20:26:33	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	414,720	500,808	1.2076
23 Jul 2013 20:26:33	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	388,800	471,897	1.2137
16 Jun 2013 11:57:09	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	362,880	443,183	1.2213
10 Jun 2013 00:39:18	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	336,960	396,394	1.1764
09 Jun 2013 15:52:27	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	311,040	367,853	1.1827
09 Jun 2013 06:43:54	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	285,120	338,450	1.1870
08 Jun 2013 22:00:13	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	259,200	308,292	1.1894
08 Jun 2013 13:10:32	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	233,280	278,208	1.1926
08 Jun 2013 04:01:41	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	207,360	248,416	1.1980
07 Jun 2013 19:04:24	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	181,440	218,469	1.2041
07 Jun 2013 10:21:09	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	155,520	189,315	1.2173
03 Jun 2013 01:02:24	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	129,600	158,187	1.2206
02 Jun 2013 16:36:51	1280801	15798000	hadcm3n_zex3_1960_40_008320771_1	103,680	128,898	1.2432