Task 15580011

Name	hadcm3n_n3zy_1880_40_008287232_1
Workunit	8438367
Created	2 Feb 2013, 7:10:12 UTC
Sent	2 Feb 2013, 7:10:19 UTC
Report deadline	4 May 2013, 14:37:30 UTC
Received	3 Apr 2013, 3:15:11 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1099480
Run time	21 days 0 hours 9 min 5 sec
CPU time	18 days 9 hours 18 min 5 sec
Validate state	Invalid
Credit	11,508.48
Device peak FLOPS	2.82 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5760, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5760, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5760, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5760, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5760, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4404, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:56:30 (4928): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4408, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4408, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2892, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2648, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2144, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3064, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3084, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2496, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2496, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Apr 2013 05:37:26	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	959,040	1,574,061	1.6413
27 Mar 2013 09:22:33	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	933,120	1,535,487	1.6455
25 Mar 2013 08:37:13	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	907,200	1,488,152	1.6404
24 Mar 2013 09:22:17	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	881,280	1,440,791	1.6349
23 Mar 2013 16:10:50	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	855,360	1,393,213	1.6288
21 Mar 2013 09:44:29	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	829,440	1,346,623	1.6235
20 Mar 2013 02:00:23	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	803,520	1,300,335	1.6183
19 Mar 2013 09:34:13	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	777,600	1,253,398	1.6119
18 Mar 2013 18:06:27	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	751,680	1,207,275	1.6061
18 Mar 2013 02:32:03	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	725,760	1,160,662	1.5992
17 Mar 2013 12:14:45	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	699,840	1,115,422	1.5938
16 Mar 2013 14:20:27	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	673,920	1,070,198	1.5880
14 Mar 2013 06:19:08	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	648,000	1,024,491	1.5810
13 Mar 2013 00:57:55	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	622,080	979,569	1.5747
11 Mar 2013 07:37:42	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	596,160	940,765	1.5780
06 Mar 2013 22:10:57	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	570,240	900,655	1.5794
06 Mar 2013 09:10:53	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	544,320	855,826	1.5723
05 Mar 2013 04:29:40	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	518,400	817,246	1.5765
02 Mar 2013 03:25:55	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	492,480	809,827	1.6444
01 Mar 2013 04:06:22	1099480	15580011	hadcm3n_n3zy_1880_40_008287232_1	466,560	779,815	1.6714