Task 15808289

Name	hadcm3n_n3w6_1920_40_008377652_1
Workunit	8528511
Created	30 May 2013, 20:46:06 UTC
Sent	31 May 2013, 1:20:14 UTC
Report deadline	30 Aug 2013, 8:47:25 UTC
Received	11 Jul 2013, 4:34:21 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1274344
Run time	8 days 10 hours 36 min 12 sec
CPU time	7 days 20 hours 31 min 33 sec
Validate state	Invalid
Credit	9,953.28
Device peak FLOPS	3.36 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 11:46:38 (5212): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4524, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4452, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1872, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3468, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=928, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=16076, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 22:31:24 (5628): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:54:56 (5868): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:34:07 (4852): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:13:27 (4704): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 Jul 2013 23:12:26	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	829,440	670,582	0.8085
10 Jul 2013 14:52:10	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	803,520	646,129	0.8041
09 Jul 2013 23:33:20	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	777,600	622,146	0.8001
09 Jul 2013 16:07:49	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	751,680	597,386	0.7947
09 Jul 2013 09:22:48	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	725,760	573,047	0.7896
09 Jul 2013 02:30:34	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	699,840	548,908	0.7843
08 Jul 2013 19:42:14	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	673,920	524,628	0.7785
08 Jul 2013 05:21:32	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	648,000	500,279	0.7720
07 Jul 2013 22:29:46	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	622,080	476,011	0.7652
07 Jul 2013 15:37:24	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	596,160	451,674	0.7576
07 Jul 2013 08:10:54	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	570,240	427,339	0.7494
06 Jul 2013 18:47:05	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	544,320	402,909	0.7402
04 Jul 2013 14:23:53	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	518,400	380,061	0.7331
04 Jul 2013 14:22:45	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	492,480	362,754	0.7366
04 Jul 2013 14:22:45	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	466,560	347,656	0.7451
04 Jul 2013 14:22:45	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	440,640	332,648	0.7549
04 Jul 2013 14:22:45	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	414,720	314,779	0.7590
04 Jul 2013 14:22:45	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	388,800	290,210	0.7464
02 Jul 2013 10:24:37	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	362,880	269,693	0.7432
02 Jul 2013 10:24:37	1274344	15808289	hadcm3n_n3w6_1920_40_008377652_1	336,960	254,565	0.7555