Task 15545787

Name	hadcm3n_n593_1880_40_008284229_0
Workunit	8435364
Created	16 Jan 2013, 15:21:02 UTC
Sent	16 Jan 2013, 15:21:15 UTC
Report deadline	17 Apr 2013, 22:48:26 UTC
Received	4 Feb 2013, 17:45:22 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1230346
Run time	17 days 17 hours 31 min 14 sec
CPU time	15 days 20 hours 1 min 9 sec
Validate state	Invalid
Credit	12,130.56
Device peak FLOPS	3.05 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 17:37:58 (7040): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:37:59 (7040): No heartbeat from core client for 30 sec - exiting 17:38:00 (7040): No heartbeat from core client for 30 sec - exiting 17:38:01 (7040): No heartbeat from core client for 30 sec - exiting 17:38:02 (7040): No heartbeat from core client for 30 sec - exiting 17:38:03 (7040): No heartbeat from core client for 30 sec - exiting 17:38:04 (7040): No heartbeat from core client for 30 sec - exiting 17:38:05 (7040): No heartbeat from core client for 30 sec - exiting 17:38:06 (7040): No heartbeat from core client for 30 sec - exiting 17:38:07 (7040): No heartbeat from core client for 30 sec - exiting 17:38:08 (7040): No heartbeat from core client for 30 sec - exiting 17:28:43 (2664): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8948, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6388, iMonCtr=1 Model crash detected, will try to restart... 17:15:10 (7948): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:15:11 (7948): No heartbeat from core client for 30 sec - exiting 17:15:13 (7948): No heartbeat from core client for 30 sec - exiting 17:15:14 (7948): No heartbeat from core client for 30 sec - exiting 17:15:15 (7948): No heartbeat from core client for 30 sec - exiting 17:15:16 (7948): No heartbeat from core client for 30 sec - exiting 17:15:17 (7948): No heartbeat from core client for 30 sec - exiting 17:15:18 (7948): No heartbeat from core client for 30 sec - exiting 17:15:19 (7948): No heartbeat from core client for 30 sec - exiting 17:15:20 (7948): No heartbeat from core client for 30 sec - exiting 17:15:21 (7948): No heartbeat from core client for 30 sec - exiting 17:26:37 (8612): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:26:38 (8612): No heartbeat from core client for 30 sec - exiting 17:26:39 (8612): No heartbeat from core client for 30 sec - exiting 17:26:40 (8612): No heartbeat from core client for 30 sec - exiting 17:26:41 (8612): No heartbeat from core client for 30 sec - exiting 17:26:42 (8612): No heartbeat from core client for 30 sec - exiting 17:26:43 (8612): No heartbeat from core client for 30 sec - exiting 17:26:44 (8612): No heartbeat from core client for 30 sec - exiting 17:26:45 (8612): No heartbeat from core client for 30 sec - exiting 17:26:46 (8612): No heartbeat from core client for 30 sec - exiting 17:26:47 (8612): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2644, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3096, iMonCtr=1 Model crash detected, will try to restart... 17:04:14 (5228): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:04:15 (5228): No heartbeat from core client for 30 sec - exiting 17:04:16 (5228): No heartbeat from core client for 30 sec - exiting 17:04:18 (5228): No heartbeat from core client for 30 sec - exiting 17:04:19 (5228): No heartbeat from core client for 30 sec - exiting 17:04:20 (5228): No heartbeat from core client for 30 sec - exiting 17:04:21 (5228): No heartbeat from core client for 30 sec - exiting 17:04:22 (5228): No heartbeat from core client for 30 sec - exiting 17:04:23 (5228): No heartbeat from core client for 30 sec - exiting 17:04:24 (5228): No heartbeat from core client for 30 sec - exiting 17:04:25 (5228): No heartbeat from core client for 30 sec - exiting 17:04:04 (6096): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:04:05 (6096): No heartbeat from core client for 30 sec - exiting 17:04:06 (6096): No heartbeat from core client for 30 sec - exiting 17:04:08 (6096): No heartbeat from core client for 30 sec - exiting 17:04:09 (6096): No heartbeat from core client for 30 sec - exiting 17:04:10 (6096): No heartbeat from core client for 30 sec - exiting 17:04:11 (6096): No heartbeat from core client for 30 sec - exiting 17:04:12 (6096): No heartbeat from core client for 30 sec - exiting 17:04:13 (6096): No heartbeat from core client for 30 sec - exiting 17:04:14 (6096): No heartbeat from core client for 30 sec - exiting 17:04:15 (6096): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9980, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6932, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8428, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4932, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6824, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CController:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4924, iMonCtr=1 Model crash detected, will try to restart... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Feb 2013 21:59:43	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	1,010,880	1,348,124	1.3336
03 Feb 2013 09:48:02	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	984,960	1,313,835	1.3339
02 Feb 2013 22:19:56	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	959,040	1,279,789	1.3344
02 Feb 2013 10:36:01	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	933,120	1,245,512	1.3348
02 Feb 2013 00:03:35	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	907,200	1,212,140	1.3361
01 Feb 2013 11:57:27	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	881,280	1,176,988	1.3355
01 Feb 2013 00:35:02	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	855,360	1,141,941	1.3350
31 Jan 2013 12:35:10	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	829,440	1,105,922	1.3333
31 Jan 2013 01:59:30	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	803,520	1,070,355	1.3321
30 Jan 2013 13:25:15	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	777,600	1,033,734	1.3294
30 Jan 2013 04:12:34	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	751,680	1,002,314	1.3334
29 Jan 2013 22:06:46	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	725,760	969,683	1.3361
29 Jan 2013 06:59:15	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	699,840	934,497	1.3353
28 Jan 2013 21:57:24	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	673,920	898,419	1.3331
28 Jan 2013 06:29:09	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	648,000	863,891	1.3332
27 Jan 2013 06:05:33	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	622,080	829,248	1.3330
26 Jan 2013 18:40:13	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	596,160	795,205	1.3339
26 Jan 2013 07:59:47	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	570,240	760,547	1.3337
25 Jan 2013 21:22:24	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	544,320	725,814	1.3334
25 Jan 2013 10:55:41	1230346	15545787	hadcm3n_n593_1880_40_008284229_0	518,400	690,936	1.3328