Task 13090700

Name	hadcm3n_y85b_1900_40_007343417_1
Workunit	7540847
Created	6 Jul 2011, 13:17:59 UTC
Sent	23 Jul 2011, 2:54:26 UTC
Report deadline	22 Oct 2011, 10:21:37 UTC
Received	1 Sep 2011, 9:54:08 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1059042
Run time	19 days 14 hours 2 min 43 sec
CPU time	19 days 7 hours 48 min 17 sec
Validate state	Invalid
Credit	9,953.28
Device peak FLOPS	2.73 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.60</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1116, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4064, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3912, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3628, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3284, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2780, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 14:22:11 (3272): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:13:28 (1300): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 Sep 2011 07:33:51	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	829,440	1,675,725	2.0203
29 Aug 2011 20:36:03	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	803,520	1,628,964	2.0273
29 Aug 2011 07:43:20	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	777,600	1,582,345	2.0349
28 Aug 2011 09:52:58	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	751,680	1,535,659	2.0430
27 Aug 2011 20:55:14	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	725,760	1,488,962	2.0516
27 Aug 2011 07:57:20	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	699,840	1,442,296	2.0609
26 Aug 2011 19:06:59	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	673,920	1,395,713	2.0710
26 Aug 2011 05:55:35	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	648,000	1,348,832	2.0815
25 Aug 2011 08:16:18	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	622,080	1,301,638	2.0924
23 Aug 2011 10:58:19	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	596,160	1,254,797	2.1048
22 Aug 2011 13:06:07	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	570,240	1,208,229	2.1188
22 Aug 2011 10:49:47	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	544,320	1,161,551	2.1339
20 Aug 2011 21:08:51	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	518,400	1,114,918	2.1507
20 Aug 2011 08:12:49	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	492,480	1,068,422	2.1695
19 Aug 2011 19:19:16	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	466,560	1,021,792	2.1901
19 Aug 2011 06:55:15	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	440,640	975,298	2.2134
17 Aug 2011 08:27:35	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	414,720	928,773	2.2395
16 Aug 2011 11:50:02	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	388,800	882,262	2.2692
15 Aug 2011 13:05:51	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	362,880	835,806	2.3033
14 Aug 2011 12:11:13	1059042	13090700	hadcm3n_y85b_1900_40_007343417_1	336,960	784,943	2.3295