Task 13013080

Name	hadcm3n_t0ws_1940_40_007310969_2
Workunit	7508399
Created	27 Jun 2011, 22:11:04 UTC
Sent	27 Jun 2011, 22:11:10 UTC
Report deadline	27 Sep 2011, 5:38:21 UTC
Received	5 Aug 2011, 1:35:32 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1114075
Run time	31 days 0 hours 3 min 48 sec
CPU time	23 days 6 hours 42 min 36 sec
Validate state	Invalid
Credit	10,886.40
Device peak FLOPS	2.90 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4432, selfPID=4432, iMonCtr=1 Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1732, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1732, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1732, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1732, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1732, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1732, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Aug 2011 23:08:11	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	907,200	2,010,023	2.2156
02 Aug 2011 07:39:50	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	881,280	1,944,312	2.2062
01 Aug 2011 02:21:16	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	855,360	1,886,120	2.2051
30 Jul 2011 12:06:44	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	829,440	1,822,473	2.1972
29 Jul 2011 21:26:46	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	803,520	1,769,154	2.2018
28 Jul 2011 18:19:25	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	777,600	1,713,249	2.2033
27 Jul 2011 14:22:29	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	751,680	1,653,450	2.1997
26 Jul 2011 17:17:23	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	725,760	1,594,351	2.1968
25 Jul 2011 23:02:15	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	699,840	1,533,588	2.1913
25 Jul 2011 22:23:25	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	673,920	1,475,441	2.1893
25 Jul 2011 21:14:28	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	648,000	1,420,393	2.1920
25 Jul 2011 20:41:44	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	622,080	1,367,151	2.1977
25 Jul 2011 20:41:10	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	596,160	1,310,980	2.1990
25 Jul 2011 18:57:19	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	570,240	1,255,321	2.2014
25 Jul 2011 18:03:51	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	544,320	1,200,351	2.2052
25 Jul 2011 17:40:23	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	518,400	1,147,724	2.2140
25 Jul 2011 16:25:02	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	492,480	1,093,388	2.2202
25 Jul 2011 15:49:12	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	466,560	1,038,609	2.2261
25 Jul 2011 14:57:29	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	440,640	984,912	2.2352
25 Jul 2011 14:04:08	1114075	13013080	hadcm3n_t0ws_1940_40_007310969_2	414,720	929,742	2.2419