Task 12924122

Name	hadcm3n_o4nz_1940_40_007266038_1
Workunit	7464278
Created	2 Jun 2011, 10:36:45 UTC
Sent	2 Jun 2011, 10:36:48 UTC
Report deadline	1 Sep 2011, 18:03:59 UTC
Received	2 Jul 2011, 12:33:40 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1114338
Run time	9 days 1 hours 23 min 2 sec
CPU time	8 days 18 hours 18 min 16 sec
Validate state	Invalid
Credit	4,976.64
Device peak FLOPS	2.69 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 21:28:22 (3344): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:29:04 (3344): No heartbeat from core client for 30 sec - exiting 21:30:56 (3920): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:39:25 (3412): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:40:01 (3412): No heartbeat from core client for 30 sec - exiting Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3392, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2192, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2192, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3584, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
22 Jun 2011 01:42:54	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	414,720	738,455	1.7806
21 Jun 2011 12:20:35	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	388,800	692,542	1.7812
20 Jun 2011 22:43:28	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	362,880	646,305	1.7810
20 Jun 2011 09:00:20	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	336,960	600,114	1.7810
19 Jun 2011 23:15:31	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	311,040	554,227	1.7819
19 Jun 2011 23:15:31	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	285,120	508,341	1.7829
19 Jun 2011 23:15:31	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	259,200	462,347	1.7837
19 Jun 2011 22:02:37	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	233,280	416,602	1.7858
17 Jun 2011 15:13:03	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	207,360	371,127	1.7898
17 Jun 2011 02:16:02	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	181,440	325,526	1.7941
16 Jun 2011 14:02:09	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	155,520	279,940	1.8000
15 Jun 2011 16:05:46	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	129,600	234,489	1.8093
15 Jun 2011 03:27:40	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	103,680	187,702	1.8104
11 Jun 2011 17:35:03	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	77,760	140,575	1.8078
11 Jun 2011 02:27:12	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	51,840	93,413	1.8019
09 Jun 2011 21:07:05	1114338	12924122	hadcm3n_o4nz_1940_40_007266038_1	25,920	48,277	1.8625