Task 12927190

Name	hadcm3n_o7c9_1940_40_007266862_0
Workunit	7465102
Created	3 Jun 2011, 0:05:56 UTC
Sent	3 Jun 2011, 0:06:08 UTC
Report deadline	2 Sep 2011, 7:33:19 UTC
Received	18 Jul 2011, 18:43:23 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1016589
Run time	15 days 5 hours 12 min 28 sec
CPU time	14 days 12 hours 40 min 23 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	2.34 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.26</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4664, iMonCtr=1 Model crash detected, will try to restart... 18:44:23 (4640): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:29:11 (4340): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 15:27:04 (4372): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4064, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4408, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4408, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4408, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4408, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4408, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4408, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4484, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
25 Jul 2011 16:35:06	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	673,920	1,255,291	1.8627
25 Jul 2011 14:56:45	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	648,000	1,202,367	1.8555
25 Jul 2011 14:43:07	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	622,080	1,149,325	1.8476
25 Jul 2011 14:43:07	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	596,160	1,096,496	1.8393
25 Jul 2011 14:43:07	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	570,240	1,043,632	1.8302
10 Jul 2011 23:09:58	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	544,320	990,604	1.8199
09 Jul 2011 21:17:14	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	518,400	940,982	1.8152
09 Jul 2011 07:04:48	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	492,480	892,605	1.8125
08 Jul 2011 17:41:32	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	466,560	843,902	1.8088
08 Jul 2011 02:31:29	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	440,640	795,524	1.8054
05 Jul 2011 22:42:03	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	414,720	746,930	1.8010
05 Jul 2011 06:22:54	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	388,800	700,410	1.8015
02 Jul 2011 02:16:52	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	362,880	652,215	1.7973
01 Jul 2011 11:54:56	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	336,960	603,902	1.7922
28 Jun 2011 20:21:35	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	311,040	555,452	1.7858
25 Jun 2011 09:43:19	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	285,120	508,344	1.7829
24 Jun 2011 07:40:27	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	259,200	460,336	1.7760
23 Jun 2011 06:16:22	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	233,280	411,365	1.7634
22 Jun 2011 17:18:45	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	207,360	363,970	1.7553
22 Jun 2011 02:23:06	1016589	12927190	hadcm3n_o7c9_1940_40_007266862_0	181,440	316,012	1.7417