Task 15839886

Name	hadcm3n_4e44_2020_40_008341155_4
Workunit	8492016
Created	12 Jun 2013, 5:46:49 UTC
Sent	12 Jun 2013, 5:54:53 UTC
Report deadline	11 Sep 2013, 13:22:04 UTC
Received	24 Jul 2013, 20:46:26 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1217837
Run time	18 days 2 hours 17 min 30 sec
CPU time	15 days 22 hours 8 min 6 sec
Validate state	Invalid
Credit	6,531.84
Device peak FLOPS	1.63 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:38:15 (4368): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 11:38:16 (4368): No heartbeat from core client for 30 sec - exiting 11:38:17 (4368): No heartbeat from core client for 30 sec - exiting 11:38:18 (4368): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1328, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4560, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4560, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4560, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4560, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4560, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4560, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
23 Jul 2013 22:08:38	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	544,320	1,327,404	2.4386
23 Jul 2013 20:51:26	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	518,400	1,263,149	2.4366
23 Jul 2013 20:19:29	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	492,480	1,197,998	2.4326
23 Jul 2013 14:39:52	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	466,560	1,138,500	2.4402
23 Jul 2013 14:39:52	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	440,640	1,072,638	2.4343
23 Jul 2013 14:39:52	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	414,720	1,010,638	2.4369
23 Jul 2013 14:39:52	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	388,800	946,851	2.4353
23 Jul 2013 14:39:52	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	362,880	885,652	2.4406
12 Jul 2013 00:06:40	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	336,960	825,530	2.4499
10 Jul 2013 21:06:35	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	311,040	764,181	2.4569
07 Jul 2013 23:09:57	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	285,120	702,556	2.4641
06 Jul 2013 06:35:33	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	259,200	641,205	2.4738
06 Jul 2013 06:35:33	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	233,280	579,587	2.4845
02 Jul 2013 10:22:22	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	207,360	518,502	2.5005
26 Jun 2013 17:55:53	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	181,440	453,937	2.5019
24 Jun 2013 13:32:04	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	155,520	389,223	2.5027
23 Jun 2013 02:39:09	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	129,600	326,282	2.5176
20 Jun 2013 21:47:01	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	103,680	262,415	2.5310
18 Jun 2013 17:26:42	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	77,760	196,645	2.5289
16 Jun 2013 13:47:57	1217837	15839886	hadcm3n_4e44_2020_40_008341155_4	51,840	129,512	2.4983