Task 17567765

Name	hadcm3n_xajd_1940_40_009149951_3
Workunit	9280287
Created	11 Dec 2014, 1:37:22 UTC
Sent	11 Dec 2014, 2:13:19 UTC
Report deadline	12 Mar 2015, 9:40:30 UTC
Received	26 Dec 2014, 15:35:02 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1303639
Run time	5 days 14 hours 25 min 1 sec
CPU time	5 days 12 hours 42 min 58 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	4.91 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.3.7</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:41:49 (11308): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:41:50 (11308): No heartbeat from core client for 30 sec - exiting 20:41:51 (11308): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:12:53 (4216): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:12:54 (4216): No heartbeat from core client for 30 sec - exiting 09:12:55 (4216): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5244, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
26 Dec 2014 06:37:37	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	596,160	477,517	0.8010
19 Dec 2014 04:55:04	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	570,240	456,509	0.8006
18 Dec 2014 20:11:35	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	544,320	435,584	0.8002
18 Dec 2014 00:29:41	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	518,400	415,046	0.8006
17 Dec 2014 18:18:18	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	492,480	394,794	0.8016
17 Dec 2014 03:35:41	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	466,560	374,445	0.8026
16 Dec 2014 21:48:03	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	440,640	353,860	0.8031
16 Dec 2014 15:51:59	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	414,720	333,372	0.8038
16 Dec 2014 04:12:49	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	388,800	312,067	0.8026
15 Dec 2014 22:01:32	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	362,880	290,782	0.8013
15 Dec 2014 15:50:41	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	336,960	269,627	0.8002
15 Dec 2014 04:23:50	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	311,040	249,016	0.8006
14 Dec 2014 22:41:53	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	285,120	228,496	0.8014
14 Dec 2014 16:26:02	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	259,200	208,014	0.8025
14 Dec 2014 02:22:44	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	233,280	187,166	0.8023
13 Dec 2014 20:39:52	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	207,360	166,796	0.8044
13 Dec 2014 14:54:01	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	181,440	146,424	0.8070
13 Dec 2014 00:47:34	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	155,520	125,352	0.8060
12 Dec 2014 18:51:28	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	129,600	104,298	0.8048
12 Dec 2014 12:50:22	1303639	17567765	hadcm3n_xajd_1940_40_009149951_3	103,680	83,339	0.8038