Task 17483274

Name	hadcm3n_sb0k_1940_40_009109912_4
Workunit	9240248
Created	25 Nov 2014, 13:17:21 UTC
Sent	25 Nov 2014, 13:17:38 UTC
Report deadline	24 Feb 2015, 20:44:49 UTC
Received	9 Dec 2014, 6:01:37 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1273657
Run time	12 days 0 hours 58 min 26 sec
CPU time	11 days 18 hours 6 min 9 sec
Validate state	Invalid
Credit	5,598.72
Device peak FLOPS	3.27 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.4.27</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 06:02:20 (6232): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 03:45:27 (5288): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 23:48:53 (5000): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8980, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8980, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8980, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8980, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4996, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4996, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
08 Dec 2014 05:25:45	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	466,560	1,002,148	2.1480
07 Dec 2014 01:38:28	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	440,640	950,793	2.1578
06 Dec 2014 04:34:52	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	414,720	893,565	2.1546
05 Dec 2014 12:04:04	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	388,800	836,237	2.1508
04 Dec 2014 19:37:13	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	362,880	779,257	2.1474
04 Dec 2014 02:54:21	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	336,960	721,435	2.1410
03 Dec 2014 10:20:52	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	311,040	663,705	2.1338
02 Dec 2014 18:22:48	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	285,120	607,220	2.1297
02 Dec 2014 02:00:35	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	259,200	551,289	2.1269
01 Dec 2014 10:13:51	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	233,280	495,365	2.1235
30 Nov 2014 18:32:31	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	207,360	440,029	2.1221
30 Nov 2014 02:48:38	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	181,440	384,924	2.1215
29 Nov 2014 12:10:03	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	155,520	329,571	2.1192
28 Nov 2014 19:27:35	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	129,600	273,949	2.1138
28 Nov 2014 04:08:55	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	103,680	218,317	2.1057
27 Nov 2014 13:18:35	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	77,760	164,344	2.1135
26 Nov 2014 21:47:05	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	51,840	111,692	2.1546
26 Nov 2014 06:33:58	1273657	17483274	hadcm3n_sb0k_1940_40_009109912_4	25,920	56,884	2.1946