Task 15773744

Name	hadcm3n_n2qs_1880_40_008285769_2
Workunit	8436904
Created	10 May 2013, 19:56:00 UTC
Sent	10 May 2013, 20:07:30 UTC
Report deadline	10 Aug 2013, 3:34:41 UTC
Received	9 Jun 2013, 22:46:22 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1408317
Run time	8 days 9 hours 41 min 34 sec
CPU time	5 days 17 hours 45 min 50 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	3.79 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:42:31 (3464): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:42:32 (3464): No heartbeat from core client for 30 sec - exiting 20:42:33 (3464): No heartbeat from core client for 30 sec - exiting 20:42:34 (3464): No heartbeat from core client for 30 sec - exiting 20:42:35 (3464): No heartbeat from core client for 30 sec - exiting 20:42:36 (3464): No heartbeat from core client for 30 sec - exiting 20:42:37 (3464): No heartbeat from core client for 30 sec - exiting 20:42:38 (3464): No heartbeat from core client for 30 sec - exiting 20:42:39 (3464): No heartbeat from core client for 30 sec - exiting 20:42:40 (3464): No heartbeat from core client for 30 sec - exiting 20:42:41 (3464): No heartbeat from core client for 30 sec - exiting Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4736, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4736, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 Jun 2013 18:46:55	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	518,400	489,110	0.9435
01 Jun 2013 12:35:50	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	492,480	466,654	0.9476
01 Jun 2013 04:40:52	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	466,560	443,778	0.9512
31 May 2013 21:59:04	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	440,640	419,723	0.9525
31 May 2013 15:42:03	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	414,720	395,653	0.9540
31 May 2013 08:56:21	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	388,800	371,686	0.9560
31 May 2013 01:53:35	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	362,880	348,119	0.9593
30 May 2013 11:30:32	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	336,960	323,778	0.9609
30 May 2013 04:37:37	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	311,040	299,881	0.9641
28 May 2013 16:52:08	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	285,120	275,753	0.9671
28 May 2013 09:38:59	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	259,200	251,599	0.9707
28 May 2013 02:51:34	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	233,280	227,450	0.9750
27 May 2013 20:37:55	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	207,360	203,829	0.9830
27 May 2013 11:29:52	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	181,440	179,710	0.9905
27 May 2013 04:12:18	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	155,520	155,861	1.0022
26 May 2013 21:59:50	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	129,600	132,188	1.0200
23 May 2013 07:17:33	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	103,680	104,871	1.0115
20 May 2013 00:33:01	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	77,760	77,108	0.9916
19 May 2013 17:05:30	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	51,840	51,475	0.9930
19 May 2013 10:02:35	1274307	15773744	hadcm3n_n2qs_1880_40_008285769_2	25,920	25,784	0.9948