Task 15455032

Name	hadcm3n_zb76_1880_40_008251747_0
Workunit	8406871
Created	22 Nov 2012, 19:11:53 UTC
Sent	22 Nov 2012, 19:12:21 UTC
Report deadline	22 Feb 2013, 2:39:32 UTC
Received	1 Dec 2012, 14:35:21 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1026415
Run time	6 days 14 hours 56 min 2 sec
CPU time	6 days 1 hours 3 min 49 sec
Validate state	Invalid
Credit	4,665.60
Device peak FLOPS	3.32 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6264, iMonCtr=1 Model crash detected, will try to restart... 19:52:43 (5992): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:24:08 (8148): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:24:09 (8148): No heartbeat from core client for 30 sec - exiting 16:26:12 (9392): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:27:37 (5052): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:15:08 (6536): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:15:09 (6536): No heartbeat from core client for 30 sec - exiting 17:15:10 (6536): No heartbeat from core client for 30 sec - exiting 17:16:43 (1684): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:18:30 (9564): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:35:40 (9752): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:37:40 (4772): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7596, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7000, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7000, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7000, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7000, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7000, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7000, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 Dec 2012 06:10:40	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	388,800	493,126	1.2683
30 Nov 2012 19:41:32	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	362,880	459,127	1.2652
30 Nov 2012 11:22:28	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	336,960	427,930	1.2700
30 Nov 2012 02:30:30	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	311,040	397,266	1.2772
29 Nov 2012 17:03:52	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	285,120	366,525	1.2855
29 Nov 2012 07:17:11	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	259,200	333,700	1.2874
28 Nov 2012 21:14:16	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	233,280	300,425	1.2878
28 Nov 2012 04:50:53	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	207,360	265,495	1.2804
27 Nov 2012 18:44:00	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	181,440	230,296	1.2693
27 Nov 2012 06:53:17	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	155,520	195,451	1.2568
26 Nov 2012 20:40:07	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	129,600	162,186	1.2514
26 Nov 2012 11:05:41	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	103,680	130,041	1.2543
26 Nov 2012 01:33:35	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	77,760	98,815	1.2708
25 Nov 2012 15:46:52	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	51,840	66,592	1.2846
24 Nov 2012 15:29:56	1026415	15455032	hadcm3n_zb76_1880_40_008251747_0	25,920	34,298	1.3232