Task 15277950

Name	hadcm3n_zigv_1880_40_008199892_0
Workunit	8355016
Created	13 Sep 2012, 3:33:17 UTC
Sent	14 Sep 2012, 10:58:02 UTC
Report deadline	14 Dec 2012, 18:25:13 UTC
Received	23 Oct 2012, 9:01:58 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1191516
Run time	13 days 8 hours 1 min 59 sec
CPU time	12 days 3 hours 28 min 1 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	3.14 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 06:01:04 (4612): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3752, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:11:36 (4032): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Called boinc_finish Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3304, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3304, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
16 Oct 2012 01:48:20	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	596,160	767,784	1.2879
15 Oct 2012 15:46:39	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	570,240	733,276	1.2859
15 Oct 2012 04:50:04	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	544,320	698,822	1.2838
14 Oct 2012 18:40:26	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	518,400	664,653	1.2821
14 Oct 2012 09:06:24	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	492,480	630,267	1.2798
13 Oct 2012 14:48:18	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	466,560	596,411	1.2783
13 Oct 2012 05:16:54	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	440,640	562,812	1.2773
12 Oct 2012 18:53:10	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	414,720	529,752	1.2774
12 Oct 2012 08:30:22	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	388,800	496,223	1.2763
11 Oct 2012 22:28:15	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	362,880	463,093	1.2762
11 Oct 2012 12:01:20	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	336,960	429,158	1.2736
11 Oct 2012 01:29:14	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	311,040	395,760	1.2724
28 Sep 2012 12:52:10	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	285,120	362,522	1.2715
28 Sep 2012 04:35:24	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	259,200	329,723	1.2721
27 Sep 2012 18:33:27	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	233,280	296,246	1.2699
27 Sep 2012 08:19:02	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	207,360	262,452	1.2657
26 Sep 2012 18:34:59	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	181,440	228,583	1.2598
19 Sep 2012 10:13:28	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	155,520	195,164	1.2549
18 Sep 2012 23:55:28	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	129,600	163,178	1.2591
18 Sep 2012 01:13:49	1191516	15277950	hadcm3n_zigv_1880_40_008199892_0	103,680	130,683	1.2604