Task 16547515

Name	hadcm3n_odsf_1900_40_008472994_3
Workunit	8623833
Created	18 Apr 2014, 0:15:28 UTC
Sent	18 Apr 2014, 0:33:17 UTC
Report deadline	18 Jul 2014, 8:00:28 UTC
Received	15 Jun 2014, 4:37:11 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1222836
Run time	6 days 4 hours 26 min 14 sec
CPU time	6 days 1 hours 46 min 51 sec
Validate state	Invalid
Credit	4,976.64
Device peak FLOPS	3.02 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 22:37:23 (6292): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:44:22 (4712): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:50:46 (5320): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1824, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1824, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6628, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6628, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6628, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6472, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 Jun 2014 16:22:19	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	414,720	509,733	1.2291
01 Jun 2014 07:27:37	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	388,800	477,892	1.2291
31 May 2014 21:25:58	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	362,880	445,602	1.2280
31 May 2014 06:46:03	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	336,960	413,553	1.2273
26 May 2014 11:03:27	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	311,040	381,587	1.2268
26 May 2014 01:36:44	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	285,120	349,559	1.2260
25 May 2014 08:36:32	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	259,200	318,336	1.2281
24 May 2014 15:20:52	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	233,280	286,911	1.2299
24 May 2014 05:40:55	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	207,360	255,574	1.2325
23 May 2014 20:08:43	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	181,440	224,551	1.2376
23 May 2014 11:31:00	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	155,520	193,734	1.2457
16 May 2014 03:34:03	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	129,600	161,874	1.2490
15 May 2014 18:31:20	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	103,680	129,370	1.2478
15 May 2014 09:25:15	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	77,760	97,134	1.2492
14 May 2014 21:16:36	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	51,840	64,626	1.2466
14 May 2014 11:15:14	1222836	16547515	hadcm3n_odsf_1900_40_008472994_3	25,920	32,105	1.2386