Task 15850122

Name	hadcm3n_4dvn_2020_40_008390136_1
Workunit	8540995
Created	19 Jun 2013, 14:39:42 UTC
Sent	19 Jun 2013, 16:08:12 UTC
Report deadline	18 Sep 2013, 23:35:23 UTC
Received	10 Jul 2013, 5:41:31 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1255904
Run time	15 days 21 hours 0 min 39 sec
CPU time	14 days 13 hours 44 min 26 sec
Validate state	Invalid
Credit	9,953.28
Device peak FLOPS	2.52 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... 03:15:49 (4316): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 03:16:30 (4336): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Model crashed: TEMPHIST: Failed in OPEN of history file tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 02:56:53 (7860): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:59:14 (7352): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:18:08 (5068): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:45:32 (9200): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8692, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3024, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
06 Jul 2013 04:39:32	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	829,440	1,227,568	1.4800
04 Jul 2013 16:52:08	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	803,520	1,185,103	1.4749
04 Jul 2013 14:21:34	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	777,600	1,143,987	1.4712
03 Jul 2013 17:08:15	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	751,680	1,102,182	1.4663
03 Jul 2013 05:24:32	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	725,760	1,060,695	1.4615
02 Jul 2013 17:44:15	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	699,840	1,019,394	1.4566
02 Jul 2013 12:05:16	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	673,920	978,444	1.4519
02 Jul 2013 11:51:57	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	648,000	936,825	1.4457
02 Jul 2013 11:17:45	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	622,080	896,211	1.4407
02 Jul 2013 10:54:47	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	596,160	854,968	1.4341
02 Jul 2013 10:34:19	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	570,240	814,050	1.4276
02 Jul 2013 10:16:58	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	544,320	772,093	1.4185
02 Jul 2013 10:01:16	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	518,400	730,440	1.4090
02 Jul 2013 09:48:42	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	492,480	689,534	1.4001
28 Jun 2013 08:48:34	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	466,560	648,311	1.3896
27 Jun 2013 21:06:18	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	440,640	607,149	1.3779
27 Jun 2013 09:29:16	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	414,720	565,731	1.3641
26 Jun 2013 21:43:20	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	388,800	614,143	1.5796
26 Jun 2013 09:50:03	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	362,880	572,137	1.5767
25 Jun 2013 21:51:54	1255904	15850122	hadcm3n_4dvn_2020_40_008390136_1	336,960	530,139	1.5733