Task 16605166

Name	hadcm3n_8f9t_1980_40_008729212_1
Workunit	8875190
Created	30 Apr 2014, 15:28:45 UTC
Sent	30 Apr 2014, 17:23:09 UTC
Report deadline	31 Jul 2014, 0:50:20 UTC
Received	2 Aug 2014, 9:47:02 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1319436
Run time	7 days 5 hours 38 min 20 sec
CPU time	6 days 15 hours 58 min 41 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	3.63 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> Le périphérique ne reconnaît pas la commande. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6448, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:56:58 (6508): No heartbeat from core client for 30 sec - exiting 09:56:59 (6508): No heartbeat from core client for 30 sec - exiting 09:57:00 (6508): No heartbeat from core client for 30 sec - exiting 09:57:01 (6508): No heartbeat from core client for 30 sec - exiting 09:57:02 (6508): No heartbeat from core client for 30 sec - exiting 09:57:03 (6508): No heartbeat from core client for 30 sec - exiting 09:57:04 (6508): No heartbeat from core client for 30 sec - exiting 09:57:05 (6508): No heartbeat from core client for 30 sec - exiting 09:57:06 (6508): No heartbeat from core client for 30 sec - exiting 09:57:07 (6508): No heartbeat from core client for 30 sec - exiting 09:57:08 (6508): No heartbeat from core client for 30 sec - exiting 09:57:09 (6508): No heartbeat from core client for 30 sec - exiting 09:57:10 (6508): No heartbeat from core client for 30 sec - exiting 09:57:11 (6508): No heartbeat from core client for 30 sec - exiting 09:57:12 (6508): No heartbeat from core client for 30 sec - exiting 09:57:13 (6508): No heartbeat from core client for 30 sec - exiting 09:57:14 (6508): No heartbeat from core client for 30 sec - exiting 09:57:15 (6508): No heartbeat from core client for 30 sec - exiting 09:57:16 (6508): No heartbeat from core client for 30 sec - exiting 09:57:17 (6508): No heartbeat from core client for 30 sec - exiting 09:57:18 (6508): No heartbeat from core client for 30 sec - exiting 09:57:19 (6508): No heartbeat from core client for 30 sec - exiting 09:57:20 (6508): No heartbeat from core client for 30 sec - exiting 09:57:21 (6508): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6272, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6272, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
31 Jul 2014 11:48:01	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	492,480	570,697	1.1588
30 Jul 2014 07:24:58	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	466,560	541,861	1.1614
26 Jul 2014 05:19:44	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	440,640	512,690	1.1635
19 Jul 2014 14:57:06	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	414,720	483,661	1.1662
19 Jul 2014 07:35:47	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	388,800	454,715	1.1695
01 Jul 2014 11:31:56	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	362,880	425,627	1.1729
27 Jun 2014 19:56:21	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	336,960	396,369	1.1763
27 Jun 2014 11:33:46	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	311,040	367,393	1.1812
24 Jun 2014 19:09:14	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	285,120	338,467	1.1871
24 Jun 2014 08:42:25	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	259,200	307,755	1.1873
23 Jun 2014 12:30:34	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	233,280	280,223	1.2012
10 May 2014 04:42:29	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	207,360	248,949	1.2006
09 May 2014 07:15:59	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	181,440	218,787	1.2058
07 May 2014 11:34:21	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	155,520	187,586	1.2062
06 May 2014 14:26:24	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	129,600	155,803	1.2022
05 May 2014 16:41:39	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	103,680	123,759	1.1937
05 May 2014 05:48:12	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	77,760	92,017	1.1833
03 May 2014 12:53:24	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	51,840	61,066	1.1780
01 May 2014 14:14:38	1319436	16605166	hadcm3n_8f9t_1980_40_008729212_1	25,920	30,209	1.1655