Task 15589067

Name	hadcm3n_4j49_1940_40_008303463_0
Workunit	8454598
Created	6 Feb 2013, 22:55:53 UTC
Sent	6 Feb 2013, 22:59:00 UTC
Report deadline	9 May 2013, 6:26:11 UTC
Received	29 Aug 2015, 19:03:58 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1252118
Run time	8 days 17 hours 54 min 29 sec
CPU time	8 days 8 hours 13 min 32 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.79 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.6.6</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8812, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 13:01:37 (4592): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 14:26:24 (4708): No heartbeat from core client for 30 sec - exiting 14:26:25 (4708): No heartbeat from core client for 30 sec - exiting 14:26:26 (4708): No heartbeat from core client for 30 sec - exiting 14:26:27 (4708): No heartbeat from core client for 30 sec - exiting 14:26:28 (4708): No heartbeat from core client for 30 sec - exiting 14:26:29 (4708): No heartbeat from core client for 30 sec - exiting 14:26:30 (4708): No heartbeat from core client for 30 sec - exiting 14:26:31 (4708): No heartbeat from core client for 30 sec - exiting 14:26:32 (4708): No heartbeat from core client for 30 sec - exiting 14:26:33 (4708): No heartbeat from core client for 30 sec - exiting 14:26:34 (4708): No heartbeat from core client for 30 sec - exiting 14:26:35 (4708): No heartbeat from core client for 30 sec - exiting 14:26:36 (4708): No heartbeat from core client for 30 sec - exiting 14:26:37 (4708): No heartbeat from core client for 30 sec - exiting 14:26:38 (4708): No heartbeat from core client for 30 sec - exiting 14:26:39 (4708): No heartbeat from core client for 30 sec - exiting 14:26:40 (4708): No heartbeat from core client for 30 sec - exiting 14:26:41 (4708): No heartbeat from core client for 30 sec - exiting 14:26:42 (4708): No heartbeat from core client for 30 sec - exiting 14:26:43 (4708): No heartbeat from core client for 30 sec - exiting 14:26:44 (4708): No heartbeat from core client for 30 sec - exiting 14:26:45 (4708): No heartbeat from core client for 30 sec - exiting 14:26:46 (4708): No heartbeat from core client for 30 sec - exiting 14:26:47 (4708): No heartbeat from core client for 30 sec - exiting 14:26:48 (4708): No heartbeat from core client for 30 sec - exiting 14:26:49 (4708): No heartbeat from core client for 30 sec - exiting 14:26:50 (4708): No heartbeat from core client for 30 sec - exiting 14:26:51 (4708): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:26:52 (4708): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5168, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5168, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3676, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3088, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3088, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3088, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 May 2013 23:02:41	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	518,400	703,127	1.3563
10 May 2013 12:02:43	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	492,480	668,069	1.3565
10 May 2013 02:39:28	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	466,560	632,220	1.3551
09 May 2013 15:51:03	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	440,640	596,781	1.3544
09 May 2013 06:50:37	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	414,720	562,603	1.3566
07 May 2013 12:07:29	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	388,800	527,693	1.3572
07 May 2013 01:54:48	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	362,880	492,136	1.3562
06 May 2013 16:06:12	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	336,960	457,763	1.3585
06 May 2013 05:17:33	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	311,040	421,627	1.3555
05 May 2013 18:46:42	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	285,120	385,661	1.3526
05 May 2013 08:44:56	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	259,200	350,279	1.3514
04 May 2013 16:16:02	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	233,280	316,363	1.3562
28 Apr 2013 20:43:07	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	207,360	280,641	1.3534
28 Apr 2013 10:46:45	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	181,440	245,291	1.3519
28 Apr 2013 00:58:40	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	155,520	210,106	1.3510
16 Mar 2013 03:36:29	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	129,600	175,196	1.3518
15 Mar 2013 17:01:01	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	103,680	140,203	1.3523
15 Mar 2013 06:17:48	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	77,760	105,280	1.3539
05 Mar 2013 09:11:00	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	51,840	71,048	1.3705
15 Feb 2013 09:42:18	1252118	15589067	hadcm3n_4j49_1940_40_008303463_0	25,920	36,401	1.4044