Task 15280590

Name	hadcm3n_zfj0_1880_40_008200847_0
Workunit	8355971
Created	13 Sep 2012, 9:36:14 UTC
Sent	13 Sep 2012, 21:33:51 UTC
Report deadline	14 Dec 2012, 5:01:02 UTC
Received	31 Jan 2013, 23:37:15 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1109363
Run time	17 days 18 hours 29 min 7 sec
CPU time	15 days 19 hours 46 min 28 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	2.51 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:23:39 (9516): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:23:41 (9516): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:32:24 (852): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:32:25 (852): No heartbeat from core client for 30 sec - exiting 13:32:26 (852): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:49:47 (8564): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:49:49 (8564): No heartbeat from core client for 30 sec - exiting 12:49:50 (8564): No heartbeat from core client for 30 sec - exiting 22:40:18 (10476): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:40:20 (10476): No heartbeat from core client for 30 sec - exiting 22:40:21 (10476): No heartbeat from core client for 30 sec - exiting 22:40:22 (10476): No heartbeat from core client for 30 sec - exiting 22:40:23 (10476): No heartbeat from core client for 30 sec - exiting 22:40:24 (10476): No heartbeat from core client for 30 sec - exiting 22:40:25 (10476): No heartbeat from core client for 30 sec - exiting 22:41:48 (10952): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:43:15 (4420): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:43:16 (4420): No heartbeat from core client for 30 sec - exiting Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Dec 2012 16:23:18	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	777,600	1,361,910	1.7514
07 Dec 2012 02:35:58	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	751,680	1,316,866	1.7519
06 Dec 2012 13:34:55	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	725,760	1,271,467	1.7519
06 Dec 2012 00:06:42	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	699,840	1,225,869	1.7516
01 Nov 2012 02:10:25	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	673,920	1,175,649	1.7445
30 Oct 2012 06:59:47	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	648,000	1,130,732	1.7450
28 Oct 2012 04:33:29	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	622,080	1,082,930	1.7408
19 Oct 2012 14:27:19	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	596,160	1,036,356	1.7384
19 Oct 2012 00:50:21	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	570,240	990,877	1.7376
18 Oct 2012 11:07:22	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	544,320	945,410	1.7369
17 Oct 2012 17:02:15	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	518,400	900,004	1.7361
17 Oct 2012 17:02:15	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	492,480	857,773	1.7417
17 Oct 2012 17:02:15	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	466,560	813,101	1.7428
06 Oct 2012 12:18:24	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	440,640	767,956	1.7428
05 Oct 2012 21:59:32	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	414,720	719,742	1.7355
05 Oct 2012 08:57:33	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	388,800	674,900	1.7359
04 Oct 2012 20:13:04	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	362,880	630,619	1.7378
04 Oct 2012 07:12:42	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	336,960	585,879	1.7387
03 Oct 2012 17:58:40	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	311,040	540,337	1.7372
03 Oct 2012 04:45:46	1109363	15280590	hadcm3n_zfj0_1880_40_008200847_0	285,120	494,810	1.7354