Task 15516751

Name	hadcm3n_zd9i_1920_40_008280604_0
Workunit	8431739
Created	29 Dec 2012, 14:58:42 UTC
Sent	29 Dec 2012, 15:06:16 UTC
Report deadline	30 Mar 2013, 22:33:27 UTC
Received	23 Jan 2013, 13:51:01 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1075535
Run time	5 days 16 hours 17 min 16 sec
CPU time	5 days 13 hours 27 min 38 sec
Validate state	Invalid
Credit	4,354.56
Device peak FLOPS	3.11 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:26:34 (5088): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 16:08:18 (2896): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:40:14 (6000): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 10:41:02 (4212): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:08:51 (1120): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:20:25 (3352): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4192, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4192, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4192, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4192, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4192, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4192, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
22 Jan 2013 13:20:19	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	362,880	455,744	1.2559
20 Jan 2013 08:04:31	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	336,960	422,830	1.2548
18 Jan 2013 17:27:21	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	311,040	390,757	1.2563
16 Jan 2013 13:20:21	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	285,120	357,905	1.2553
15 Jan 2013 18:13:23	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	259,200	326,047	1.2579
15 Jan 2013 07:13:09	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	233,280	293,942	1.2600
14 Jan 2013 12:55:16	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	207,360	262,149	1.2642
13 Jan 2013 21:49:33	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	181,440	230,292	1.2692
12 Jan 2013 04:28:35	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	155,520	197,676	1.2711
07 Jan 2013 13:56:12	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	129,600	164,346	1.2681
04 Jan 2013 22:10:09	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	103,680	131,084	1.2643
02 Jan 2013 19:55:02	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	77,760	98,108	1.2617
02 Jan 2013 01:58:38	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	51,840	65,589	1.2652
01 Jan 2013 07:46:09	1075535	15516751	hadcm3n_zd9i_1920_40_008280604_0	25,920	33,330	1.2859