Task 15860933

Name	hadcm3n_n6cu_1920_40_008378214_4
Workunit	8529073
Created	24 Jun 2013, 5:41:49 UTC
Sent	24 Jun 2013, 6:28:47 UTC
Report deadline	23 Sep 2013, 13:55:58 UTC
Received	2 Jul 2013, 18:59:06 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1336989
Run time	7 days 20 hours 15 min 54 sec
CPU time	7 days 6 hours 23 min 4 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	3.99 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.1.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:56:28 (5412): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5152, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5152, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5152, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5152, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5152, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5152, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Jul 2013 17:27:23	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	648,000	626,338	0.9666
02 Jul 2013 12:08:05	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	622,080	602,232	0.9681
02 Jul 2013 12:03:57	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	596,160	577,453	0.9686
02 Jul 2013 11:54:51	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	570,240	552,575	0.9690
02 Jul 2013 11:48:01	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	544,320	528,638	0.9712
02 Jul 2013 11:18:42	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	518,400	504,394	0.9730
02 Jul 2013 11:05:05	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	492,480	479,485	0.9736
02 Jul 2013 10:48:56	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	466,560	454,494	0.9741
02 Jul 2013 10:32:33	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	440,640	428,902	0.9734
02 Jul 2013 10:17:39	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	414,720	403,286	0.9724
02 Jul 2013 10:06:42	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	388,800	378,057	0.9724
02 Jul 2013 09:57:51	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	362,880	352,145	0.9704
02 Jul 2013 09:48:17	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	336,960	326,136	0.9679
28 Jun 2013 13:10:26	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	311,040	300,511	0.9661
28 Jun 2013 05:37:08	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	285,120	274,436	0.9625
27 Jun 2013 20:45:53	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	259,200	248,258	0.9578
27 Jun 2013 13:41:02	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	233,280	223,411	0.9577
27 Jun 2013 05:32:37	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	207,360	197,330	0.9516
26 Jun 2013 22:33:56	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	181,440	171,995	0.9479
26 Jun 2013 14:52:29	1226266	15860933	hadcm3n_n6cu_1920_40_008378214_4	155,520	146,573	0.9425