Task 16101707

Name	hadcm3n_n6m9_1920_40_008410435_2
Workunit	8561291
Created	1 Dec 2013, 21:57:58 UTC
Sent	1 Dec 2013, 21:58:10 UTC
Report deadline	3 Mar 2014, 5:25:21 UTC
Received	26 Dec 2013, 4:22:35 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1099480
Run time	9 days 17 hours 0 min 49 sec
CPU time	7 days 20 hours 11 min 54 sec
Validate state	Invalid
Credit	4,665.60
Device peak FLOPS	2.80 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1868, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 22:26:40 (2664): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4648, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6044, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6044, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6044, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6044, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6044, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6044, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
24 Dec 2013 05:07:47	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	388,800	661,341	1.7010
22 Dec 2013 08:54:30	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	362,880	634,616	1.7488
21 Dec 2013 17:05:18	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	336,960	587,688	1.7441
20 Dec 2013 09:56:07	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	311,040	540,200	1.7368
19 Dec 2013 00:57:57	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	285,120	513,887	1.8024
17 Dec 2013 20:37:49	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	259,200	467,376	1.8031
17 Dec 2013 06:25:39	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	233,280	421,358	1.8062
16 Dec 2013 15:46:04	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	207,360	374,479	1.8059
16 Dec 2013 00:41:09	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	181,440	327,745	1.8064
15 Dec 2013 10:16:48	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	155,520	281,847	1.8123
09 Dec 2013 13:50:23	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	129,600	235,353	1.8160
08 Dec 2013 22:19:59	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	103,680	188,412	1.8172
06 Dec 2013 07:52:22	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	77,760	141,181	1.8156
04 Dec 2013 09:00:15	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	51,840	94,304	1.8191
03 Dec 2013 03:17:31	1099480	16101707	hadcm3n_n6m9_1920_40_008410435_2	25,920	47,091	1.8168