Task 16221148

Name	hadcm3n_7d6g_1980_40_008428363_1
Workunit	8579219
Created	14 Jan 2014, 1:09:27 UTC
Sent	14 Jan 2014, 1:10:38 UTC
Report deadline	15 Apr 2014, 8:37:49 UTC
Received	7 Feb 2014, 1:06:32 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1261437
Run time	8 days 18 hours 56 min 22 sec
CPU time	8 days 18 hours 26 min 27 sec
Validate state	Invalid
Credit	9,020.16
Device peak FLOPS	3.64 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 08:05:08 (2224): No heartbeat from core client for 30 sec - exiting 08:05:09 (2224): No heartbeat from core client for 30 sec - exiting 08:05:10 (2224): No heartbeat from core client for 30 sec - exiting 08:05:11 (2224): No heartbeat from core client for 30 sec - exiting 08:05:12 (2224): No heartbeat from core client for 30 sec - exiting 08:05:13 (2224): No heartbeat from core client for 30 sec - exiting 08:05:14 (2224): No heartbeat from core client for 30 sec - exiting 08:05:15 (2224): No heartbeat from core client for 30 sec - exiting 08:05:17 (2224): No heartbeat from core client for 30 sec - exiting 08:05:18 (2224): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2276, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2276, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2276, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2276, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2276, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2276, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Feb 2014 01:08:58	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	751,680	750,255	0.9981
28 Jan 2014 05:00:33	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	725,760	724,207	0.9979
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	699,840	699,394	0.9994
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	673,920	673,282	0.9991
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	648,000	647,128	0.9987
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	622,080	621,016	0.9983
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	596,160	594,925	0.9979
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	570,240	568,818	0.9975
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	544,320	542,633	0.9969
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	518,400	516,474	0.9963
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	492,480	490,364	0.9957
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	466,560	464,174	0.9949
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	440,640	438,032	0.9941
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	414,720	411,878	0.9931
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	388,800	385,708	0.9920
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	362,880	359,547	0.9908
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	336,960	333,425	0.9895
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	311,040	307,524	0.9887
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	285,120	283,198	0.9933
27 Jan 2014 22:09:08	1261437	16221148	hadcm3n_7d6g_1980_40_008428363_1	259,200	257,499	0.9934