Task 14067831

Name	hadcm3n_o3zy_1980_40_007539446_3
Workunit	7736678
Created	6 Feb 2012, 4:58:54 UTC
Sent	6 Feb 2012, 4:59:39 UTC
Report deadline	7 May 2012, 12:26:50 UTC
Received	12 Mar 2012, 4:45:21 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1102044
Run time	24 days 9 hours 13 min 14 sec
CPU time	21 days 19 hours 42 min 32 sec
Validate state	Invalid
Credit	10,264.32
Device peak FLOPS	2.61 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 16:02:02 (3340): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1568, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 Mar 2012 06:08:07	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	855,360	1,848,793	2.1614
09 Mar 2012 13:32:38	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	829,440	1,793,928	2.1628
08 Mar 2012 20:11:27	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	803,520	1,738,119	2.1631
08 Mar 2012 04:00:00	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	777,600	1,683,233	2.1647
07 Mar 2012 10:04:59	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	751,680	1,627,465	2.1651
06 Mar 2012 10:44:45	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	725,760	1,570,517	2.1640
05 Mar 2012 16:39:54	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	699,840	1,516,606	2.1671
04 Mar 2012 23:07:11	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	673,920	1,464,419	2.1730
04 Mar 2012 07:27:08	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	648,000	1,410,845	2.1772
03 Mar 2012 15:21:58	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	622,080	1,356,987	2.1814
03 Mar 2012 00:09:34	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	596,160	1,303,676	2.1868
02 Mar 2012 08:21:10	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	570,240	1,249,648	2.1914
01 Mar 2012 16:30:55	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	544,320	1,195,657	2.1966
01 Mar 2012 01:32:39	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	518,400	1,143,250	2.2053
29 Feb 2012 10:01:56	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	492,480	1,089,372	2.2120
28 Feb 2012 18:35:28	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	466,560	1,034,466	2.2172
28 Feb 2012 02:50:05	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	440,640	980,393	2.2249
27 Feb 2012 10:28:32	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	414,720	923,518	2.2268
26 Feb 2012 18:42:32	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	388,800	867,119	2.2302
26 Feb 2012 02:46:06	1102044	14067831	hadcm3n_o3zy_1980_40_007539446_3	362,880	810,729	2.2342