Task 13372976

Name	hadcm3n_y9gh_1940_40_007453087_1
Workunit	7650590
Created	10 Sep 2011, 14:57:29 UTC
Sent	10 Sep 2011, 18:22:28 UTC
Report deadline	11 Dec 2011, 1:49:39 UTC
Received	28 Sep 2011, 2:07:38 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1160232
Run time	11 days 11 hours 45 min 37 sec
CPU time	10 days 14 hours 33 min 1 sec
Validate state	Invalid
Credit	4,976.64
Device peak FLOPS	2.50 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 i686-apple-darwin
Stderr	<core_client_version>6.12.35</core_client_version> <![CDATA[ <message> process exited with code 22 (0x16, -234) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:52:15 (39877): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 05:30:42 (73523): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137190) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3609, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137190) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3609, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137190) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3609, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137190) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3609, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137190) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3609, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137190) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3609, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
27 Sep 2011 13:10:58	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	414,720	874,897	2.1096
26 Sep 2011 20:33:25	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	388,800	818,934	2.1063
26 Sep 2011 03:51:41	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	362,880	764,358	2.1064
25 Sep 2011 10:31:49	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	336,960	710,097	2.1074
24 Sep 2011 17:08:35	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	311,040	655,016	2.1059
23 Sep 2011 22:54:58	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	285,120	599,883	2.1040
23 Sep 2011 06:25:09	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	259,200	544,437	2.1005
22 Sep 2011 11:35:08	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	233,280	488,858	2.0956
21 Sep 2011 12:59:29	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	207,360	434,451	2.0952
20 Sep 2011 20:17:24	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	181,440	380,340	2.0962
20 Sep 2011 02:48:27	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	155,520	325,094	2.0904
19 Sep 2011 10:19:26	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	129,600	271,063	2.0915
18 Sep 2011 17:32:16	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	103,680	215,296	2.0765
14 Sep 2011 05:53:00	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	77,760	161,471	2.0765
13 Sep 2011 13:34:28	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	51,840	107,722	2.0780
11 Sep 2011 11:51:24	1160232	13372976	hadcm3n_y9gh_1940_40_007453087_1	25,920	53,751	2.0737