Task 12986578

Name	hadcm3n_s0az_1940_40_007298264_1
Workunit	7495688
Created	20 Jun 2011, 11:36:04 UTC
Sent	20 Jun 2011, 11:36:08 UTC
Report deadline	19 Sep 2011, 19:03:19 UTC
Received	26 Jul 2011, 14:12:35 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	975949
Run time	4 days 10 hours 23 min 38 sec
CPU time	3 days 19 hours 28 min 27 sec
Validate state	Invalid
Credit	2,488.32
Device peak FLOPS	3.01 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 i686-apple-darwin
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> process exited with code 22 (0x16, -234) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 18:23:30 (10363): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:23:31 (10363): No heartbeat from core client for 30 sec - exiting 18:23:32 (10363): No heartbeat from core client for 30 sec - exiting 18:23:34 (10363): No heartbeat from core client for 30 sec - exiting 18:23:36 (10363): No heartbeat from core client for 30 sec - exiting 18:23:37 (10363): No heartbeat from core client for 30 sec - exiting 18:23:38 (10363): No heartbeat from core client for 30 sec - exiting 18:23:39 (10363): No heartbeat from core client for 30 sec - exiting 18:26:12 (10379): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:26:13 (10379): No heartbeat from core client for 30 sec - exiting 18:26:14 (10379): No heartbeat from core client for 30 sec - exiting 18:26:15 (10379): No heartbeat from core client for 30 sec - exiting 18:26:16 (10379): No heartbeat from core client for 30 sec - exiting 18:26:17 (10379): No heartbeat from core client for 30 sec - exiting 18:26:18 (10379): No heartbeat from core client for 30 sec - exiting 18:26:19 (10379): No heartbeat from core client for 30 sec - exiting 18:26:20 (10379): No heartbeat from core client for 30 sec - exiting 18:26:21 (10379): No heartbeat from core client for 30 sec - exiting 18:26:22 (10379): No heartbeat from core client for 30 sec - exiting 18:26:23 (10379): No heartbeat from core client for 30 sec - exiting 18:26:24 (10379): No heartbeat from core client for 30 sec - exiting 18:26:25 (10379): No heartbeat from core client for 30 sec - exiting 18:26:27 (10379): No heartbeat from core client for 30 sec - exiting 18:26:28 (10379): No heartbeat from core client for 30 sec - exiting 18:26:29 (10379): No heartbeat from core client for 30 sec - exiting 18:26:30 (10379): No heartbeat from core client for 30 sec - exiting 18:26:31 (10379): No heartbeat from core client for 30 sec - exiting 18:26:32 (10379): No heartbeat from core client for 30 sec - exiting 18:26:33 (10379): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:05:26 (412): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137700) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19305, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137700) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19305, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137700) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19305, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137700) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19305, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137700) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19305, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 137700) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19305, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
26 Jul 2011 04:49:33	975949	12986578	hadcm3n_s0az_1940_40_007298264_1	207,360	300,401	1.4487
25 Jul 2011 23:00:24	975949	12986578	hadcm3n_s0az_1940_40_007298264_1	181,440	262,803	1.4484
25 Jul 2011 22:47:00	975949	12986578	hadcm3n_s0az_1940_40_007298264_1	155,520	225,250	1.4484
25 Jul 2011 19:34:18	975949	12986578	hadcm3n_s0az_1940_40_007298264_1	129,600	187,594	1.4475
25 Jul 2011 19:34:18	975949	12986578	hadcm3n_s0az_1940_40_007298264_1	103,680	150,065	1.4474
25 Jul 2011 19:34:18	975949	12986578	hadcm3n_s0az_1940_40_007298264_1	77,760	112,611	1.4482
25 Jul 2011 14:54:25	975949	12986578	hadcm3n_s0az_1940_40_007298264_1	51,840	75,037	1.4475
25 Jul 2011 13:34:02	975949	12986578	hadcm3n_s0az_1940_40_007298264_1	25,920	37,716	1.4551