Task 13012587

Name	hadcm3n_t0yr_1940_40_007310992_1
Workunit	7508422
Created	27 Jun 2011, 21:15:59 UTC
Sent	27 Jun 2011, 21:36:13 UTC
Report deadline	27 Sep 2011, 5:03:24 UTC
Received	11 Aug 2011, 1:51:36 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	958805
Run time	23 days 22 hours 45 min 3 sec
CPU time	23 days 22 hours 45 min 3 sec
Validate state	Invalid
Credit	10,575.36
Device peak FLOPS	1.85 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.4.7</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4740, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4388, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Ocean Restart file copy failed on t0yrko.dag36r0 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10004, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10004, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10004, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10004, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8748, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=680, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Aug 2011 03:56:29	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	881,280	2,034,082	2.3081
31 Jul 2011 22:21:00	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	855,360	1,974,425	2.3083
30 Jul 2011 17:49:19	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	829,440	1,912,604	2.3059
29 Jul 2011 18:35:22	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	803,520	1,850,475	2.3030
28 Jul 2011 23:16:27	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	777,600	1,789,073	2.3008
27 Jul 2011 23:22:34	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	751,680	1,728,251	2.2992
25 Jul 2011 19:36:01	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	725,760	1,669,335	2.3001
25 Jul 2011 19:36:00	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	699,840	1,609,487	2.2998
25 Jul 2011 19:04:55	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	673,920	1,550,502	2.3007
25 Jul 2011 18:19:02	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	648,000	1,491,238	2.3013
25 Jul 2011 17:50:00	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	622,080	1,433,452	2.3043
25 Jul 2011 17:16:03	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	596,160	1,371,329	2.3003
25 Jul 2011 16:16:14	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	570,240	1,311,719	2.3003
25 Jul 2011 15:47:29	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	544,320	1,252,298	2.3007
25 Jul 2011 14:59:26	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	518,400	1,193,328	2.3019
25 Jul 2011 12:48:54	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	492,480	1,134,611	2.3039
25 Jul 2011 12:48:54	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	466,560	1,076,073	2.3064
25 Jul 2011 12:48:54	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	440,640	1,017,433	2.3090
25 Jul 2011 12:48:54	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	414,720	957,898	2.3097
25 Jul 2011 12:48:54	958805	13012587	hadcm3n_t0yr_1940_40_007310992_1	388,800	898,075	2.3099