Task 15936615

Name	hadcm3n_704s_1980_40_008411429_0
Workunit	8562285
Created	23 Aug 2013, 10:17:48 UTC
Sent	24 Aug 2013, 9:30:16 UTC
Report deadline	23 Nov 2013, 16:57:27 UTC
Received	18 Sep 2013, 18:03:23 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1289689
Run time	9 days 1 hours 34 min 31 sec
CPU time	8 days 13 hours 12 min 2 sec
Validate state	Invalid
Credit	4,043.52
Device peak FLOPS	2.90 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> Le périphérique ne reconnaît pas la commande. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CreateFile error 32 when trying set file time error: cannot delete old C:/ProgramData/BOINC/projects/climateprediction.net/globe.jpg error: cannot delete old C:/ProgramData/BOINC/projects/climateprediction.net/hadcm3n_um_6.07_windows_intelx86.exe Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 12:39:23 (2252): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7836, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7836, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7836, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7836, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7836, iMonCtr=1 Model crash detected, will try to restart... 15:00:35 (816): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7872, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8076, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6264, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5676, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 18:30:53 (8524): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:31:06 (8524): No heartbeat from core client for 30 sec - exiting 18:31:07 (8524): No heartbeat from core client for 30 sec - exiting 18:31:08 (8524): No heartbeat from core client for 30 sec - exiting 18:31:09 (8524): No heartbeat from core client for 30 sec - exiting 18:31:10 (8524): No heartbeat from core client for 30 sec - exiting 18:31:11 (8524): No heartbeat from core client for 30 sec - exiting 18:31:12 (8524): No heartbeat from core client for 30 sec - exiting 18:31:13 (8524): No heartbeat from core client for 30 sec - exiting 18:31:14 (8524): No heartbeat from core client for 30 sec - exiting 18:31:15 (8524): No heartbeat from core client for 30 sec - exiting 18:31:51 (8020): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:32:50 (8352): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:32:53 (8352): No heartbeat from core client for 30 sec - exiting 18:32:54 (8352): No heartbeat from core client for 30 sec - exiting 18:32:55 (8352): No heartbeat from core client for 30 sec - exiting 18:32:56 (8352): No heartbeat from core client for 30 sec - exiting 18:32:57 (8352): No heartbeat from core client for 30 sec - exiting 18:32:58 (8352): No heartbeat from core client for 30 sec - exiting 18:32:59 (8352): No heartbeat from core client for 30 sec - exiting 18:33:00 (8352): No heartbeat from core client for 30 sec - exiting 18:33:01 (8352): No heartbeat from core client for 30 sec - exiting 18:33:02 (8352): No heartbeat from core client for 30 sec - exiting 18:34:10 (8668): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:35:32 (6612): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:35:41 (6612): No heartbeat from core client for 30 sec - exiting 18:35:42 (6612): No heartbeat from core client for 30 sec - exiting 18:35:43 (6612): No heartbeat from core client for 30 sec - exiting 18:35:44 (6612): No heartbeat from core client for 30 sec - exiting 18:35:45 (6612): No heartbeat from core client for 30 sec - exiting 18:35:46 (6612): No heartbeat from core client for 30 sec - exiting 18:35:47 (6612): No heartbeat from core client for 30 sec - exiting 18:35:48 (6612): No heartbeat from core client for 30 sec - exiting 18:35:49 (6612): No heartbeat from core client for 30 sec - exiting 18:35:50 (6612): No heartbeat from core client for 30 sec - exiting 18:37:03 (7360): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:37:59 (8112): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... forrtl: Accès refusé. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5392, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7360, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 13:57:53 (1524): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4260, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7300, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4400, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Sep 2013 12:14:47	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	336,960	720,596	2.1385
18 Sep 2013 00:36:06	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	311,040	678,817	2.1824
14 Sep 2013 18:35:24	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	285,120	621,078	2.1783
12 Sep 2013 14:31:29	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	259,200	579,342	2.2351
09 Sep 2013 18:03:15	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	233,280	537,480	2.3040
05 Sep 2013 11:08:42	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	207,360	491,431	2.3699
01 Sep 2013 13:51:14	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	181,440	409,415	2.2565
30 Aug 2013 16:04:24	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	155,520	327,432	2.1054
28 Aug 2013 11:29:12	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	129,600	245,625	1.8953
27 Aug 2013 14:52:54	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	103,680	177,478	1.7118
26 Aug 2013 23:47:57	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	77,760	134,620	1.7312
25 Aug 2013 19:10:16	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	51,840	91,475	1.7646
25 Aug 2013 02:16:52	1289689	15936615	hadcm3n_704s_1980_40_008411429_0	25,920	47,735	1.8416