Task 15814978

Name	hadcm3n_o1wo_1940_40_008383285_0
Workunit	8534144
Created	1 Jun 2013, 7:45:17 UTC
Sent	1 Jun 2013, 18:41:55 UTC
Report deadline	1 Sep 2013, 2:09:06 UTC
Received	24 Aug 2013, 11:43:44 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1280801
Run time	8 days 10 hours 45 min 6 sec
CPU time	7 days 18 hours 42 min 19 sec
Validate state	Invalid
Credit	6,531.84
Device peak FLOPS	1.13 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> Enheten känner inte igen kommandot. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 06:19:50 (6108): No heartbeat from core client for 30 sec - exiting 06:19:52 (6108): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 13:50:06 (5932): No heartbeat from core client for 30 sec - exiting 13:50:08 (5932): No heartbeat from core client for 30 sec - exiting 13:50:09 (5932): No heartbeat from core client for 30 sec - exiting 13:50:10 (5932): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:07:25 (6948): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:07:27 (6948): No heartbeat from core client for 30 sec - exiting 00:07:28 (6948): No heartbeat from core client for 30 sec - exiting 00:07:29 (6948): No heartbeat from core client for 30 sec - exiting 17:50:22 (5408): No heartbeat from core client for 30 sec - exiting 17:50:25 (5408): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5368, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5368, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5368, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5368, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5368, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5368, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/ocean_restart.day after 11 attempts Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2032, iMonCtr=1 Model crash detected, will try to restart... cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/ocean_restart.day after 11 attempts Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2032, iMonCtr=1 Model crash detected, will try to restart... cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/ocean_restart.day after 11 attempts Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2032, iMonCtr=1 Model crash detected, will try to restart... cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/ocean_restart.day after 11 attempts Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2032, iMonCtr=1 Model crash detected, will try to restart... cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/ocean_restart.day after 11 attempts Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2032, iMonCtr=1 Model crash detected, will try to restart... cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o1wo_1940_40_008383285/dataout/ocean_restart.day after 11 attempts Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2032, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
24 Aug 2013 11:43:51	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	544,320	646,662	1.1880
24 Aug 2013 11:43:51	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	518,400	619,231	1.1945
24 Aug 2013 11:43:51	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	492,480	591,587	1.2012
24 Aug 2013 11:43:51	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	466,560	563,946	1.2087
24 Aug 2013 11:43:51	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	440,640	536,193	1.2169
23 Jul 2013 21:00:11	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	414,720	493,414	1.1898
23 Jul 2013 20:26:33	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	388,800	456,121	1.1732
23 Jul 2013 20:26:33	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	362,880	427,356	1.1777
23 Jul 2013 20:26:33	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	336,960	398,566	1.1828
11 Jun 2013 04:21:24	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	311,040	352,034	1.1318
09 Jun 2013 18:08:47	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	285,120	323,401	1.1343
09 Jun 2013 09:09:48	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	259,200	294,338	1.1356
09 Jun 2013 00:16:20	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	233,280	264,387	1.1333
08 Jun 2013 15:31:32	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	207,360	234,470	1.1307
08 Jun 2013 06:32:43	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	181,440	204,634	1.1278
07 Jun 2013 21:37:30	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	155,520	174,786	1.1239
07 Jun 2013 13:22:25	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	129,600	145,407	1.1220
03 Jun 2013 04:04:47	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	103,680	114,368	1.1031
02 Jun 2013 19:36:33	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	77,760	85,139	1.0949
02 Jun 2013 11:19:38	1280801	15814978	hadcm3n_o1wo_1940_40_008383285_0	51,840	55,921	1.0787