Task 15796367

Name	hadcm3n_z9yq_1960_40_008316912_1
Workunit	8468047
Created	26 May 2013, 5:51:03 UTC
Sent	26 May 2013, 5:51:09 UTC
Report deadline	25 Aug 2013, 13:18:20 UTC
Received	15 Jun 2013, 11:48:21 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1280801
Run time	5 days 17 hours 56 min 6 sec
CPU time	5 days 9 hours 56 min 24 sec
Validate state	Invalid
Credit	4,665.60
Device peak FLOPS	1.13 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> Enheten känner inte igen kommandot. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 06:19:49 (5996): No heartbeat from core client for 30 sec - exiting 06:19:52 (5996): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6240, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6240, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6240, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6240, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6240, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6240, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 Jun 2013 00:39:18	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	388,800	451,150	1.1604
09 Jun 2013 14:52:02	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	362,880	422,644	1.1647
09 Jun 2013 05:43:33	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	336,960	393,025	1.1664
08 Jun 2013 20:59:16	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	311,040	362,874	1.1666
08 Jun 2013 12:09:59	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	285,120	332,820	1.1673
08 Jun 2013 03:01:10	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	259,200	302,841	1.1684
07 Jun 2013 18:02:37	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	233,280	272,827	1.1695
07 Jun 2013 10:21:09	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	207,360	243,597	1.1748
03 Jun 2013 01:02:24	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	181,440	212,797	1.1728
02 Jun 2013 16:36:51	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	155,520	183,538	1.1802
02 Jun 2013 08:18:34	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	129,600	154,544	1.1925
01 Jun 2013 23:50:21	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	103,680	126,465	1.2198
01 Jun 2013 15:42:07	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	77,760	98,552	1.2674
27 May 2013 00:21:00	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	51,840	55,002	1.0610
26 May 2013 17:27:59	1280801	15796367	hadcm3n_z9yq_1960_40_008316912_1	25,920	30,092	1.1610