Task 14105208

Name	hadcm3n_y9ng_1940_40_007753745_0
Workunit	7908854
Created	17 Feb 2012, 12:01:02 UTC
Sent	17 Feb 2012, 12:01:17 UTC
Report deadline	18 May 2012, 19:28:28 UTC
Received	29 Feb 2012, 17:38:05 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1184384
Run time	8 days 23 hours 4 min 23 sec
CPU time	8 days 17 hours 51 min 58 sec
Validate state	Invalid
Credit	8,709.12
Device peak FLOPS	3.66 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> El dispositivo no reconoce el comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 19:01:33 (4488): No heartbeat from core client for 30 sec - exiting 19:01:34 (4488): No heartbeat from core client for 30 sec - exiting 19:01:35 (4488): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4820, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4820, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4820, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4820, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4820, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4820, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
29 Feb 2012 07:37:56	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	725,760	748,520	1.0314
29 Feb 2012 00:20:40	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	699,840	722,417	1.0323
28 Feb 2012 14:14:23	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	673,920	695,581	1.0321
28 Feb 2012 06:39:11	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	648,000	668,840	1.0322
27 Feb 2012 22:48:33	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	622,080	641,504	1.0312
27 Feb 2012 15:14:42	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	596,160	614,381	1.0306
27 Feb 2012 07:40:27	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	570,240	587,519	1.0303
27 Feb 2012 00:07:15	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	544,320	560,560	1.0298
26 Feb 2012 16:42:18	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	518,400	533,795	1.0297
26 Feb 2012 07:42:09	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	492,480	506,649	1.0288
25 Feb 2012 23:57:54	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	466,560	479,361	1.0274
25 Feb 2012 16:18:52	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	440,640	452,848	1.0277
25 Feb 2012 08:40:23	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	414,720	425,997	1.0272
25 Feb 2012 00:57:05	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	388,800	399,088	1.0265
24 Feb 2012 15:11:00	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	362,880	372,033	1.0252
24 Feb 2012 07:47:28	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	336,960	345,526	1.0254
24 Feb 2012 00:28:55	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	311,040	319,333	1.0267
23 Feb 2012 17:05:20	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	285,120	293,110	1.0280
23 Feb 2012 09:46:00	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	259,200	266,937	1.0298
23 Feb 2012 02:28:03	1184384	14105208	hadcm3n_y9ng_1940_40_007753745_0	233,280	240,716	1.0319