Task 12922439

Name	hadcm3n_o301_1940_40_007265451_1
Workunit	7463691
Created	2 Jun 2011, 7:12:10 UTC
Sent	2 Jun 2011, 7:12:13 UTC
Report deadline	1 Sep 2011, 14:39:24 UTC
Received	15 Jul 2011, 14:23:35 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1129297
Run time	18 days 2 hours 25 min 51 sec
CPU time	17 days 3 hours 22 min 34 sec
Validate state	Invalid
Credit	9,953.28
Device peak FLOPS	2.25 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> El dispositivo no reconoce el comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 09:05:24 (4424): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... No Process Handle Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=1552, selfPID=1552, iMonCtr=1 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2120, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2120, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2120, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2120, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2120, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2120, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
25 Jul 2011 12:51:19	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	829,440	1,445,908	1.7432
25 Jul 2011 12:51:19	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	803,520	1,401,984	1.7448
25 Jul 2011 12:51:17	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	777,600	1,358,667	1.7473
27 Jun 2011 05:32:57	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	751,680	1,314,470	1.7487
22 Jun 2011 03:43:34	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	725,760	1,271,473	1.7519
21 Jun 2011 14:38:39	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	699,840	1,226,086	1.7520
21 Jun 2011 01:20:08	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	673,920	1,180,586	1.7518
20 Jun 2011 12:06:31	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	648,000	1,134,923	1.7514
19 Jun 2011 22:12:11	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	622,080	1,089,466	1.7513
19 Jun 2011 22:12:11	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	596,160	1,044,199	1.7515
19 Jun 2011 22:12:11	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	570,240	998,813	1.7516
19 Jun 2011 22:01:18	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	544,320	953,436	1.7516
19 Jun 2011 21:56:59	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	518,400	908,108	1.7518
17 Jun 2011 04:06:33	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	492,480	862,487	1.7513
16 Jun 2011 16:07:51	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	466,560	817,102	1.7513
16 Jun 2011 00:23:04	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	440,640	771,373	1.7506
15 Jun 2011 10:52:30	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	414,720	725,364	1.7490
14 Jun 2011 22:19:34	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	388,800	679,690	1.7482
14 Jun 2011 07:46:10	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	362,880	633,622	1.7461
13 Jun 2011 19:10:56	1129297	12922439	hadcm3n_o301_1940_40_007265451_1	336,960	588,190	1.7456