Task 13922963

Name	hadcm3n_o3zq_1980_40_007682134_1
Workunit	7837221
Created	15 Jan 2012, 21:33:40 UTC
Sent	15 Jan 2012, 21:33:46 UTC
Report deadline	16 Apr 2012, 5:00:57 UTC
Received	29 Jan 2012, 12:10:16 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1184384
Run time	8 days 4 hours 54 min 21 sec
CPU time	7 days 23 hours 16 min 25 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	3.66 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> El dispositivo no reconoce el comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 19:44:02 (3976): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:44:03 (3976): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:10:21 (2908): No heartbeat from core client for 30 sec - exiting 23:10:23 (2908): No heartbeat from core client for 30 sec - exiting 23:10:24 (2908): No heartbeat from core client for 30 sec - exiting 23:10:25 (2908): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 22:51:59 (3332): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 12:21:17 (3596): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:18:00 (2168): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3528, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3528, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3528, iMonCtr=1 Model crash detected, will try to restart... 11:33:05 (3528): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4740, iMonCtr=1 Model crash detected, will try to restart... 11:33:48 (4740): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1480, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1480, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
29 Jan 2012 06:25:54	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	673,920	683,461	1.0142
28 Jan 2012 23:02:01	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	648,000	657,070	1.0140
28 Jan 2012 16:27:03	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	622,080	630,666	1.0138
28 Jan 2012 07:41:48	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	596,160	603,641	1.0125
27 Jan 2012 21:36:49	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	570,240	576,381	1.0108
27 Jan 2012 13:50:21	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	544,320	549,805	1.0101
26 Jan 2012 23:08:05	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	518,400	522,404	1.0077
25 Jan 2012 18:34:59	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	492,480	502,923	1.0212
25 Jan 2012 09:26:39	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	466,560	476,233	1.0207
25 Jan 2012 00:58:19	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	440,640	449,269	1.0196
24 Jan 2012 17:17:43	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	414,720	422,636	1.0191
24 Jan 2012 09:59:42	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	388,800	396,539	1.0199
24 Jan 2012 02:47:40	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	362,880	370,423	1.0208
23 Jan 2012 19:28:47	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	336,960	344,317	1.0218
23 Jan 2012 12:16:03	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	311,040	318,244	1.0232
23 Jan 2012 05:39:31	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	285,120	291,638	1.0229
22 Jan 2012 17:33:06	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	259,200	265,898	1.0258
22 Jan 2012 10:16:26	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	233,280	239,768	1.0278
22 Jan 2012 02:59:59	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	207,360	213,713	1.0306
21 Jan 2012 19:47:44	1184384	13922963	hadcm3n_o3zq_1980_40_007682134_1	181,440	187,627	1.0341