Task 14651615

Name	hadcm3n_t16n_1940_40_007958422_1
Workunit	8113534
Created	9 May 2012, 20:01:58 UTC
Sent	10 May 2012, 20:36:39 UTC
Report deadline	10 Aug 2012, 4:03:50 UTC
Received	12 Jun 2012, 22:03:39 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1042525
Run time	10 days 16 hours 23 min 10 sec
CPU time	9 days 21 hours 29 min 46 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	2.68 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.25</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 23:50:57 (1932): Can't acquire lockfile (32) - waiting 35s 23:51:11 (4736): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 20:53:24 (444): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 01:40:25 (928): Can't acquire lockfile (32) - waiting 35s CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:09:40 (5096): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4344, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4344, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4344, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3788, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3788, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3788, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
09 Jun 2012 15:45:15	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	570,240	831,312	1.4578
08 Jun 2012 03:12:30	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	544,320	794,105	1.4589
07 Jun 2012 01:51:38	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	518,400	756,435	1.4592
05 Jun 2012 04:00:16	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	492,480	716,547	1.4550
03 Jun 2012 14:09:37	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	466,560	677,653	1.4524
02 Jun 2012 03:36:26	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	440,640	640,855	1.4544
31 May 2012 21:52:02	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	414,720	603,632	1.4555
28 May 2012 23:38:01	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	388,800	564,234	1.4512
27 May 2012 16:26:29	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	362,880	527,259	1.4530
23 May 2012 22:04:33	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	336,960	489,005	1.4512
22 May 2012 03:26:42	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	311,040	451,247	1.4508
20 May 2012 15:20:20	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	285,120	412,846	1.4480
19 May 2012 20:29:44	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	259,200	374,194	1.4436
19 May 2012 02:06:40	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	233,280	336,172	1.4411
17 May 2012 23:19:42	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	207,360	299,322	1.4435
16 May 2012 21:08:01	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	181,440	262,191	1.4451
15 May 2012 23:16:28	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	155,520	225,565	1.4504
14 May 2012 23:17:17	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	129,600	188,879	1.4574
13 May 2012 20:37:35	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	103,680	150,481	1.4514
13 May 2012 04:17:19	1042525	14651615	hadcm3n_t16n_1940_40_007958422_1	77,760	111,667	1.4360