Task 14311844

Name	hadcm3n_yiqw_1980_40_007753120_4
Workunit	7908229
Created	24 Mar 2012, 6:34:02 UTC
Sent	24 Mar 2012, 6:34:09 UTC
Report deadline	23 Jun 2012, 14:01:20 UTC
Received	9 Apr 2012, 20:18:25 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1068638
Run time	10 days 16 hours 38 min 2 sec
CPU time	10 days 6 hours 17 min 39 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	2.76 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... 08:19:10 (2736): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:57:39 (7920): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:27:55 (4328): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:05:46 (6640): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish 08:09:21 (5688): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5956, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5956, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5956, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=540, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=540, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=540, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
08 Apr 2012 00:29:49	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	570,240	882,656	1.5479
06 Apr 2012 16:24:47	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	544,320	844,006	1.5506
06 Apr 2012 04:06:06	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	518,400	800,877	1.5449
05 Apr 2012 16:19:43	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	492,480	759,626	1.5425
05 Apr 2012 04:36:24	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	466,560	718,300	1.5396
04 Apr 2012 16:46:22	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	440,640	678,220	1.5392
04 Apr 2012 05:28:31	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	414,720	639,066	1.5410
03 Apr 2012 17:15:30	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	388,800	597,446	1.5366
03 Apr 2012 04:19:32	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	362,880	558,216	1.5383
02 Apr 2012 08:48:21	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	336,960	518,945	1.5401
01 Apr 2012 21:26:54	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	311,040	478,914	1.5397
01 Apr 2012 08:03:55	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	285,120	439,549	1.5416
31 Mar 2012 18:59:21	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	259,200	399,462	1.5411
31 Mar 2012 01:37:27	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	233,280	360,379	1.5448
30 Mar 2012 11:09:00	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	207,360	320,079	1.5436
29 Mar 2012 10:42:55	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	181,440	279,459	1.5402
28 Mar 2012 23:09:20	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	155,520	238,544	1.5338
28 Mar 2012 10:19:11	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	129,600	198,070	1.5283
27 Mar 2012 22:56:14	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	103,680	158,561	1.5293
27 Mar 2012 10:31:43	1068638	14311844	hadcm3n_yiqw_1980_40_007753120_4	77,760	117,237	1.5077