Task 11879972

Name	famous_ufb1_799_200_006719514_1
Workunit	6922767
Created	10 Sep 2010, 9:15:52 UTC
Sent	10 Sep 2010, 9:50:28 UTC
Report deadline	10 Dec 2010, 17:17:39 UTC
Received	11 Oct 2010, 15:56:15 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	683480
Run time	3 days 20 hours 52 min 20 sec
CPU time	3 days 19 hours 8 min 28 sec
Validate state	Invalid
Credit	1,791.22
Device peak FLOPS	1.73 GFLOPS
Application version	UK Met Office FAMOUS v6.11 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... 15:15:56 (2424): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... 15:15:57 (2424): No heartbeat from core client for 30 sec - exiting 15:15:58 (2424): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 22:43:25 (2096): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... 22:43:27 (2096): No heartbeat from core client for 30 sec - exiting 22:43:28 (2096): No heartbeat from core client for 30 sec - exiting 22:43:29 (2096): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 07:18:42 (3844): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... 07:18:43 (3844): No heartbeat from core client for 30 sec - exiting 07:18:44 (3844): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2592, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2592, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2592, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2592, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2592, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2592, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( 08:51:53 (2592): called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
11 Oct 2010 13:33:28	683480	11879972	famous_ufb1_799_200_006719514_1	542,906	325,112	0.5988
10 Oct 2010 16:19:30	683480	11879972	famous_ufb1_799_200_006719514_1	533,546	319,619	0.5990
10 Oct 2010 14:24:46	683480	11879972	famous_ufb1_799_200_006719514_1	524,186	314,121	0.5993
10 Oct 2010 12:53:04	683480	11879972	famous_ufb1_799_200_006719514_1	514,826	308,501	0.5992
10 Oct 2010 11:16:26	683480	11879972	famous_ufb1_799_200_006719514_1	505,466	302,901	0.5993
10 Oct 2010 09:43:33	683480	11879972	famous_ufb1_799_200_006719514_1	496,106	297,310	0.5993
10 Oct 2010 08:12:26	683480	11879972	famous_ufb1_799_200_006719514_1	486,746	291,734	0.5994
10 Oct 2010 06:40:25	683480	11879972	famous_ufb1_799_200_006719514_1	477,386	286,142	0.5994
10 Oct 2010 05:02:35	683480	11879972	famous_ufb1_799_200_006719514_1	468,026	280,518	0.5994
10 Oct 2010 03:32:03	683480	11879972	famous_ufb1_799_200_006719514_1	458,666	274,918	0.5994
10 Oct 2010 03:24:31	683480	11879972	famous_ufb1_799_200_006719514_1	449,306	269,311	0.5994
10 Oct 2010 03:24:31	683480	11879972	famous_ufb1_799_200_006719514_1	439,946	263,692	0.5994
09 Oct 2010 22:50:44	683480	11879972	famous_ufb1_799_200_006719514_1	430,586	258,093	0.5994
09 Oct 2010 21:58:41	683480	11879972	famous_ufb1_799_200_006719514_1	421,226	252,458	0.5993
09 Oct 2010 21:58:41	683480	11879972	famous_ufb1_799_200_006719514_1	411,866	246,868	0.5994
09 Oct 2010 21:58:41	683480	11879972	famous_ufb1_799_200_006719514_1	402,506	241,300	0.5995
09 Oct 2010 21:58:41	683480	11879972	famous_ufb1_799_200_006719514_1	393,146	235,722	0.5996
09 Oct 2010 21:58:41	683480	11879972	famous_ufb1_799_200_006719514_1	383,786	230,228	0.5999
09 Oct 2010 21:58:41	683480	11879972	famous_ufb1_799_200_006719514_1	374,426	224,645	0.6000
09 Oct 2010 21:58:41	683480	11879972	famous_ufb1_799_200_006719514_1	365,066	219,066	0.6001