Task 15502417

Name	hadcm3n_o3yz_2140_40_008269565_0
Workunit	8424689
Created	23 Dec 2012, 23:25:12 UTC
Sent	23 Dec 2012, 23:42:16 UTC
Report deadline	25 Mar 2013, 7:09:27 UTC
Received	3 Jan 2013, 4:56:19 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1257965
Run time	5 days 3 hours 56 min 10 sec
CPU time	5 days 2 hours 35 min 57 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	3.65 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.31</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3736, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3576, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3576, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3576, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3576, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3576, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3576, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Jan 2013 04:25:02	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	440,640	439,860	0.9982
02 Jan 2013 13:46:08	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	414,720	413,576	0.9972
02 Jan 2013 06:14:33	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	388,800	386,799	0.9949
29 Dec 2012 07:20:05	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	362,880	360,058	0.9922
28 Dec 2012 21:06:44	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	336,960	333,838	0.9907
28 Dec 2012 13:05:20	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	311,040	307,381	0.9882
28 Dec 2012 06:38:58	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	285,120	280,797	0.9848
27 Dec 2012 22:16:52	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	259,200	254,965	0.9837
27 Dec 2012 14:15:40	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	233,280	228,166	0.9781
26 Dec 2012 13:04:50	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	207,360	201,466	0.9716
26 Dec 2012 00:52:16	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	181,440	175,929	0.9696
25 Dec 2012 17:51:45	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	155,520	150,790	0.9696
25 Dec 2012 10:52:59	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	129,600	125,735	0.9702
25 Dec 2012 03:51:26	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	103,680	100,637	0.9707
24 Dec 2012 20:48:44	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	77,760	75,413	0.9698
24 Dec 2012 14:30:48	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	51,840	50,240	0.9691
24 Dec 2012 06:47:24	1257965	15502417	hadcm3n_o3yz_2140_40_008269565_0	25,920	25,144	0.9701