Task 12746150

Name	hadcm3n_o5ib_1900_40_007202470_0
Workunit	7400750
Created	28 Mar 2011, 14:13:54 UTC
Sent	29 Mar 2011, 19:57:15 UTC
Report deadline	29 Jun 2011, 3:24:26 UTC
Received	20 Apr 2011, 19:30:36 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1140830
Run time	16 days 12 hours 33 min 57 sec
CPU time	16 days 10 hours 46 min 52 sec
Validate state	Invalid
Credit	10,886.40
Device peak FLOPS	2.60 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2740, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2740, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2740, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2740, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2740, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2740, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Apr 2011 19:35:33	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	907,200	1,414,802	1.5595
20 Apr 2011 19:35:33	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	881,280	1,374,378	1.5595
20 Apr 2011 19:35:33	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	855,360	1,333,898	1.5595
20 Apr 2011 19:35:33	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	829,440	1,293,456	1.5594
20 Apr 2011 19:35:33	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	803,520	1,252,982	1.5594
13 Apr 2011 11:52:24	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	777,600	1,212,575	1.5594
12 Apr 2011 20:56:53	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	751,680	1,172,183	1.5594
12 Apr 2011 09:08:31	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	725,760	1,131,744	1.5594
12 Apr 2011 09:07:29	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	699,840	1,091,367	1.5595
12 Apr 2011 09:06:37	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	673,920	1,050,972	1.5595
12 Apr 2011 09:06:05	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	648,000	1,010,610	1.5596
12 Apr 2011 09:05:37	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	622,080	970,262	1.5597
12 Apr 2011 09:05:11	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	596,160	929,795	1.5596
12 Apr 2011 09:04:45	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	570,240	889,352	1.5596
12 Apr 2011 09:04:25	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	544,320	848,939	1.5596
12 Apr 2011 09:04:02	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	518,400	808,513	1.5596
12 Apr 2011 09:03:42	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	492,480	768,128	1.5597
12 Apr 2011 09:03:13	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	466,560	727,731	1.5598
12 Apr 2011 09:02:09	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	440,640	687,347	1.5599
12 Apr 2011 09:02:03	1140830	12746150	hadcm3n_o5ib_1900_40_007202470_0	414,720	646,876	1.5598