Task 16044911

Name	hadcm3n_oeq2_1900_40_008474205_0
Workunit	8625044
Created	27 Sep 2013, 10:27:23 UTC
Sent	28 Sep 2013, 7:46:22 UTC
Report deadline	28 Dec 2013, 15:13:33 UTC
Received	21 Oct 2013, 16:21:44 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1280908
Run time	6 days 22 hours 51 min 33 sec
CPU time	6 days 21 hours 28 min 4 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	3.63 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> Das Gerät erkennt den Befehl nicht. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 13:38:59 (3680): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:23:38 (4372): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3472, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3472, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3472, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3444, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Oct 2013 19:03:22	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	777,600	592,417	0.7619
20 Oct 2013 08:24:16	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	751,680	572,756	0.7620
19 Oct 2013 07:09:56	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	725,760	552,913	0.7618
18 Oct 2013 17:04:00	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	699,840	532,997	0.7616
17 Oct 2013 17:33:30	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	673,920	512,996	0.7612
16 Oct 2013 16:29:51	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	648,000	493,272	0.7612
15 Oct 2013 16:17:04	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	622,080	473,473	0.7611
14 Oct 2013 15:59:50	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	596,160	453,582	0.7608
13 Oct 2013 15:19:12	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	570,240	433,828	0.7608
13 Oct 2013 09:29:31	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	544,320	414,001	0.7606
12 Oct 2013 19:03:22	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	518,400	394,306	0.7606
12 Oct 2013 13:35:11	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	492,480	374,520	0.7605
12 Oct 2013 08:04:29	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	466,560	354,859	0.7606
11 Oct 2013 17:21:10	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	440,640	335,047	0.7604
10 Oct 2013 16:46:00	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	414,720	315,350	0.7604
09 Oct 2013 16:20:08	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	388,800	295,624	0.7603
07 Oct 2013 18:44:39	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	362,880	275,944	0.7604
07 Oct 2013 13:14:01	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	336,960	256,139	0.7601
07 Oct 2013 07:39:28	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	311,040	236,486	0.7603
06 Oct 2013 16:12:23	1280908	16044911	hadcm3n_oeq2_1900_40_008474205_0	285,120	216,556	0.7595