Task 16292124

Name	hadcm3n_o9in_1900_40_008467458_2
Workunit	8618297
Created	19 Feb 2014, 13:06:36 UTC
Sent	19 Feb 2014, 13:06:45 UTC
Report deadline	21 May 2014, 20:33:56 UTC
Received	11 Apr 2014, 0:37:41 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1310652
Run time	25 days 1 hours 49 min 9 sec
CPU time	23 days 20 hours 12 min 50 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	1.39 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... C01:41:00 (13544): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4764, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
11 Apr 2014 00:41:42	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	440,640	2,003,640	4.5471
04 Apr 2014 04:19:05	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	414,720	1,864,476	4.4957
04 Apr 2014 04:19:05	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	388,800	1,733,220	4.4579
04 Apr 2014 04:19:05	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	362,880	1,614,041	4.4479
22 Mar 2014 09:25:09	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	336,960	1,483,441	4.4024
21 Mar 2014 01:39:12	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	311,040	1,370,094	4.4049
19 Mar 2014 10:46:53	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	285,120	1,237,223	4.3393
16 Mar 2014 03:41:17	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	259,200	1,106,012	4.2670
14 Mar 2014 13:19:49	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	233,280	972,571	4.1691
06 Mar 2014 03:51:02	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	207,360	839,818	4.0500
04 Mar 2014 14:16:33	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	181,440	710,122	3.9138
03 Mar 2014 05:12:05	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	155,520	594,821	3.8247
28 Feb 2014 04:20:38	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	129,600	495,574	3.8239
26 Feb 2014 01:03:08	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	103,680	394,447	3.8045
24 Feb 2014 12:14:22	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	77,760	298,168	3.8345
23 Feb 2014 07:00:38	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	51,840	199,758	3.8534
21 Feb 2014 08:52:18	1310652	16292124	hadcm3n_o9in_1900_40_008467458_2	25,920	100,501	3.8774