Task 15713679

Name	hadcm3n_3kj4_1980_40_008318176_1
Workunit	8469311
Created	7 Apr 2013, 0:30:19 UTC
Sent	7 Apr 2013, 8:46:19 UTC
Report deadline	7 Jul 2013, 16:13:30 UTC
Received	19 Apr 2013, 0:35:33 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1209981
Run time	9 days 19 hours 53 min 1 sec
CPU time	9 days 19 hours 38 min 25 sec
Validate state	Invalid
Credit	9,642.24
Device peak FLOPS	3.43 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4880, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4880, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4880, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4880, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4880, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4880, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 Apr 2013 23:21:22	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	803,520	845,776	1.0526
17 Apr 2013 15:45:46	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	777,600	818,505	1.0526
17 Apr 2013 08:06:36	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	751,680	791,093	1.0524
17 Apr 2013 00:28:53	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	725,760	763,752	1.0523
15 Apr 2013 22:42:43	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	699,840	736,176	1.0519
15 Apr 2013 14:12:08	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	673,920	708,849	1.0518
15 Apr 2013 06:39:40	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	648,000	681,582	1.0518
14 Apr 2013 23:02:15	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	622,080	654,340	1.0519
14 Apr 2013 15:30:40	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	596,160	627,043	1.0518
14 Apr 2013 07:56:17	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	570,240	599,778	1.0518
14 Apr 2013 00:18:31	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	544,320	572,506	1.0518
13 Apr 2013 16:41:28	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	518,400	545,216	1.0517
13 Apr 2013 09:08:32	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	492,480	517,918	1.0517
13 Apr 2013 01:31:05	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	466,560	490,653	1.0516
12 Apr 2013 18:00:14	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	440,640	463,373	1.0516
12 Apr 2013 10:19:50	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	414,720	436,091	1.0515
12 Apr 2013 02:47:15	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	388,800	408,816	1.0515
11 Apr 2013 19:12:10	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	362,880	381,558	1.0515
11 Apr 2013 11:34:56	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	336,960	354,266	1.0514
11 Apr 2013 03:57:32	1209981	15713679	hadcm3n_3kj4_1980_40_008318176_1	311,040	326,959	1.0512