Task 16141652

Name	hadcm3n_7zd8_1980_40_008457119_2
Workunit	8607975
Created	11 Dec 2013, 1:09:42 UTC
Sent	11 Dec 2013, 1:10:20 UTC
Report deadline	12 Mar 2014, 8:37:31 UTC
Received	30 Dec 2013, 8:23:29 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1139859
Run time	14 days 4 hours 31 min 22 sec
CPU time	11 days 5 hours 44 min 38 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	2.68 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 17:26:19 (5364): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:14:12 (6048): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:24:38 (3628): No heartbeat from core client for 30 sec - exiting 21:24:39 (3628): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2144, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2144, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2144, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2144, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2144, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish 21:25:45 (2144): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4660, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
29 Dec 2013 15:13:39	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	648,000	939,133	1.4493
29 Dec 2013 03:16:21	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	622,080	902,510	1.4508
28 Dec 2013 13:36:43	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	596,160	864,496	1.4501
28 Dec 2013 01:03:38	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	570,240	827,189	1.4506
27 Dec 2013 12:52:09	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	544,320	790,084	1.4515
26 Dec 2013 23:14:34	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	518,400	752,615	1.4518
26 Dec 2013 09:59:05	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	492,480	715,182	1.4522
25 Dec 2013 22:11:12	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	466,560	677,703	1.4526
25 Dec 2013 07:00:18	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	440,640	638,991	1.4501
24 Dec 2013 16:30:12	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	414,720	601,476	1.4503
24 Dec 2013 04:12:35	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	388,800	564,257	1.4513
23 Dec 2013 13:12:15	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	362,880	523,735	1.4433
23 Dec 2013 00:39:01	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	336,960	484,586	1.4381
22 Dec 2013 12:40:27	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	311,040	446,960	1.4370
21 Dec 2013 23:02:06	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	285,120	409,758	1.4371
21 Dec 2013 10:01:39	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	259,200	373,131	1.4395
20 Dec 2013 17:37:01	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	233,280	334,327	1.4332
20 Dec 2013 04:34:36	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	207,360	297,506	1.4347
19 Dec 2013 15:05:32	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	181,440	259,385	1.4296
19 Dec 2013 00:37:51	1139859	16141652	hadcm3n_7zd8_1980_40_008457119_2	155,520	222,069	1.4279